Identificación de factores pronósticos en cáncer cérvico-uterino mediante análisis estadístico implicativo
RESUMEN
Fundamento:

el cáncer es una de las primeras causas de muerte a escala mundial. La identificación de los factores pronósticos involucrados en su evolución es de gran interés para la prevención secundaria y terciaria de esta enfermedad tan frecuente.

Objetivo:

identificar los factores pronósticos de mortalidad por cáncer cérvico-uterino y evaluar la utilidad del análisis estadístico implicativo en las investigaciones clínico-epidemiológicas de causalidad.

Métodos:

se realizó un estudio de casos y controles en 106 mujeres con el diagnóstico clínico e histológico de cáncer cérvico-uterino, atendidas en el Hospital Oncológico de la provincia Santiago de Cuba desde enero de 2016 a enero de 2018. Se aplicó el análisis estadístico implicativo junto con la regresión logística binaria, la cual se consideró como estándar de oro.

Resultados:

la regresión logística binaria identificó como único factor de mal pronóstico la presencia de metástasis (OR=2,995) y como factores de buen pronóstico la quimioterapia (OR=0,151) y el intervalo libre de evento (OR=0,602). El análisis estadístico implicativo detectó estos mismos factores, pero además identificó otros factores de mal pronóstico como las complicaciones, el estadio avanzado y la recaída; todos con un 99 % de intensidad aplicativa.

Conclusiones:

esta técnica alcanzó una elevada sensibilidad y especificidad al compararse con la regresión y resultó útil para la identificación de factores pronósticos.

ABSTRACT

Background

: cancer is one of the leading causes of death worldwide. The identification of the prognostic factors involved in its evolution is of great interest for the secondary and tertiary prevention of this frequent entity.

Objective

: to identify the prognostic factors of cervical cancer mortality and evaluate the usefulness of implicative statistical analysis in the clinical-epidemiological investigations of causality.

Methods

: study of cases and controls in 106 women with the clinical and histological diagnosis of cervical cancer treated at the Oncology Hospital of the province Santiago de Cuba from January 2016 to January 2018. The implicative statistical analysis was applied together with the binary logistic regression, which was considered as a gold standard.

Results

: binary logistic regression identified the presence of metastases as the only poor prognostic factor (OR=2.995) and chemotherapy (OR=0.151) and event-free interval (OR=0.602) as good prognostic factors. Implicative statistical analysis detected these same factors, but also identified other poor prognostic factors such as complications, advanced stage, and relapse; all with a 99% of implication intensity.

Conclusions

: this technique reached a high sensitivity and specificity when compared with the regression and was useful for the identification of prognostic factors.

DeCS:
    • NEOPLASIAS DEL CUELLO UTERINO;
    • PRONÓSTICO;
    • ANÁLISIS ESTADÍSTICO;
    • INFORMES DE CASOS;
    • CAUSALIDAD..
DeCS:
    • UTERINE CERVICAL NEOPLASMS;
    • PROGNOSIS;
    • STATISTICAL ANALYSIS;
    • CASE REPORTS;
    • CAUSALITY..

Introducción

El cáncer es una de las primeras causas de muerte a escala mundial. La Organización Mundial de la Salud (OMS) estima que para el año 2030 se producirán 12 millones de defunciones por esta causa. En particular el cáncer cérvico-uterino es el tercer cáncer más común entre las mujeres en todo el mundo, precedido solo por el cáncer de mama y el de pulmón. En mujeres entre 20 y 30 años se encuentra en segundo lugar después del cáncer de mama. 1

Según las estadísticas globales de cáncer de 2018, se reportan 569 847 casos nuevos y 311 365 fallecimientos a causa de este cáncer. La mayor incidencia se reporta en países del sur africano y la mayor mortalidad en países del este africano. (1

En América Latina y el Caribe cada año, se diagnostican cerca de 77 000 nuevos casos y unas 30 000 mujeres mueren prematuramente por esta enfermedad. Su incidencia es 21 % mayor en los países subdesarrollados, donde existen 80 % de todos los cánceres de cérvix. 1

En Cuba es una de las cinco primeras localizaciones de cáncer. En 2019 fallecieron 514 cubanas a causa de esta enfermedad y se diagnosticaron 882 nuevos casos para una tasa de incidencia de 9,1 por cada 100 000 mujeres, 2) a pesar de la existencia de un programa nacional de detección precoz del cáncer cérvico-uterino que tiene como objetivo general disminuir la mortalidad y realizar su diagnóstico en etapas tempranas, lo que permitiría terapéuticas más precoces y eficaces.

Los factores pronósticos son aquellos que predicen el curso clínico de un padecimiento una vez que la enfermedad está presente, su identificación es de gran interés para la prevención secundaria y terciaria. Para la estimación del pronóstico la variable final, como elemento de interés para estudio, puede ser: la muerte, la recurrencia del proceso, la invalidez, las complicaciones. 3

Tanto las investigaciones sobre factores de riesgo como las de factores pronósticos, iniciadas a mediados del siglo pasado, sentaron las bases del modelo multicausal, que se enmarca en el enfoque lineal que ha predominado en las ciencias naturales.

Desde entonces, para el estudio de las relaciones causa-efecto de la morbilidad y la mortalidad, las técnicas estadísticas multivariadas han sido la herramienta más confiable y eficiente, entre ellas la más empleada ha sido la regresión logística binaria; la cual permite cuantificar la probabilidad de un desenlace en aquellos sujetos que presentan el factor pronóstico o de riesgo con respecto a los que no lo presentan, cuando se trata de una variable de respuesta dicotómica (el efecto o el posible desenlace), y una serie de variables explicativas (los factores pronósticos o de riesgo). (4,5,6

El desconocimiento de los factores pronósticos de mortalidad por cáncer cérvico-uterino en la provincia Santiago de Cuba sirvió de motivación al estudio, donde se propone el empleo de dos técnicas para corroborar un mismo resultado; una técnica novedosa: el análisis estadístico implicativo y una técnica tradicional: la regresión logística binaria.

La técnica propuesta fue creada por el francés Gras R et al. (7 sobre la década de los 80. La misma permite un análisis no simétrico a partir de un conjunto de datos que interrelaciona una población de sujetos u objetos con un conjunto de variables, la extracción y estructuración del conocimiento en forma de normas y reglas generalizadas y en consecuencia una determinada previsión en distintas ramas del saber. Este análisis se propone a partir de la fundamentación teórica que hacen Sagaró Del Campo NM y Zamora Matamoros L, 8 para su empleo en las investigaciones de causalidad en salud.

Es objetivo de los autores del trabajo identificar los factores pronósticos en el cáncer cérvico-uterino y evaluar la utilidad del análisis estadístico implicativo.

Métodos

Se realizó un estudio observacional analítico para evaluar la utilidad de una nueva técnica de análisis estadístico, el análisis estadístico implicativo, en la identificación de los factores pronósticos de mortalidad en pacientes con el diagnóstico clínico e histológico de cáncer cérvico-uterino mayores de 25 años, atendidas en el Hospital Oncológico Conrado Benítez de la provincia Santiago de Cuba desde enero del año 2016 hasta enero del año 2018, con historia clínica completa.

El universo de casos quedó conformado por las 53 pacientes fallecidas y el universo de controles por las 118 pacientes vivas que cumplieron con las características antes mencionadas.

En la muestra se decidió incluir la totalidad de los casos, a razón de un control por cada caso para obtener mejores estimaciones y evitar inestabilidad de los datos al aplicar la regresión logística. Para la selección de los 53 controles se aplicó un muestreo simple aleatorio, utilizando el EPIDAT para la generación de la muestra.

Se seleccionaron como variable dependiente estado al egreso y como independientes: edad, comorbilidad, tipo histológico, estadio, complicaciones, recaída, intervalo libre de enfermedad, metástasis, quimioterapia, radioterapia y cirugía. Se tuvo en cuenta que el número de variables a incluir en el modelo no excediera el número de casos para evitar de esta forma la pérdida de precisión en la estimación de los coeficientes de regresión.

Se realizó una amplia revisión bibliográfica en diferentes bases de datos biomédicas. Se recogieron los datos de interés plasmados en las historias clínicas de las pacientes en un formulario creado por los autores, con lo cual se conformó una base de datos.

Se comenzó el análisis exploratorio de datos con el objetivo de detectar posibles anormalidades en su recogida. Para describir los factores pronósticos de mortalidad presentes en la población de estudio, se emplearon como medidas de resumen el número y el porcentaje. Para determinar los factores que actúan como causantes y agravantes del cáncer, se aplicaron dos metodologías de análisis estadístico.

Primero, se aplicó la regresión logística binaria, para lo cual se verificó el cumplimiento de los supuestos de la prueba. Se eliminaron del modelo las variables correlacionadas biológica o estadística y se conformaron nuevas variables indicativas o dummy para las variables politómicas: comorbilidad y tipo histológico. Se empleó el método por pasos hacia atrás (condicional), ya que demostró un mejor ajuste al modelo según los resultados de la prueba de Hosmer y Lemeshow. 9

Luego, se empleó el análisis estadístico implicativo donde se realizó un análisis clasificatorio con el propósito de agrupar aquellos factores pronósticos que reunieran características similares. La estrategia de agrupación estuvo basada en medir la distancia entre los pares de factores, formando clúster con aquellos menos distantes.

Se obtuvieron los árboles de similaridad y de cohesión y el grafo implicativo. Para el análisis se tuvo en cuenta dos variantes: se incluyó la variable dependiente estado al egreso como variable principal, para ver la influencia de los factores sobre el desenlace fatal del paciente y luego se consideró esta como variable suplementaria para ver como difieren las relaciones causales entre los factores en las pacientes vivas y en las fallecidas.

Por último, se compararon ambas técnicas al abordar las mismas como medios diagnósticos para la identificación de factores pronósticos, se empleó como estándar de oro la regresión logística binaria y se consideró cada variable como factor pronóstico o no según los resultados de ambas técnicas, se calculó la sensibilidad, la especificidad y las razones de verosimilitud del análisis estadístico implicativo, así como el índice Kappa para medir la concordancia, según la escala de Landis y Koch. 10

Para la aplicación de la regresión logística binaria se empleó el SPSS y para la realización del análisis clasificatorio y la implementación de las técnicas del análisis estadístico implicativo el software específico CHIC (del francés: Classification Hiérarchique Implicative et Cohésitive que significa: clasificación jerárquica, implicativa y cohesitiva) y para el cálculo de los indicadores de eficacia, se programaron las fórmulas en una hoja de cálculo de Microsoft Excel.

En la investigación se consideraron los principios bioéticos básicos. Para la realización de la misma se contó con la autorización y aprobación del consejo científico del centro y el Comité de Ética de la Investigación en Salud, en cumplimiento de los reglamentos establecidos y se respetó lo establecido en la Declaración de Helsinki. Los datos fueron procesados y manipulados solo por el investigador principal del estudio, para mantener la confidencialidad de los mismos. Además, por tratarse de una investigación retrospectiva en la que toda la información fue extraída de las historias clínicas no fue necesario el uso de consentimiento informado.

Resultados

En la práctica clínica es preciso tener un conocimiento del pronóstico para tomar decisiones en cuanto a diagnóstico y tratamiento, además para informar al paciente de su futuro. En la tabla se aprecia la distribución de frecuencias absolutas y relativas de los factores pronósticos considerados en los casos y los controles. Como se pudo observar, en más del 79 % de los casos estuvieron presente los factores complicaciones, estadio, presencia de metástasis, radioterapia y recaída (Tabla 1).

Casos y controles según presencia de factores

*Entre paréntesis aparece el nombre del factor en la base de datos

Los resultados de la regresión logística se muestran en la tabla 2, donde se aprecia que se identificó como factor de mal pronóstico la presencia de metástasis y como factores de buen pronóstico la quimioterapia y el intervalo libre de evento. Con un nivel de confianza del 95 % se puede plantear que las pacientes con metástasis tienen entre 1,052 y 8,525 veces más probabilidad de fallecer, que las que no la presentaron. Además, se puede plantear que las pacientes que se tratan con quimioterapia tienen entre 0,028 y 0,818 veces menos probabilidades de morir que las que no se tratan. Por otra parte, las pacientes con un mayor intervalo libre de evento tienen entre 0,496 y 0,731 más probabilidad de vivir, que las de menor intervalo con un 95 % de confianza, ya que este resultó un factor de buen pronóstico (Tabla 2).

Variables incluidas en el paso 7 de la regresión logística binaria por el método de eliminación hacia atrás condicional y sus indicadores (salida del SPSS)

IC: intervalo de confianza

Como resultado del análisis estadístico implicativo se presenta el árbol de similaridad, en el cual se observa la formación de dos clases que agrupan a todos los factores. En una clase se agrupan los factores que contribuyeron a que las pacientes permanezcan vivas y en la otra clase los factores que contribuyeron a que fallecieran, evidenciándose comportamientos diferentes entre las dos clases. Además, se observa la formación de cuatro nodos significativos en los niveles uno, tres, cinco y nueve.

En la clase donde se agrupan los factores que contribuyen con un mejor pronóstico se encuentran el intervalo libre de evento, los tratamientos con cirugía, quimioterapia y radioterapia. Con un mayor índice de similaridad se encuentran el hecho de estar viva y tener un mayor intervalo libre de evento (99 %), y a su vez tener tratamiento con quimioterapia con una similaridad del 97 %. En la clase fallecida se agrupan la mayor cantidad de variables similares (edad mayor o igual de 50 años, comorbilidad, estadio avanzado, presencia de metástasis, recaída y tipo histológico más agresivo) con tres nodos significativos en los niveles uno, tres y cinco (Figura 1).

Árbol de similaridad considerando la variable dependiente (Fallecidos/Vivos) como principal.

En la Figura 2A se muestra la formación de dos grafos de implicación de factores pronósticos en vivos y fallecidos. En el primero se puede decir con más de un 98 % y menos de un 99 % de intensidad de implicación o de confianza, que las pacientes con tipo histológico más agresivo tienen comorbilidades y estas, con más de un 99 % de intensidad de implicación tienen edad mayor o igual de 50 años, además esto implica tener un estadio avanzado, tener metástasis y recaída con más de 99 % de intensidad implicativa. A su vez, tener cualquiera de estos factores implica, con el mismo nivel de intensidad, tener complicaciones y a su vez finalmente haber recibido radioterapia. Por otra parte, el hecho de que las pacientes hayan fallecido implica con una intensidad de 99 % o más que las pacientes con cáncer tenían un estadio avanzado, metástasis y que tuvieron una recaída.

Implicando esto con un 99 % o más que tuvieron complicaciones y a su vez recibieron radioterapia. Se puede afirmar que todo el que falleció es porque tenía un estadio avanzado, metástasis y recaída. En el segundo grafo se puede plantear con una intensidad de implicación del 99 % o más que tener un mayor intervalo libre de enfermedad o haber recibido cirugía implica que las pacientes están vivas.

En la Figura 2B se corrobora el hecho de que las pacientes fallecidas, de forma indirecta tuvieron complicaciones y de forma directa se encontraron en un estadio avanzado, tenían presencia de metástasis y recayeron, todos con una intensidad de implicación de 99 % o más. El tener un mayor intervalo libre de evento o haber recibido quimioterapia de forma directa y con una implicación del 99 % influyeron con una mejor evolución de las pacientes, es decir, el estar vivas (Figura 2 A y B).

Grafos implicativos de las relaciones causales entre los factores pronósticos con 95 % y más de intensidad implicativa (A: normal y B: en modo cono).

En el árbol cohesitivo de la Figura 3 se observan nodos significativos en los niveles uno, cinco, ocho y diez. El gráfico muestra una jerarquía orientada, la cual estructura los factores pronósticos en varias clases a partir de la cual se definen reglas y metarreglas (Figura 3).

Relaciones causales entre factores pronósticos (árbol cohesitivo).

Las siguientes reglas se dan en un nivel máximo de implicación, nivel 1 (índice de cohesión igual a 1):

- Regla 1: (GEdad ( Comorbilidad).

Esta primera regla plantea que pacientes con cáncer cérvico-uterino con edad mayor de 50 años implica que tengan comorbilidad. Al mismo tiempo tener comorbilidad implica que las pacientes tengan edad mayor de 50 años.

- Regla 2: (Estado ( Complica).

Lo cual significa que tener un estadio avanzado de la enfermedad implica tener complicaciones.

- Regla 3: (Metástasis ( (Regla 2)).

La cual significa que tener metástasis es una condición suficiente para que se cumpla la regla 2.

- Regla 4: (Recaída ( (Metástasis ( (Regla 2))).

El hecho de que las pacientes hayan recaído implica que posean metástasis y a su vez encontrarse en un estadio avanzado y tener complicaciones.

- Regla 5: (Regla 1 ( Regla 3).

Lo cual significa que la regla 1 implica que se cumpla la regla 3 o que la regla 3 es una consecuencia de que se cumpla la regla 1.

- Regla 6: (ILEN ( Vivas).

Tener un mayor intervalo libre de evento implica que las pacientes permanezcan vivas.

Reglas que se formaron con alta intensidad de cohesión (más del 90 % pero menos del 100 %).

- Regla 7: (Regla 4 ( Radio).

Lo cual significa que la regla 4 es una condición suficiente para que las pacientes recibieran radioterapia, con una cohesión del 99,8 %.

- Regla 8: (Fallecidas ( Regla 6).

El hecho de que las pacientes hayan fallecido implica que se cumpla la regla 6 con una cohesión del 98,7 %.

Como resultado de considerar la variable dependiente como suplementaria se observó que las fallecidas fueron las que hicieron las mayores contribuciones a la formación de las relaciones entre las variables, ya que presentan el riesgo más bajo en casi todas las relaciones:

- Edad y Comorbilidad: 0,0735

- Estado y Complicaciones: 9,99x10-05

- Metástasis, Estado y Complicaciones: 9,99 x 10-5

- Recaída, Metástasis, Estado y Complicaciones: 9,99 x 10-5

Análisis comparativo entre ambas técnicas:

Ambas técnicas coinciden al identificar la presencia de metástasis, intervalo libre de evento y tratamiento con quimioterapia como factores de buen pronóstico, con un 99 % de confiabilidad en el caso del análisis estadístico implicativo y un 95 % con la regresión logística. Además, el análisis estadístico implicativo identificó tres factores no identificados por la regresión logística.

Al evaluar la técnica del análisis estadístico implicativo como identificador de factores pronósticos en el cáncer cérvico-uterino la prueba arrojó una capacidad para detectar las variables significativas asociadas al cáncer cérvico-uterino del 100 %, ya sea como factor de buen o de mal pronóstico. También demostró entre un 28,95 % y un 96 % de capacidad para identificar las variables que no constituyen factores pronósticos. Un factor pronóstico identificado por el análisis estadístico implicativo tiene una probabilidad del 50 % de serlo realmente, así mismo, una variable que no constituye un factor pronóstico según esta técnica, tiene una probabilidad del 100 % de no serlo en realidad.

Con esta técnica es 2,7 veces más probable detectar un factor pronóstico dentro de los verdaderos factores pronósticos que dentro de las variables que no lo son. Así mismo, es poco probable (0 %) que una variable que no sea factor pronóstico salga clasificada como tal y la concordancia entre ambas técnicas fue 0,48; que según la escala de Landis y Koch es moderada. La diferencia entre la tasa de verdaderos positivos y la de falsos positivos fue del 63 %. El análisis estadístico implicativo clasificó de manera correcta al 73 % de las variables.

Discusión

El estudio adoptado en un enfoque práctico, analiza mediante la técnica de la regresión logística binaria y el análisis estadístico implicativo qué factores pronósticos son de buen y mal pronóstico para el desenlace del evento después de estimar la influencia que ejercen.

En la interpretación de los gráficos para identificar los factores pronósticos se tomó como referente lo expresado en los artículos de Sagaró Del Campo NM y Zamora Matamoros L,11,12,13) quienes reconocen la necesidad de la construcción de dos grafos implicativos en modo cono, al seleccionar en cada cono las variables dependientes: fallecidas y vivas, para identificar los factores de mal y buen pronóstico respectivamente, como se muestra en la Figura 2B.

Ambas técnicas clasificaron la metástasis como factor de mal pronóstico, resultados similares obtuvo Li H et al. (14) en cuyo estudio la supervivencia a los cinco años de las pacientes con metástasis fue muy inferior a las de las que no la poseían. Este es un factor de mal pronóstico encontrado con frecuencia en muchos estudios. 15,16,17

La mayor probabilidad de sobrevida de pacientes que se tratan con quimioterapia coincide con el estudio de Li H et al. 14) e Hinojosa García LH et al. 18 en cuyos estudios aplican terapia combinada que incluye la quimioterapia.

El análisis comparativo entre ambas técnicas mostró altos índices de eficacia del análisis estadístico implicativo. Resultados similares fueron encontrados por García Mederos Y et al. 19 en la identificación de factores de riesgo del cáncer de pulmón, en las series de Moraga Rodríguez A et al. 20,21,22 que identifican factores pronósticos en el cáncer de pulmón, de mama y de próstata, en el de Paez Candelaria Y et al. 23 sobre pronóstico del estado nutricional al egreso de una unidad de cuidados intensivos, en el de Galano Vásquez K et al. 24 sobre factores pronósticos en cáncer renal, el de Pardo Santana S et al. 25 y el de Rodríguez-Pérez I. 26 Todos estos estudios aplicaron ambas técnicas de manera comparativa y bajo la misma metodología.

Conclusiones

Se lograron identificar los factores pronósticos de mortalidad en el grupo de estudio. El análisis estadístico implicativo demostró una vez más su buen desempeño en la identificación de factores pronósticos, por lo que se considera que su introducción entre las herramientas estadísticas de uso frecuente en estas investigaciones, contribuirá substancialmente a incrementar la calidad de las mismas.

El trabajo constituyó un estudio piloto que sirvió como base para determinar el tamaño de muestra, las variables a seleccionar y otras consideraciones de un proyecto que se desarrolla en la actualidad, para demostrar la validez de una metodología concebida para el empleo del análisis estadístico implicativo en la identificación de factores pronósticos en cáncer cérvico-uterino y otros tipos de cáncer.

Referencias bibliográficas
Historial:
  • » Recibido: 14/10/2020
  • » Aceptado: 29/04/2021
  • » Publicado : 01/08/2021

Enlaces refback

  • No hay ningún enlace refback.




Licencia de Creative Commons
Esta obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial 4.0 Internacional.