Predicción Prenatal de la Maduración Pulmonar Fetal, Análisis Estadístico

Tamaño de la muestra, una reflexión post hoc

En este estudio se analizaron las muestras obtenidas en forma consecutiva durante un periodo de diez años, cuyos resultados se registraron en forma prospectiva en la base de datos diseñada para la investigación. Sin embargo, de acuerdo con Dawson- Saunders y Trapp (11) “aunque es preferible considerar el asunto correspondiente al tamaño de la muestra antes de realizar el estudio, considerar el tema post hoc es mejor que no hacerlo en absoluto”.

Para los estudios de pruebas diagnósticas no hay un consenso en la literatura sobre el tamaño de muestra adecuado. Se ha postulado que no debe haber un número inferior a 30 sujetos sin la enfermedad y 30 sujetos que tengan claramente la condición de interés (12) (en nuestro estudio madurez pulmonar). También se ha informado como tamaño adecuado una cifra global de al menos 200 individuos estudiados. Una recomendación adicional se basa en el número mínimo de sujetos en las casillas de la Tabla tetracórica; de acuerdo con ésta aproximación, un tamaño de muestra debe ser suficiente cuando haya mínimo 10 pacientes en cada casilla marginal (12,13).

Entre otras recomendaciones para el cálculo del tamaño de la muestra en estudios de pruebas diagnósticas se encuentran:

1) Estimar el tamaño de la muestra con base en un intervalo de confianza deseado de la razón de verosimilitudes (LR) (14).

2) Calcular el tamaño desde el punto de vista del planteamiento de hipótesis; esta aproximación tendría dos categorías: a) evaluar la hipótesis de diferencia de las características operativas (sensibilidad, especificidad y valores predictivos) entre la prueba en estudio y el patrón de referencia y b) evaluar una hipótesis de concordancia entre las dos pruebas (12).

3) Estimación con base en una razón de verosimilitud positiva (LR +) deseada (15).

Todas estas estimaciones arrojan resultados diferentes. Otra propuesta es la de Duffau (15) quien propone la siguiente fórmula:

N=(N`/4)(1 + (1 + 2(r + 1) / N`r ׀p2 – p1׀
(^0.5)^2
N`= [(Zα{(r + 1)pq}^0.5 – Zβ(rp1q1 +
p2q2)^0.5]^2 / r(p2 – p1)^2
Tamaño total = N + Nr

Donde:

N = uno de los tamaños muestrales
Nr = el otro tamaño muestral

r = la fracción que representa la muestra mas pequeña respecto a la mayor. Como lo esperable es una prevalencia inferior al 50%, la muestra que corresponde a verdaderos enfermos según el estándar ideal será = Nr y la de verdaderos no afectados N

^ “elevado a”
p1 es la sensibilidad de la prueba (a / (a + c))
q1 = 1 – p1
p2 = proporción de falsos positivos (b / (b + d)) = 1 – especificidad
q2 = 1 – p2
Zα para 0.05 = 1.645 (hipótesis a una cola)
Zβ para 0.20 = -0.842 (hipótesis a una cola)
p = (p1 + rp2)/(r +1)
q = 1 – p

Para detectar un LR+ = ≥ 2.5, con un error alfa de 0.05, un poder del estudio del 90%, estimando una prevalencia de la enfermedad de 0.25 en la muestra y una proporción de falsos positivos del 22% se requiere (usando esta fórmula) un tamaño total de 111 casos (N = 83, Nr = 28) (15). El número de muestras analizado en el presente trabajo es muy superior a esta estimación, pero es preferible para tener un número apropiado de casos en las casillas de las tetracóricas, particularmente con diversos niveles del patrón de oro.

Análisis

Para este trabajo se hizo una base de datos en Excel y para el análisis estadístico se utilizó el programa STATA versión 8.0 (Texas, USA). Se empleó la prueba de Shapiro-Wilks para determinar la distribución de las variables continuas. Los datos con distribución normal se describen con medias y desviaciones estándar y los datos con distribución no normal con medianas, y percentiles 25 y 75. En ambos casos se informan también los rangos.

Las variables categóricas se describen con distribuciones de frecuencias absolutas, y relativas. Se presentan de contingencia para asociación de variables. Para determinar las características operativas de las pruebas se determinaron la sensibilidad, especificidad, valor predictivo positivo de una prueba positiva y valor predictivo negativo de una prueba negativa, razones de verosimilitud positiva y negativa (LR+ y LR-) y los correspondientes intervalos de confianza del 95%. Para comparación de las determinaciones individuales de fosfolípidos se calcularon los costos totales de las pruebas.

Para determinar los puntos de corte del recuento de CL apropiados para diversos niveles de la relación L/E se hicieron curvas ROC y se determinaron las áreas bajo la curva con sus respectivos intervalos de confianza del 95%. Se presentan además las razones de verosimilitud positiva y negativa para diversos puntos de corte del recuento de CL en relación con tres niveles de la relación L/E. Se determinó el índice de correlación entre el recuento de CL y la relación L/E y entre el recuento de CL y la edad gestacional. Finalmente, se hizo un modelo de regresión lineal simple para predicción del valor de la relación L/E a partir del recuento de CL.

DÉJANOS TU COMENTARIO

DEJA UNA RESPUESTA

Por favor ingrese su comentario!