El Juicio Clínico en Cuidado Intensivo

¿Es útil para tomar decisiones y predecir pronósticos?

La aparición y el desarrollo del Cuidado Intensivo, con los avances técnicos y tecnológicos que ha traído, la ha dado la posibilidad al médico de salvar la vida de muchos pacientes no recuperables hace varias décadas. Sin embargo, estos mismos avances pueden permitir que el médico prolongue la muerte. Todo esto va asociado con un exagerado incremento en los costos hospitalarios lo cual obliga a un análisis caso a caso de riesgos/costos/benéficos.

El trabajo en Cuidado Intensivo implica, para el médico, la toma de múltiples decisiones diariamente y para el personal de enfermería la ejecución de una gran cantidad de actividades. Unas y otras dependen, directa o indirectamente del pronóstico de los pacientes en quienes se toman o ejecutan esas decisiones y actividades.

Diariamente el personal médico y paramédico de una UCI realiza, conciente o inconscientemente, una evaluación, análisis o juicio sobre el pronóstico o posibles desenlaces de los pacientes a su cargo.

El juicio clínico para predecir pronósticos o desenlaces ha sido cuestionado debido a no ser muy reproducible y a que, en algunas series se ha encontrado que tiende a sobreestimar el riesgo de muerte. Además, introduce sesgos por la variable capacidad individual de recordar eventos particularmente memorables, raros, recientes o remotos.

Como plantean los doctores Pavía, Martínez y colaboradores el juicio clínico o la capacidad de predecir desenlaces en pacientes críticos depende de muchas variables. Además de la experiencia, conocimientos y capacidad de análisis debemos mencionar otras no menos importantes como los valores éticos, la formación humanística y otras características tan individuales como impredecibles. Es por ello que han surgido los sistemas de puntuación o graduación de severidad de enfermedad como predictores de desenlaces, fundamentalmente de mortalidad.

Los sistemas de puntuación de severidad de enfermedad más usados en UCI son:

  1. APACHE II 8Acute Physiology and Chronic Health Evaluation): Es más usado en la actualidad. Es un sistema específico de enfermedad. Las variables que se mide son edad, tipos de ingreso, evaluación crónica y 12 variables fisiológicas. Fue validado en 5815 ingresos a UCI en 13 hospitales. Para estos pacientes la relación de clasifícación correcta para un riesgo predicho de muerte del 50% fue del 85%.
  2. APACHE III: Se diseño para mejorar los resultados del APACHE II empleado para ello una muestra de pacientes mucho mayor. En la actualidad es un producto con un propietario comercial. Es un sistema especifico de enfermedad desarrollado en 17.440 ingresos en 40 hospitales de Estados Unidos: Cuenta con 18 variables cuya importancia y puntuación fueron derivadas de modelos de regresión logística.
  3. SAPS ii(Simplified Acute Physiology Score II): Se desarrolló de una muestra de 13.152 ingresos en 12 países. Emplea 17 variables y no es especifíco de enfermedad.
  4. MPM II (Mortality Probability Model): desarrollado a partir de 19.124 ingresos en 12 países. No es especifico de enfermedad. El MPO es el único sistema que efectuó mediciones al ingreso a UCI y por lo tanto puede ser empleado para ello. El MPM0 incluyó tres variables crónicas, cinco diagnósticos agudos y otras tres variables (Reanimación preingreso, ventilación mecánica e ingreso médico o quirúrgico no programado). El MPM24 se empleó en los pacientes que llevan 24 horas en UCI e incluyó 13 variables, cinco de las cuales se emplearon en el MPM=: El MPM48 y MPM72 se desarrollaron para estimar la probabilidad de mortalidad a las 48 y 72 horas del ingreso a UCI con las mismas 13 variables del MPM24.
  5. TISS(Therapeutic Intervention Scoring System): Cuantifica la cantidad de cuidado que se ofrece a los pacientes críticos. Se basa en la medición de 76 actividades de enfermería, técnicas de monitoreo, procedimientos de reanimación y tecnología. Esta escala mide la severidad de enfermedad en forma indirecta al cuantificar el nivel de servicios provistos al paciente. El TISS se desarrolló como una forma de describir intensidad de cuidado y no para predecir desenlaces.

La variedad de estos índices implica lógicamente que no s ha podido encontrar, hasta el momento el sistema ideal.

Es difícil comparar la exactitud de estos sistemas de puntuación de severidad. La dificultad radica en las diferencias poblacionales y en los métodos estadísticos usados en cada uno de estos sistemas. Un estudio multinacional comparó las diferentes generaciones de los tres principales sistemas en 4.685 pacientes. APACHE III; SAPS II y MPM II tuvieron una mejor discriminación y calibración que APACHE II, SAPS Y MPM. Sin embargo, un estudio en el Reino Unido comparó el APACHE II y el APACHE III en 1.144 pacientes y el primero mostró mejor calibración mientras que el segundo presentó una mejor discriminación. Ambos sistemas subestimaron la mortalidad hospitalaria pero el APACHE III la subestimó en mucho mayor grado.

En la actualidad existen cuatro escenarios en los cuales emplear los sistemas de graduación de severidad:

  1. En investigación clínica: Para comparar estudios clínicos controlados, para determinar tamaños de muestras, para estratificar aleatorización por severidad de enfermedad, ect.
  2. En administración: Para describir utilización e recursos en UCI, para describir agudeza de enfermedad y para guiar reembolsos, indemnizaciones o presupuestos.
  3. Evaluación de actuaciones en UCI: Calidad de cuidado, comparación de resultados entre UCI de diferentes regiones y con diversas características de trabajo.
  4. Medición de pronósticos en pacientes individuales y para guías de cuidado: Decisiones sobre intensidad del cuidado, decisiones sobre iniciar o suspender un tipo de cuidado.

El proceso para desarrollar un modelo de predicción de desenlace incluye: Establecer una definición precisa de desenlace; desarrollar un modelo de las variables que influyen directamente en el desenlace; definir cada variable con buen sistema de medición; recolectar una base de datos con información de las variables y los desenlaces; formular instrumentos predictivos que analicen la relación entre las variables y los desenlaces; y, por último validar el instrumento.

Múltiples análisis de regresión identificaron las mejores variables específicas y luego a cada una de ellas se les asignó un puntaje o peso proporcional. Por último, se emplearon diversas técnicas para describir la exactitud predictiva de estos sistemas de puntuación de severidad: La sensibilidad, especificidad, valores predictivos positivos y negativos fueron calculados. Para mejorar la exactitud de estos sistemas se establecieron dos técnicas estadísticas complementarias esenciales: la calibración y discriminación.

Discriminación: Es la capacidad para separar correctamente, los pacientes con y sin el desenlace en estudio. Si la discriminación es perfecta no habrá superposición en las probabilidades estimadas entre los pacientes que mueren y los pacientes que viven.

Calibración: Es el acuerdo ente el desenlace predicho y el observado en todos los niveles de la escala de severidad. Los pacientes son colocados en subgrupos de acuerdo con el riesgo predicho.

¿Son los sistemas de puntuación de severidad más exactos que la opinión clínica para anticipar los desenlaces en pacientes críticos?

Existen 3 estudios que correlacionan el APACHE II con las predicciones clínicas en las primeras 24 horas del ingreso a UCI y un estudio que evaluó las predicciones del médico únicamente:

La discriminación de las predicciones del médico fue muy similar y en algunos casos inclusive superiores a las del APACHE II . En contraste con la capacidad de discriminar, la calibración de las predicciones médicas de mortalidad es diferente a las del APACHE II. En pacientes de alto riesgo ambos predicen en forma muy similar la mortalidad (71-85%). Sin embargo, para riesgos de mortalidad menores del 30% las predicciones médicas fueron de 39-69% comparadas con 51-67% del APACHE II

Hay cinco estudios publicados que han detallado información sobre modelos de severidad en adultos en general. Todos los estudios muestran el mismo patrón: Buena discriminación mientras que la calibración es pobre. Además, recientes validaciones de los sistemas APACHE han encontrado limitaciones en su capacidad de predecir mortalidad.

La opinión más generalizada es estos sistemas tienen un uso limitado en el pronóstico de pacientes individuales o en las decisiones de intervención y sus indicaciones se reducen a los 4 puntos arriba anotados.

Una limitante mayor para estos sistemas de puntuación de severidad es que existen preferencias o conocimientos previos del paciente y/o del médico sobre la calidad d vida previa o posterior que han venido ganando importancia y que, hasta el momento no han podido ser integrados a estos modelos matemáticos. Además, para el médico un desenlace puede ser sólo la oportunidad que el paciente tenga de quedar libre de enfermedad y no morir, y esto es lo que nos ayuda a predecir los modelos de predicción anotados, para el paciente puede ser más importante establecer las posibilidades de regresar a su capacidad funcional previa, o de quedar con secuelas crónicas o de significar una carga para la familia. Para muchos pacientes estos desenlaces son peores que la muerte.

Definir desenlaces aceptables para individuos es particularmente relevante en UCI debido a que cada vez es más fuerte la posibilidad de sostener la vida o prolongar la muerte sin lograr restaurar la salud.

En la medida en que la ciencia de la predicción de desenlaces madure, desenlaces cualitativos más que la mortalidad sola, serán medidos cada vez con mayor frecuencia.

Esfuerzos tales como el SUPPORT(Study to Understand Prognosis and Preferences for Outcomes and risks of Treatment) se están desarrollando y proveerán datos que nos derán mayor información sobre opciones terapéuticas. Hasta cuando contemos con resultados de mayor peso los médicos aprenderemos a incorporar modelos predictivos en nuestra práctica diaria teniendo siempre en cuenta las limitaciones de usar la mortalidad como desenlace final.

La publicación en el presente número de la Revista del trabajo del grupo de la UCI del Hospital Santa Clara es original en su concepción y es un gran esfuerzo en un tema tan vital y difícil y paradójicamente poco estudiado(menos del 3% de todas las publicaciones en UCI). De este trabajo nos surgen varios cuestionamientos que pueden convertirse en hipótesis de futuras investigaciones:

  1. ¿Podremos medir la experiencia individual del grupo humano de UCI?.
  2. ¿Cuál es la repercusión de esta experiencia en el ambiente de UCI y en la toma de decisiones?.
  3. ¿Es diferente la percepción pronóstica del equipo médico a la que tiene la familia y/o el paciente?.

CARMELO DUEÑAS C. MD
Neumólogo
Unidad de Cuidado Intensivo
Universidad de Cartagena

BIBLIOGRAFIA 

1. Branner LA, Godfry LJ; Goetter WE: Prediction of oetcome from critical illness: A comparison of clinical judgment with a prediction rule. Arch Intern Med. 1989;149:1083.
2. Kruse JA, Thill-Baharozian MC, Carlson RW: Comparison of clinical assessment with APACHE II for predicting mortality risk in patients admitted to a medicla intensive care inti. JAMA.1988;260:1739.
3. McClish DK, PoweII SH: How well can physicians estimate mortalit in a medical intensive care unit? Med Decision Making. 1980;9:125.
4. Poses RM, Bekes C, Winkler RL, et als: Are two heads(inexperienced) better than one (experienced) head?. Arch Intern Med:1990;150:1874.
5. Moreno R, Miranda DR, Fidler V, Van Schilfgaarde R: Evaluation of two outcome prediction models on an independent database. Crit Care Med. 1998;26:50-61.
6. Pappachan JV, Millar B, Bennett ED, Smith GB: Comparison of outcome from intensive care admission after adjustment for case mix by APACHE II prognostic system. Chest. 1999;115:802-10.
7. Pavía J, Martínez CE, Camacho H. Evolución del paciente crítico hospitalizado en la unidad de cuidado intensivo. Comparación entre la opinión de médicos y enfermeras. Rev Colomb Neumol 1999;11:24-8.

DÉJANOS TU COMENTARIO

DEJA UNA RESPUESTA

Por favor ingrese su comentario!