Las variaciones en las concentraciones de troponina según sexo, edad y tiempo entre muestras en pacientes con sospecha de infarto agudo de miocardio (IAM) no son actualmente tenidas en cuenta en el enfoque diagnóstico. Este estudio pretende combinar estas variables mediante machine learning para mejorar la evaluación del riesgo de los pacientes.
Se entrenó a un algoritmo de aprendizaje automático machine learning (myocardial-ischemic-injury-index [MI3]) que incorporaba edad, sexo y concentraciones de troponina I de alta sensibilidad apareadas en 3.013 pacientes y validado en 7.998 pacientes con sospecha de IAM. El MI3 utiliza la potenciación de gradiente para calcular un valor (0-100) que refleja la probabilidad individual de diagnóstico de IAM tipo 1 y estima la sensibilidad, el valor predictivo negativo, la especificidad y el valor predictivo positivo para cada sujeto. La evaluación se realizó por calibración y por área bajo la curva ROC. Se evaluó en un análisis secundario los umbrales del MI3 en la cohorte de entrenamiento y se identificaron los pacientes de bajo riesgo (sensibilidad del 99%) y de alto riesgo (valor predictivo positivo 75%) y la eficiencia de estos umbrales comparados en la cohorte de entrenamiento con el percentil 99 y con las rutas de rule-out de la Sociedad Europea de Cardiología.
Se registraron 404 (13,4%) IAM en la cohorte de entrenamiento y 849 (10,6%) en la cohorte de comprobación. El MI3 presentó buena calibración con un área bajo la curva muy alta: 0,963 (0,956-0,971) en la cohorte de comprobación y una eficiencia similar entre pacientes con consulta precoz y tardía. Los umbrales de MI3 en la cohorte de entrenamiento fueron 1,6 y 49,7, respectivamente. En la cohorte de comprobación los valores MI3 < 1,6 fue un 69,5% con un valor predictivo negativo del 99,7% (99,5%-99,8%) y sensibilidad del 97,8% (96,7%-98,7%) y MI3 ≥ 49,7 en el 10,6% con un valor predictivo positivo del 71,8% (68,9-75,0%) y especificidad del 96,7% (96,3%-97,1%). Utilizando estos gradientes, el MI3 se comportó mejor que el algoritmo 0/3 horas de la ESC (sensibilidad 82,5% [74,5-88,8%], especificidad 92,2% [90,7-93,5%]) y que el percentil 99 en cualquier momento (sensibilidad 89,6% [87,4-91,6%]), especificidad 89,3% [88,6-90,0%]).
Utilizando el aprendizaje automático, MI3 aporta una valoración individualizada y objetiva de la probabilidad de IAM, que puede ser utilizada para identificar a los pacientes de bajo y alto riesgo que podrían beneficiarse de decisiones clínicas más tempranas.
Comentario
El uso de la determinación de troponina en pacientes con sospecha de infarto agudo de miocardio se ha generalizado en los últimos años siendo actualmente prácticamente obligatorio para su diagnóstico.
Históricamente se han utilizado diferentes estrategias recomendándose determinaciones a las 12 o 6 horas desde el inicio de los síntomas, a las 0 y 3 horas desde la presentación o 0 y 1 horas más recientemente. Asimismo, se han establecido los niveles de positividad el percentil 99 de la población general, asumiéndose valores por encima como positivos y diagnósticos de infarto.
Es conocida la variación de los niveles de concentración de troponinas según el sexo y la edad, así como el valor pronóstico y diagnóstico de las variaciones temporales (ascenso y o descenso). Sin embargo, todas estas variables presentan múltiples interrelaciones que hacen que una aproximación clásica con relaciones lineales aisladas lleve a una estratificación de riesgo subóptima.
La utilización de nuevos métodos estadísticos de machine learning o aprendizaje automático permiten desvelar interrelaciones no evidentes e independientes de la hipótesis pudiendo obtenerse modelos de estimación de riesgo más precisos.
Así, los autores, con el objetivo de mejorar la estratificación de riesgo en pacientes con sospecha de infarto de agudo de miocardio que consultan en urgencias, utilizan una cohorte de 3.013 pacientes para “entrenar” a un sistema de machine learning utilizando únicamente las variables edad, sexo y hora y concentración de dos valores de troponinas. Este sistema otorga un valor (MI3) entre 0 y 100 para cada paciente que es equivalente a la probabilidad de diagnóstico de IAM tipo 1. Una vez obtenido el modelo se aplicó a la cohorte de validación para determinar su calibración y su poder de discriminación, así como compararlo con la estrategia de la ESC 0-3h y el diagnóstico basado en alguna determinación por encima del percentil 99.
El algoritmo arrojado por el sistema de aprendizaje automático presentaba una muy buena área bajo la curva (0,963) en la cohorte de entrenamiento que fue muy similar a la de la cohorte de validación. Se generaron dos umbrales de MI3: inferior a 1,6 para muy bajo riesgo y superior a 49,7 para alto riesgo. El de bajo riesgo, utilizado para el rule-out o descarte de IAM cumplió su objetivo con buenos resultados (valor predictivo negativo 99,7% y sensibilidad del 97,1%) permitiendo descartar con gran seguridad casi el 70% de los pacientes. Para el umbral de rule-in del MI3 los resultados fueron también muy positivos con un valor predictivo positivo alto (75%). Además, el MI3 se comportó mejor que el ESC 0-3h y el diagnóstico por p99.
Una de las ventajas de este índice de valoración de riesgo es que no requiere de intervalos de tiempo fijos entre la determinación de dos troponinas ni de umbrales preestablecidos lo que facilita el diagnóstico en un entorno como el de urgencias, habitualmente ocupado y difícil de gestionar. Además de ello no precisa la introducción de múltiples variables clínicas (factores de riesgo, frecuencia cardiaca o tensión arterial) necesitando solo la edad y el sexo.
A parte de las ventajas en su simplicidad de utilización, los autores demuestran una mejor discriminación, tanto en el rule-in como en el rule-out que los métodos habituales (p99 y ESC 0-3h), así como de otras escalas de riesgo. El gran tamaño muestral utilizado, con unas tasas de eventos relativamente elevadas, procedente de varios centros y países y la validación en una gran cohorte permiten que el MI3 tenga validez externa como para generalizarse y utilizarse en otros sistemas sanitarios.
El uso de métodos de machine learning es cada vez más frecuente en la investigación médica y permite una mejor compresión y predicción al analizarse todas las interrelaciones de las variables de una forma más compleja que con los métodos estadísticos habituales. Este estudio es un perfecto ejemplo de cómo su utilización permite obtener índices de valoración de riesgo más precisos sin la necesidad de utilización más variables (clínicas, de imagen o biomarcadores…).
Referencia
Machine Learning to Predict the Likelihood of Acute Myocardial Infarction
- Martin P. Than, John W. Pickering, Yader Sandoval, Anoop S.V. Shah, Athanasios Tsanas, Fred S. Apple, Stefan Blankenberg, Louise Cullen, Christian Mueller, Johannes T. Neumann, Raphael Twerenbold, Dirk Westermann, Agim Beshiri, and Nicholas L Mills and on behalf of the MI3 collaborative.
- Circulation. 2019 Aug 16. doi: 10.1161/CIRCULATIONAHA.119.041980. [Epub ahead of print].