Las guías de práctica clínica recomiendan la evaluación de la aterosclerosis subclínica utilizando técnica de imagen en individuos con riesgo cardiovascular intermedio según las utilidades de predicción habituales.
El objetivo de este estudio fue desarrollar un modelo de machine learning basado en variables cuantitativas, de rutina y fácilmente medibles, para predecir la presencia y extensión de la aterosclerosis subclínica (AS) en personas jóvenes y asintomáticas. El riesgo de presentar AS estimado por este modelo podría ser utilizado para refinar la estimación de riesgo y optimizar el uso de imagen para la evaluación del riesgo.
Se construyó un modelo Elastic net para predecir la extensión de AS, definida por una medición combinada de calcificación coronaria y ecografía bidimensional. El comportamiento del modelo para la predicción de la extensión y progresión de la SA se comparó con las escalas tradicionales de predicción de enfermedad cardiovascular (ECV). Se utilizó una cohorte externa independiente para validación.
El modelo EN-PESA presentó un estadístico-c de 0,88 para la predicción de aterosclerosis subclínica generalizada. Además, EN-PESA fue un predictor de progresión a 3 años, independientemente de la extensión basal de AS. El EN-PESA asignó un riesgo cardiovascular intermedio-alto a un 40,1% (n = 1.411) de los individuos PESA, un número significativamente mayor que las escalas CVD (n = 267) y SCORE (n = 507). En total, un 86,8% de los individuos con un riesgo elevado basado en EN-PESA presentaron signos de AS basalmente o una progresión significativa en 3 años.
El modelo EN-PESA utiliza la edad, presión arterial sistólica y 10 medidas de análisis de sangre/orina y valores de ingesta diaria para identificar a personas jóvenes y asintomáticos con un riesgo elevado de enfermedad cardiovascular basado en la extensión y progresión de AS. Estas personas podrían beneficiarte de pruebas de imagen o tratamiento farmacológico.
Comentario
La aterosclerosis es una enfermedad sistémica altamente prevalente en la población en países occidentales y que tiene una historia natural larga en el tiempo, que comienza en gran cantidad de pacientes en una edad temprana y se manifiesta décadas después con eventos cardiovasculares graves como infarto de miocardio o ictus.
La identificación de pacientes asintomáticos de alto riesgo de aterosclerosis, en especial jóvenes, permite la confirmación mediante técnicas de imagen (calcio coronario, grosor de la íntima carotídea) y el establecimiento del control de factores de riesgo cardiovascular y medidas higiénico-dietéticas. Actualmente se recomienda la estratificación de riesgo mediante escalas de riesgo que tienden a infraestimar el riesgo.
Con este enfoque, los autores de este estudio analizan los datos de una gran cohorte de pacientes jóvenes asintomáticos (Progression and Early detection of Subclinical Atherosclerosis [PESA]) para estimar la extensión y progresión de la aterosclerosis
Esta cohorte disponía de hasta 115 variables, tanto de exploración física, demográficas, análisis de sangre y orina, actividad física o hábitos alimenticios de unos 3.500 sujetos. Pero especialmente interesante es la valoración de la extensión de la aterosclerosis mediante varias pruebas de imagen (ecografía de carótida, arterias femoral y aorta, y valoración del calcio score coronario) y la progresión de la enfermedad a 3 años.
Se aplicaron varios algoritmos de machine learning determinándose que el que mejor se comportaba era la red elástica (Elastic net-EN-) y se comparó con la escala de estimación de riesgo de la sociedad europea de cardiología (SCORE) y del American College of Cardiology (ASCVD) y de Framingham a 10 y 30 años. Posteriormente, se validó el modelo EN-PESA en una cohorte externa.
Tras una selección de variables de interés el algoritmo incluyó finalmente 12: edad, ratio colesterol total/HDL, leucocitos, hemoglobina, uso exógeno de vitamina B12, LDL, ingesta de fósforo, presión arterial sistólica, ratio creatinina/isoprostano, ingesta de alcohol y niveles de ácido úrico. El modelo se comportó con una gran reproductibilidad y precisión, alcanzando valores de área bajo la curva de 0,89 y 0,88 y clasificó correctamente hasta en un 80% a los sujetos con aterosclerosis generalizada. Además de ello, el 86% de los sujetos clasificados como de alto riesgo presentaban aterosclerosis o en la valoración basal o a los 3 años de seguimiento.
El diseño de las escalas de predicción de riesgo tradicionales se ha basado en dos premisas: 1) deben ser sencillamente aplicables en la práctica clínica habitual, por lo que se han de basar en variables fácilmente obtenibles, 2) se basan en relaciones lineales entre riesgo cardiovascular y estas variables. Esta estrategia en el diseño de escalas de riesgo aumenta su aplicación poblacional, pero presenta un comportamiento débil, en especial en pacientes de riesgo intermedio. Asimismo, restringir estas escalas a relaciones lineales disminuye la capacidad de predicción de variables con relación no lineal con el evento o incluso aquellas con interrelaciones más complejas en las que varias variables puedan tener efectos sinérgicos.
Este hecho puede ser parcialmente subsanado mediante la aplicación de técnicas de machine learning permitiendo descubrir variables que pueden tener una importancia relevante en un grupo pequeño de pacientes (predictores débiles) y que podrían pasar desapercibidas mediante un enfoque tradicional. La capacidad computacional que tenemos al alcance de la mano en nuestros smartphones o en la nube hoy en día permite su aplicación de algoritmos de machine learning a pesar de requerir cálculos complejos, como contraposición a la tendencia a la simplificación en el cálculo de las escalas tradicionales.
La aplicación de técnicas de machine learning es ya una realidad en múltiples ámbitos industriales e incluso de la vida diaria, pero, aunque en los últimos años cada vez hay más experiencias publicadas en medicina, su aplicación clínica sigue siendo baja. Aunque su mayor capacidad en el desarrollo de modelos de predicción está aceptada, por su naturaleza, la interpretación de los resultados es compleja. Un ejemplo está en este estudio donde, a pesar de los buenos resultados, la inclusión de variables como la ingesta de fósforo o de vitamina B12, o la ausencia del sexo, es difícilmente aceptable por intuición clínica, aunque son, en este estudio, dos predictores robustos de aterosclerosis.
Una de las grandes limitaciones de este estudio es su aplicabilidad clínica, ya que las encuestas de hábitos dietéticos son difícilmente aplicables en la población general. Asimismo, este estudio pretende identificar aquellos pacientes de alto riesgo y propone que sea utilizado para indicar técnicas de imagen, confirmar el diagnóstico de aterosclerosis y establecer medidas terapéuticas para disminuir el riesgo de eventos. Sin embargo, aunque es una estrategia utilizada con éxito actualmente, debe demostrarse que también lo sería estratificando el riesgo mediante la metodología que se utiliza en este estudio.
Por otro lado, todas las técnicas de machine learning presentan cierto riesgo de overfitting o sobreajuste, que determina una predicción excelente en la población analizada pero excesivamente dependiente de esta población. Sin embargo, la metodología utilizada, validación externa y ajuste de hiperparámetros hace que este riesgo se minimice.
Queda para el futuro establecer la utilidad de este algoritmo para la predicción de eventos clínicos y reforzar su posible aplicación clínica generalizada. Pero, quizá aún más importante, queda pendiente también cómo conjugar la potencia de los nuevos métodos de machine learning ya que su compleja interpretación, en la que no podemos asumir la relación entre las variables, requiere una aplicación “a ciegas” que no estamos acostumbrados a asumir en la práctica clínica. Este estudio y el gran trabajo metodológico y de interpretación que han realizado los autores supondrá un paso más en este sentido.
Referencia
Machine Learning Improves Cardiovascular Risk Definition for Young, Asymptomatic Individuals
- Fátima Sánchez-Cabo, Xavier Rossello, Valentín Fuster, Fernando Benito, Jose Pedro Manzano, Juan Carlos Silla, Juan Miguel Fernández-Alvira, Belén Oliva, Leticia Fernández-Friera, Beatriz López-Melgar, José María Mendiguren, Javier Sanz, Jose María Ordovás, Vicente Andrés, Antonio Fernández-Ortiz, Héctor Bueno, Borja Ibáñez, José Manuel García-Ruiz, Enrique Lara-Pezzi.
- J Am Coll Cardiol. 2020 Oct, 76 (14) 1674-1685.