La enfermedad cardiovascular (ECV) es la principal causa de mortalidad en el mundo. Anualmente, se producen veinte millones de muertes por enfermedades cardiovasculares, entre las que se cuentan cardiopatías coronarias (ECC) y accidentes cerebrovasculares.
Para predecir estos casos, los médicos utilizan los protocolos establecidos por el American College of Cardiology / American Heart Association (ACC / AHA), que se basan en ocho factores de riesgo como la hipertensión, el colesterol, la edad, el tabaquismo y la diabetes.
Pero estos datos pueden resultar demasiado básicos, ya que no tienen en cuenta factores tales como los medicamentos que un paciente podría estar tomando, otras enfermedades o el estilo de vida. Es por eso que se plantea la necesidad de explorar otros enfoques que incorporen múltiples factores de riesgo y que determinen relaciones más matizadas entre los factores de riesgo y los resultados.
El aprendizaje por máquina (Machine Learning) ofrece un enfoque alternativo al modelo de predicción estándar, ya que puede abordar las limitaciones actuales: tiene potencial para transformar la medicina mediante una mejor explotación de «grandes datos» para el desarrollo de algoritmos
En este sentido, se llevó a cabo un estudio financiado por el National Institute for Health Research School for Primary Care Research (NIHR SPCR) para evaluar si el ML puede mejorar la precisión de la predicción del riesgo cardiovascular dentro de una gran población general de atención primaria. Y también se buscó determinar qué clase de algoritmo tiene la mayor precisión predictiva
En el estudio se utilizaron datos clínicos de 378.256 pacientes del Reino Unido, libres de enfermedad cardiovascular y se compararon cuatro algoritmos de aprendizaje automático (bosque aleatorio, regresión logística, máquinas de aumento de gradiente, redes neuronales) con un algoritmo establecido (American College of Cardiology guidelines) para predecir el primer evento cardiovascular a lo largo de 10 años.
A diferencia de las directrices ACC / AHA, a los métodos de ML se les permitió tener en consideración 22 datos más, incluyendo el origen étnico de los pacientes o la posibilidad de sufrir de artritis o enfermedad renal.
En primer lugar, los algoritmos de ML usaron aproximadamente 78% de los datos (295.267 historias clínicas) para buscar patrones y construir sus propias directrices internas. Posteriormente, se probaron a sí mismos con las historias restantes. Utilizando datos de historias clínicas disponibles en 2005, predijeron qué pacientes tendrían su primer evento cardiovascular en los próximos diez años, y verificaron sus conjeturas con relación a las historias clínicas del año 2015.
Los cuatro métodos de ML dieron mejores resultados que las directrices del ACC / AHA. Utilizando la estadística llamada AUC, en la que una puntuación de 1,0 significa el 100% de precisión, las directrices de la ACC / AHA tenían un acierto de 0.728, mientras que los cuatro nuevos métodos tenían un acierto de entre 0,745 y 0,764. De entre los cuatro, el que mejores resultados dio predijo un 7,6% más de eventos que el método ACC / AHA y, además, dio un 1,6% menos de falsas alarmas. En la muestra del ensayo de 83.000 historiales clínicos, esta cantidad representa 355 pacientes adicionales al que se podía haber tratado para prevenir un infarto, por ejemplo, con medicamentos o haciendo cambios en la dieta para reducir el colesterol.
Algunos de los factores de riesgo que los algoritmos identificaron como los predictores más fuertes no están incluidos en las directrices de la ACC / AHA, y son, entre otros, las enfermedades mentales graves o el consumo de corticosteroides orales. En cambio, ninguno de los algoritmos tuvo en cuenta la diabetes, que, por el contrario, sí está en la lista de la ACC / AHA.
Fuentes:
Weng SF, Reps J, Kai J, Garibaldi JM, Qureshi N (2017) Can machine-learning improve cardiovascular risk prediction using routine clinical data? PLoS ONE 12(4): e0174944. https://doi.org/10.1371/journal.pone.0174944