¿Puede la Inteligencia Artificial Mejorar la Predicción del Riesgo Cardiovascular?
Introducción
En un mundo en constante cambio y avance tecnológico, la medicina también está experimentando una revolución. La capacidad de las máquinas para aprender y evolucionar, conocida como aprendizaje automático (Machine Learning, ML), es una de las ramas de la Inteligencia Artificial que está transformando la forma en que abordamos las enfermedades, su diagnóstico y tratamiento.
Un área de enfoque es la enfermedad cardiovascular aterosclerótica, una de las principales causas de muerte en todo el mundo. La prevención de esta enfermedad se basa en gran medida, en la capacidad para predecir quién está en mayor riesgo. Pero, ¿pueden los algoritmos de aprendizaje automático superar a los métodos tradicionales de predicción de riesgos?
El Estudio
Un estudio reciente publicado en la revista “European Heart Journal – Quality of Care and Clinical Outcomes” intentó responder a esta pregunta. El objetivo del estudio era investigar si los algoritmos de aprendizaje automático podrían ofrecer un mejor rendimiento en la predicción del riesgo cardiovascular aterosclerótico en comparación con los enfoques de puntuación de riesgo tradicionales.
Métodos y Resultados
Para ello, los investigadores extrajeron y analizaron datos de diversas fuentes, incluyendo bases de datos clínicas, estudios de cohortes retrospectivos y bases de datos de investigación clínica. Estos datos se dividieron en conjuntos de entrenamiento y validación, y se analizaron utilizando diferentes algoritmos de aprendizaje automático.
Los resultados indicaron que los algoritmos de aprendizaje automático superaron a los puntajes de riesgo tradicionales en la discriminación de la predicción del riesgo de enfermedad cardiovascular.
¿Qué Significa Esto?
Esto sugiere que los algoritmos de aprendizaje automático podrían ser más precisos en la identificación de personas con alto riesgo de enfermedad cardiovascular aterosclerótica. Sin embargo, los investigadores también señalan que aún no está claramente definida la forma cómo estos algoritmos de aprendizaje automático podrían implementarse en entornos clínicos.
¿Cuáles Son los Próximos Pasos?
Por lo tanto, se necesita más investigación y desarrollo para seleccionar los modelos de machine learning mas eficientes, y definir metodologías para incorporarlos en las herramientas informáticas del ejercicio clínico diario en entornos de atención primaria. La integración de estos algoritmos en los software de atención médica o en la Historia Clínica electrónica en entornos de atención primaria podría mejorar la identificación de pacientes con alto riesgo de eventos cardiovasculares
Resumen de la Revisión Sistemática
Datos Generales del Artículo:
El título del artículo es “Machine-learning versus traditional approaches for atherosclerotic cardiovascular risk prognostication in primary prevention cohorts: a systematic review and meta-analysis”.
En español, esto se traduce como “Aprendizaje automático versus enfoques tradicionales para la predicción del riesgo cardiovascular aterosclerótico en cohortes de prevención primaria: una revisión sistemática y meta-análisis”.
El DOI del artículo es: 10.1093/ehjqcco/qcad017
El artículo se publicó en línea el 3 de marzo de 2023.
El artículo se publicó en la revista “European Heart Journal – Quality of Care and Clinical Outcomes”.
Página web de la revista: https://academic.oup.com/ehjqcco
Métodología:
¿Cuál es la relevancia del artículo?
Este artículo es relevante debido a su exploración en profundidad del papel que puede desempeñar la Inteligencia Artificial (IA), específicamente el aprendizaje automático (Machine Learning, ML), en la mejora de las predicciones de riesgo de enfermedades cardiovasculares ateroscleróticas. Su investigación detallada tiene implicaciones directas en la prevención y tratamiento de las enfermedades cardiovasculares, uno de los principales problemas de salud a nivel mundial. El hecho de que el estudio compare métodos de aprendizaje automático con enfoques de predicción de riesgos tradicionales también proporciona un valioso contexto sobre la eficacia de las tecnologías emergentes en el campo de la medicina.
¿Cuál fue el objetivo del artículo?
El objetivo principal del artículo era investigar si los algoritmos de aprendizaje automático ofrecen una mayor precisión en la pronosticación del riesgo cardiovascular en comparación con los puntajes de riesgo tradicionales.
¿Cuáles son las fuentes de datos que se utilizaron en el artículo?
Se buscaron estudios en las colecciones de MEDLINE, EMBASE, CENTRAL y SCOPUS Web of Science Core que compararan los modelos de ML con las puntuaciones de riesgo tradicionales para la predicción del riesgo de ECV entre los años 2000 y 2021.
¿Cómo se seleccionaron los estudios?
Se incluyeron estudios que evaluaron tanto el aprendizaje automático como las puntuaciones de riesgo tradicionales en poblaciones de prevención primaria en adultos (≥18 años). Se evaluó el riesgo de sesgo utilizando la herramienta de evaluación del riesgo de sesgo del modelo de predicción (PROBAST). Solo los estudios que proporcionaron una medida de discriminación [es decir, Las estadísticas C con intervalos de confianza del 95 % (IC)] se incluyeron en el metanálisis. Se incluyeron un total de 16 estudios en la revisión y el metanálisis (3.302.515 individuos). Todos los diseños de los estudios fueron estudios retrospectivos de cohortes. De los 16 estudios, 3 validaron externamente sus modelos y 11 métricas de calibración reportadas. Un total de 11 estudios demostraron un alto riesgo de sesgo.
¿Cómo se extrajeron y analizaron los datos?
Los datos se dividieron en conjuntos de entrenamiento y validación. Los conjuntos de entrenamiento se usaron para calcular los coeficientes del modelo y los hiperparámetros, y los conjuntos de validación se usaron para mejorar el ajuste de los datos de entrenamiento al modelo. Los datos se analizaron utilizando algoritmos de aprendizaje automático y se compararon con los resultados de los métodos de predicción de riesgo tradicionales.
Resultados y Conclusiones:
¿Cuáles fueron las principales medidas del artículo?
Las principales medidas y resultados del artículo se centraron en la comparación entre los algoritmos de aprendizaje automático y los puntajes de riesgo tradicionales para la predicción del riesgo cardiovascular. Los algoritmos de aprendizaje automático demostraron un rendimiento superior en la discriminación de la predicción del riesgo cardiovascular, superando los enfoques tradicionales en un 1.4%.
¿Cuáles fueron los resultados del artículo?
El resultado principal del artículo fue que los algoritmos de aprendizaje automático superaron a los puntajes de riesgo tradicionales en la predicción del riesgo de enfermedad cardiovascular. No obstante, no se demostró una superioridad consistente de los algoritmos de aprendizaje automático sobre los métodos de regresión estándar.
¿Cuáles fueron las conclusiones del artículo?
Las conclusiones del artículo sugieren que los algoritmos de aprendizaje automático podrían mejorar la identificación de pacientes con alto riesgo de eventos cardiovasculares y, por lo tanto, aumentar las oportunidades para la prevención de enfermedades cardiovasculares. Sin embargo, su implementación práctica en entornos clínicos aún no está clara y se necesita más investigación para examinar cómo se pueden utilizar estos modelos para la prevención primaria.
Información adicional Interesante derivada del Artículo:
Estadísticas relevantes del estudio:
Aquí están algunos de los datos numéricos o estadísticos más importantes del artículo:
Tamaño de la muestra y partición del conjunto de datos:
En varios estudios incluidos en la revisión, se utilizaron grandes conjuntos de datos para entrenar y validar los modelos de aprendizaje automático. Por ejemplo, en el estudio de Zarkogianni et al. 2018, se utilizó un total de 560 datos para el entrenamiento y la validación interna. En el estudio de Kakadiaris et al. 2018, se utilizó un total de 6459 datos para el entrenamiento y la validación interna, y 1348 datos para la validación externa. En el estudio de Alaa et al. 2019, se utilizó un total de 423 604 datos para el entrenamiento y la validación interna.
Edad media (SD):
La edad media de los participantes en los estudios varió. Por ejemplo, en el estudio de Zarkogianni et al. 2018, la edad media fue de 58.56 años (SD 10.70). En el estudio de Kakadiaris et al. 2018, la edad media fue de 61.3 años (SD 9.6). En el estudio de Alaa et al. 2019, la edad media fue de 56.4 años (SD 8.1).
Número de variables:
El número de variables utilizadas en los modelos de aprendizaje automático también varió entre los estudios. Por ejemplo, en el estudio de Zarkogianni et al. 2018, se utilizaron 16 variables. En el estudio de Kakadiaris et al. 2018, se utilizaron 13 variables. En el estudio de Alaa et al. 2019, se utilizaron 473 variables.
Resumen de las estadísticas C:
El resumen de las estadísticas C para los modelos de aprendizaje automático de mejor rendimiento y las puntuaciones de riesgo tradicionales fueron 0.773 (IC 95%: 0.740-0.806) y 0.759 (IC 95%: 0.726-0.792), respectivamente. La diferencia en la estadística C fue de 0.0139 (IC 95%: 0.0139-0.140), P < 0.0001. Esto indica que los modelos de aprendizaje automático superaron a las puntuaciones de riesgo tradicionales en la discriminación de la pronosticación del riesgo de enfermedad cardiovascular.
Estos datos numéricos y estadísticos son importantes porque proporcionan información sobre la eficacia de los modelos de aprendizaje automático en comparación con los enfoques tradicionales para la pronosticación del riesgo cardiovascular aterosclerótico.
Modelos de ML de mejor desempeño
El artículo no especifica un solo modelo de aprendizaje automático que haya superado a todos los demás en todos los estudios. Sin embargo, se mencionan varios modelos de aprendizaje automático que se utilizaron en los estudios incluidos en la revisión, y se proporcionan algunas estadísticas de rendimiento para estos modelos. Aquí están algunos de los modelos mencionados:
- Random Forest: Utilizado en 8 estudios, con una estadística C resumida de 0.747 (IC 95%: 0.684-0.809). La estadística C es una medida de la capacidad de un modelo para distinguir entre diferentes clases; un valor más alto indica un mejor rendimiento.
- Redes Neuronales: Utilizado en 7 estudios, con una estadística C resumida de 0.777 (IC 95%: 0.722-0.832).
- Regresión Logística: Utilizado en 7 estudios, con una estadística C resumida de 0.719 (IC 95%: 0.633-0.805).
- Máquinas de Vectores de Soporte (SVM): Utilizado en 5 estudios, con una estadística C resumida de 0.709 (IC 95%: 0.620-0.797).
- Otros métodos de aprendizaje automático: Utilizado en 10 estudios, con una estadística C resumida de 0.778 (IC 95%: 0.739-0.818).
Es importante tener en cuenta que la elección del mejor modelo de aprendizaje automático puede depender de muchos factores, incluyendo el tipo de datos disponibles, el problema específico que se está abordando, y las limitaciones computacionales, entre otros. Además, el rendimiento de los modelos puede variar dependiendo del conjunto de datos específico que se esté utilizando.
Explicación de los modelos de machine learning mencionados:
Imagina que estás jugando un videojuego y tienes varios personajes para elegir, cada uno con sus propias habilidades y fortalezas. No hay un personaje “mejor” universalmente, ya que el mejor personaje para ti depende del nivel que estés jugando, tus habilidades personales y tu estilo de juego.
En este caso, los “personajes” son diferentes tipos de algoritmos de aprendizaje automático, que son técnicas que las computadoras usan para aprender de los datos y hacer predicciones o decisiones sin ser programadas explícitamente para hacerlo. Algunos de los “personajes” mencionados en el artículo son:
- Random Forest: Este es como un equipo de personajes que toman decisiones juntos. Cada personaje toma una decisión por sí mismo, y luego todos votan para decidir el resultado final.
- Redes Neuronales: Estos son como personajes muy complejos que pueden aprender una gran cantidad de habilidades diferentes. Son muy poderosos, pero también pueden ser difíciles de entender y controlar.
- Regresión Logística: Este es un personaje más simple que utiliza una estrategia directa y fácil de entender.
- Máquinas de Vectores de Soporte (SVM): Este personaje intenta mantener la mayor distancia posible de los enemigos mientras lucha, lo que puede ser una estrategia efectiva en ciertas situaciones.
- Otros métodos de aprendizaje automático: Hay muchos otros personajes posibles, cada uno con sus propias habilidades y estrategias.
El “juego” en este caso fue predecir el riesgo de enfermedad cardiovascular aterosclerótica, que es una condición que puede causar problemas graves como ataques cardíacos y accidentes cerebrovasculares. Al igual que en un videojuego, no hay un solo “personaje” o algoritmo que sea el mejor en todas las situaciones. El mejor algoritmo depende de los datos específicos que tienes y de lo que estás tratando de predecir.
Puedes Acceder a las últimas publicaciones del Blog:
- Medicamentos para la Prevención de la Migraña: Una Revisión Sistemática y Metaanálisis Comparativo
- ChatGPT en la Práctica Clínica, Investigación y Educación Médica: Una Revisión Sistemática
- Aplicación de la Ciencia de Datos en Medicina: Innovando en la Era Digital – Tipos de Datos
- Caso Clínico No 1: El enigma de una paciente con artritis reumatoide y síntomas neuromusculares.
- Inteligencia Artificial y gestión de Medicamentos en Atención Primaria
Te interesó este contenido?
Déjame tu nombre y correo en el formulario de contacto para notificarte sobre contenido relacionado que publique en este blog.
Accede a otras publicaciones sobre administración en salud y gestión clínica, aquí.
Oscar Efrem García Fernández