Desmitificando el papel de la Inteligencia Artificial en la crisis del coronavirus
Ha llovido mucho desde que Google se estrelló en 2013 con su Flu Tracker, con el que esperaba poder predecir los brotes de enfermedad. La Inteligencia Artificial (IA), los algoritmos, el llamado big data (procesamiento masivo de datos) y el aprendizaje automático han evolucionado mucho en los últimos siete años, pero es preciso poner los pies sobre la tierra y no sobreestimar los beneficios que puede traer consigo en la crisis del coronavirus.
La publicación Technologie Review del prestigioso MIT ha publicado un artículo con el que pretende poner en su sitio las expectativas que debiéramos tener de la IA en este asunto. El MIT alerta sobre cómo se está exagerando el papel que puedo cumplir la IA a la hora de combatir enfermedades como el coronavirus. ¿Tiene utilidad? Por supuesto. ¿Tanta como algunas fuentes interesadas están vendiéndonos? Al parecer, no.
Vayamos por partes., considerando que las tres grandes áreas en las que puede tener un papel importante son el la predicción (alerta temprana), el diagnóstico y el tratamiento. La compañía de IA BlueDot, especializada en utilizar tecnologías de aprendizaje automático para monitorizar brotes de enfermedades infecciosas en todo el mundo, fue quien dio la primera alerta sobre un caso inusual de casos de neumonía en Wuhan (China), donde arrancó la pandemia. Nueve días después, la OMS (Organización Mundial de la Salud) comenzaría a hablar de Covid-19. A las luces de alarma encendidas por BlueDot se sumaron, además, las del Boston Children’s Hospital o la compañía Metabiota, en San Francisco.
¿Cómo llegaron a esta conclusión? La tecnología que utilizan empresas como BlueDot o Metabiota se basa en algoritmos capaces de procesar el lenguaje natural (PNL, por sus siglas en inglés), cruzando información de medios de comunicación, informes médicos, viajes aéreos, etc. en los más diversos idiomas. Otra fuente de información que incluyen algunos análisis, como los realizados por Stratifyd (Carolina del Norte, EEUU), son las redes sociales.
Desde el MIT indican que los resultados que se obtienen con estas técnicas arrojan un nivel de precisión razonable. Así, Metabiota fue capaz de predecir en febrero, con un margen de error de unas 30.000, el número de personas infectadas que habría en todo el mundo a un mes vista. También atinó en los focos de infección mayoritarios, destacando China, Italia e Irán; erró al incluir también EEUU.
Entonces, ¿por qué se está exagerando? Porque uno de los problemas que identifica el MIT es que, a medida que la pandemia progresa, se pierde precisión. ¿Por qué? Porque cada vez resulta más complejo recolectar datos confiables, con inconsistencias en los modos de contagio, los síntomas, los periodos de incubación, etc. Demasiado ruido, que es el peor enemigo de los algoritmos.
Al ruido mencionado para poder predecir la tasa de propagación, se suma también la falta de información de variables tan determinantes como el número de personas que teletrabaja, que viaja a pesar de las recomendaciones, etc. Dicho de otro modo, es muy complicado tener una imagen fiel de la realidad para, a partir de ella, poder generar predicciones.
La privacidad y la protección de datos personales también entra en juego, porque la necesidad de compartir información de historias médicas es esencial. Los hospitales tendrían que ser capaces de facilitar información (aunque fuera anonimizada) de pacientes de riesgo con pluripatologías, algo que no resulta sencillo dada la heterogeneidad de bases de datos y sistemas informáticos. Esta complejidad a la hora de obtener los datos que, son la materia prima de la IA, se extiende también al diagnóstico.
Es cierto que la IA es capaz de procesar tal cantidad ingente de información de cientos de miles de pacientes que puede detectar síntomas comunes que al personal médico le podría pasar inadvertidos... pero, claro, hay que contar con esa información y, como vemos en uno de los ejemplos que más se ha utilizado para poner en valor el big data en esta crisis, no es tan sencillo como pareciera:
La Universidad estadounidense Johns Hopkins ha desarrollado un mapa interactivo con toda la información a nivel mundial sobre el coronavirus. En el momento de publicación de este artículo, este mapa cifraba en 2.277 el número de casos infectados, con 54 muertes registradas. Sin embargo, nuestras autoridades sanitarias ya hablan de cerca de 4.000 infectados y 84 muertos.
Por otro lado, a la hora de obtener un tratamiento o desarrollar fármacos se utilizan algoritmos de diseño generativo, capaces de procesar millones de estructuras biológicas o moleculares y, en ese sentido, sí puede darse un salto cualitativo en la investigación.
La publicación Technologie Review del prestigioso MIT ha publicado un artículo con el que pretende poner en su sitio las expectativas que debiéramos tener de la IA en este asunto. El MIT alerta sobre cómo se está exagerando el papel que puedo cumplir la IA a la hora de combatir enfermedades como el coronavirus. ¿Tiene utilidad? Por supuesto. ¿Tanta como algunas fuentes interesadas están vendiéndonos? Al parecer, no.
Vayamos por partes., considerando que las tres grandes áreas en las que puede tener un papel importante son el la predicción (alerta temprana), el diagnóstico y el tratamiento. La compañía de IA BlueDot, especializada en utilizar tecnologías de aprendizaje automático para monitorizar brotes de enfermedades infecciosas en todo el mundo, fue quien dio la primera alerta sobre un caso inusual de casos de neumonía en Wuhan (China), donde arrancó la pandemia. Nueve días después, la OMS (Organización Mundial de la Salud) comenzaría a hablar de Covid-19. A las luces de alarma encendidas por BlueDot se sumaron, además, las del Boston Children’s Hospital o la compañía Metabiota, en San Francisco.
¿Cómo llegaron a esta conclusión? La tecnología que utilizan empresas como BlueDot o Metabiota se basa en algoritmos capaces de procesar el lenguaje natural (PNL, por sus siglas en inglés), cruzando información de medios de comunicación, informes médicos, viajes aéreos, etc. en los más diversos idiomas. Otra fuente de información que incluyen algunos análisis, como los realizados por Stratifyd (Carolina del Norte, EEUU), son las redes sociales.
Desde el MIT indican que los resultados que se obtienen con estas técnicas arrojan un nivel de precisión razonable. Así, Metabiota fue capaz de predecir en febrero, con un margen de error de unas 30.000, el número de personas infectadas que habría en todo el mundo a un mes vista. También atinó en los focos de infección mayoritarios, destacando China, Italia e Irán; erró al incluir también EEUU.
Entonces, ¿por qué se está exagerando? Porque uno de los problemas que identifica el MIT es que, a medida que la pandemia progresa, se pierde precisión. ¿Por qué? Porque cada vez resulta más complejo recolectar datos confiables, con inconsistencias en los modos de contagio, los síntomas, los periodos de incubación, etc. Demasiado ruido, que es el peor enemigo de los algoritmos.
Al ruido mencionado para poder predecir la tasa de propagación, se suma también la falta de información de variables tan determinantes como el número de personas que teletrabaja, que viaja a pesar de las recomendaciones, etc. Dicho de otro modo, es muy complicado tener una imagen fiel de la realidad para, a partir de ella, poder generar predicciones.
La privacidad y la protección de datos personales también entra en juego, porque la necesidad de compartir información de historias médicas es esencial. Los hospitales tendrían que ser capaces de facilitar información (aunque fuera anonimizada) de pacientes de riesgo con pluripatologías, algo que no resulta sencillo dada la heterogeneidad de bases de datos y sistemas informáticos. Esta complejidad a la hora de obtener los datos que, son la materia prima de la IA, se extiende también al diagnóstico.
Es cierto que la IA es capaz de procesar tal cantidad ingente de información de cientos de miles de pacientes que puede detectar síntomas comunes que al personal médico le podría pasar inadvertidos... pero, claro, hay que contar con esa información y, como vemos en uno de los ejemplos que más se ha utilizado para poner en valor el big data en esta crisis, no es tan sencillo como pareciera:
La Universidad estadounidense Johns Hopkins ha desarrollado un mapa interactivo con toda la información a nivel mundial sobre el coronavirus. En el momento de publicación de este artículo, este mapa cifraba en 2.277 el número de casos infectados, con 54 muertes registradas. Sin embargo, nuestras autoridades sanitarias ya hablan de cerca de 4.000 infectados y 84 muertos.
Por otro lado, a la hora de obtener un tratamiento o desarrollar fármacos se utilizan algoritmos de diseño generativo, capaces de procesar millones de estructuras biológicas o moleculares y, en ese sentido, sí puede darse un salto cualitativo en la investigación.
Sin comentarios