Un algoritmo que puede predecir donde impactará la pandemia

 

Abrir o cerrar la economía local ha sido uno de los mayores retos globales y cada decisor público tiene sus propios instintos y puntos de referencia. Por ejemplo, ¿será cuando los hospitales alcancen el 70% de ocupación, o será cuando haya aumentos significativos en el número de casos o de muertes por covid19?

Especial de Laszlo Beke

Algunos mandatarios, como los gobernadores de Florida, California y Texas aprendieron recientemente que esos indicadores pueden ser un sistema de alarma malo. Una vez que el coronavirus encuentra una apertura en la población, toma una ventaja de dos semanas sobre los responsables de la salud, circula y se multiplica velozmente antes que su reaparición se haga aparente en los hospitales y en los sitios de pruebas

Ahora un equipo internacional de científicos, dirigido por los Doctores Santillana y Kogan de Harvard, así como científicos de la universidades de Maryland, Stanford, Salzburg y Northeastern, han desarrollado un modelo que puede predecir los brotes unas dos semanas antes que estos ocurran, tiempo suficiente para aplicar medidas de contención. Se trata de un algoritmo, que registra el peligro 14 días antes que el número de casos comience a crecer y podría funcionar “como un termostato en sistema de calentamiento o enfriamiento, para guiar la activación o el relajamiento intermitente de las intervenciones de salud pública”.

En la mayoría de los modelajes de enfermedades infecciosas, se proyectan diferentes escenarios basado en presunciones previas. Lo que se hace en este caso es observar, sin realizar supuestos previos. Los métodos responden a cambios inmediatos en el comportamiento y estos son incorporados. Fuentes de data alternativas y de próxima de generación pueden proveer señales tempraneras de prevalencia creciente de Covid19.

El uso de análisis de datos en tiempo real para medir la progresión de una enfermedad se remonta por lo menos hasta el año 2008, cuando los ingenieros en Google comenzaron a estimar las visitas a los médicos por gripe haciendo seguimientos a tendencia basadas en palabras como “sentirse cansado”, “dolor de articulaciones”, “dosis de algún medicamento asociado” y muchas otras. El Algoritmo de la Gripe de Google, como se le conoció, dio resultados pobres. Desde esa época se han hecho múltiples ajustes a este enfoque, combinando las búsquedas en Google con otra data. Ya sabemos que una sola fuente de data no es útil en forma aislada.

Múltiples fuentes de datos

La contribución de este estudio es que usa una variedad de flujos de datos. El equipo analizó data en tiempo real de cuatro fuentes, además de Google: mensajes relacionados a Covid en Twitter y geolocalizados, búsquedas de médicos en la plataforma médica UpToDate; data anónima de movilidad en teléfonos inteligentes y lecturas del Termómetro Inteligente Kinsa cargada desde una App. Integró estos flujos de datos con un sofisticado modelo de predicción desarrollado en Northeastern University, basado en la forma en que las personas se mueven e interactúan en comunidades.

Predicciones

El equipo hizo pruebas del valor predictivo de las tendencias en el flujo de datos al revisar como cada una de ellas se correlacionaba con el conteo de casos y muertes en los meses de Marzo y Abril en cada estado. Como ejemplo, en Nueva York un agudo aumento de mensajes relacionados con Covid en Twitter comenzó más de una semana antes que el número de casos explotara a mediados de Marzo; las búsquedas relevantes en Google y las mediciones en Kinsa tuvieron picos días antes.

El equipo combinó sus fuentes de datos, asignando pesos relativos de acuerdo a su correlación con el siguiente aumento en número de casos. Este algoritmo “armonizado” anticipó los brotes en un promedio de 21 días. Viendo hacia el futuro, está prediciendo que probablemente Nebraska y New Hampshire tendrán un aumento de casos en las próximas semanas si no son tomadas medidas adicionales, a pesar de que el conteo de casos es llano en este momento.

Comportamiento de las masas

Los analíticos de Big Data no pueden predecir cambios en el comportamiento de las masas mejor que otros modelos tradicionales. No existe algoritmo que hubiera podido predecir las masivas protestas como resultado de la muerte de George Floyd o las grandes manifestaciones que hubieran podido incubar nuevos estallidos, a pesar de las precauciones de los participantes.

Aplicación pública

Organismos públicos de salud, que también consultan data en tiempo real en las redes sociales y otras fuentes, no han hecho este tipo de algoritmo la base de sus pronósticos. Ellos aseguran que la data es extremadamente valiosa para ellos, pero necesitan que los modelos sean verificados y validados a través del tiempo. Conociendo los retos persistentes y repetitivos del coronavirus y la falta de adecuación de la infraestructura existente de salud pública eso es cierto. Hay una necesidad urgente y no hay escasez de data.


Hace referencia a  Can an Algorithm Predict the Pandemic’s Next Moves? An Early Warning Approach to Monitor COVID-19 Activity with Multiple Digital Traces in Near Real-Time. También aparece en mi blog https://bit.ly/3fCy5Sw.