¿Hasta la ciencia será cambiada por la Inteligencia Artificial?

¿Hasta la ciencia será cambiada por la Inteligencia Artificial?

 

Inteligencia Artificial ya puede acelerar y hacer más eficientes los procesos científicos existentes, pero podría ir mucho más allá, transformando incluso la forma en la cual se realiza la ciencia. Transformaciones de esta índole han ocurrido antes: (a) en el S.XVII con la aparición del método científico, los investigadores pudieron confiar en las observaciones experimentales y la teoría que se derivó de ellos.





Especial de Laszlo Beke

Este proceso, apoyado en las publicaciones científicas le permitió a los científicos compartir sus descubrimientos y alentó a otros a aplicar y construir sobre los resultados. Todo ello llevó a lo que hoy se denomina la revolución científica y (b) otra transformación en el S.XIX llevó a la creación de laboratorios de investigación, fábricas de innovación donde era posible combinar y escalar ideas, gente y materiales. La evolución transformó la ciencia, abriendo nuevos ámbitos de investigación y descubrimiento. Inteligencia Artificial podría provocar algo similar, no solamente generando resultados, sino también creando nuevas maneras de alcanzar esos nuevos resultados.

Descubrimiento-basado-en Literatura

En inglés se denomina “Literature-based discovery (LBD)” y apunta a lograr nuevos descubrimientos a través del análisis de la literatura científica. Puede ayudar a los investigadores a descubrir y explorar hipótesis rápidamente, para obtener información sobre avances relevantes dentro y fuera de sus nichos de experticia y también para incrementar el intercambio de información interdisciplinaria. El primer sistema LBD fue construido en la década de 1980, pero el hecho que los sistemas de Inteligencia Artificial son mucho más capaces de procesar lenguaje natural y disponen de un corpus mucho más amplio de literatura científica está proyectando la relevancia del Descubrimiento-basado-en Literatura. El tipo más básico y extendido de LBD se denomina el paradigma ABC, porque se centra en tres conceptos llamados A, B y C. Este establece que si hay una conexión entre A y B y otra entre B y C, entonces hay una entre A y C. Esta última existe, aún cuando no se haya declarado explícitamente o no haya sido explorada todavía.

LBD se ha aplicado predominantemente en el dominio de la salud, donde se han generado resultados prometedores, pero se puede aplicar en cualquier dominio donde haya una gran cantidad de literatura disponible para su análisis. Algunos ejemplos ilustran las posibilidades:

Incrustaciones de palabras – El año 2019 en un laboratorio en Berkeley se utilizó la técnica de Aprendizaje No Supervisado de Inteligencia Artificial con resúmenes de papers en ciencias de los materiales, para extraer información sobre diferentes materiales y convertirlos a representaciones matemáticas denominadas “incrustaciones de palabras”. Estas colocan los conceptos en un espacio multidimensional donde se pueden agrupar conceptos similares, lo cual les permite sugerir materiales con propiedades similares a otro material. Aun cuando no existía en la literatura, la Inteligencia Artificial permitió sugerir materiales con propiedades termoeléctricas. Al seleccionar los 10 candidatos más promisorios, resultó que todos ellos tenían particularmente poderosas propiedades termoeléctricas.

Métodos de inferencia basados en el lenguaje – es un campo nuevo de investigación en la intersección entre el procesamiento del lenguaje natural y la ciencia. En el ejemplo anterior, los investigadores reentrenaron el sistema, omitiendo todos los papers recientes y le pidieron al sistema que predijera los nuevos materiales termoeléctricos que serían descubiertos en los años siguientes. El sistema de Inteligencia Artificial fue ocho veces más preciso que lo que podría esperarse puramente al azar. Incluso predijo la aparición de nuevos términos como “fotovoltaico”.

Sistema que toma en consideración conceptos y autores de los papers – Este sistema resultó dos veces mejor pronosticando nuevos descubrimientos que aquel dedicado exclusivamente a conceptos y además pronosticó a los descubridores con 40% de mayor precisión.

Identificación de hipótesis “extrañas” – Aquí la Inteligencia Artificial le pide al modelo que evite lo típico y busque hipótesis “extrañas”, pero científicamente plausibles, que pudieran ser descubiertas en un futuro cercano. De esta manera el sistema puede acelerar el descubrimiento y sondear “puntos ciegos” donde se pueden esperar nuevos descubrimientos.-

Colaboradores potenciales – Estos sistemas también puede sugerir colaboradores científicos potenciales, que no se conocen entre ellos. Este enfoque es particularmente interesante cuando se quiere involucrar a personas en diferentes campos científicos.

Servicio de emparejamiento científico – En la medida que los sistemas BLD se van extendiendo se harán más capaces, incluyendo tablas, gráficos y data como la secuencia genética y la programación del código. En el futuro se podrá confiar en esos sistemas para monitorear la avalancha de papers científicos, para resaltar los resultados relevantes, para sugerir hipótesis novedosas para la investigación y para la conexión con socios potenciales. Se parecerá mucho a un servicio de casamentero científico.

“Robots Científicos” o “Laboratorios Autónomos”

Son una combinación de inteligencia artificial y robótica que pueden automatizar experimentos científicos y acelerar el ritmo del descubrimiento. Estos laboratorios pueden ayudar a los investigadores a descubrir y explorar hipótesis rápidamente, así como a obtener información sobre avances relevantes dentro y fuera de sus nichos e incrementar el intercambio de información interdisciplinaria y específicamente:

– Proveen conocimiento sobre un área de investigación, en la forma de data, papers y patentes.

– Usan Inteligencia Artificial para formar hipótesis, llevar a cabo experimentos, analizar resultados, modificar las hipótesis y repetir el ciclo.

– Adam, una máquina construida en el Reino Unido en 2009, hizo experimentos en las relaciones entre genes y enzimas en el metabolismo de la levadura. Fue la primera máquina en hacer descubrimientos en forma autónoma.

– La sucesora de Adam se llama Eva y realiza experimentos para el descubrimiento de medicamentos. Eva, en la planificación y análisis de experimentos usa lenguaje de máquina para crear “relaciones de actividad de estructura cuantitativa” (qsars), que son modelos matemáticos que relacionan estructuras químicas con efectos biológicos. Eva descubrió el triclosán, un componente antomicrobiano que se usa en la pasta de dientes, para inhibir un mecanismo esencial en parásitos que causan malaria.

– Robots científicos pudieran transformar la ciencia de otra forma; ayudando a resolver algunos de los problemas de la iniciativa científica. Uno de ellos, es que la ciencia se está haciendo menos productiva y se hace más difícil y costoso empujar hacia las fronteras del conocimiento. Existen varias teorías que intentan explicar esto, una de ellas es que los descubrimientos más fáciles ya se hicieron y los científicos requieren más entrenamiento para alcanzar la frontera. Sistemas basados en Inteligencia Artificial pudieran ayudar a realizar trabajo de laboratorio en formas más rápida, más económicamente y con mayor precisión.

La crisis de la reproducibilidad

En teoría, cuándo los científicos publican sus resultados, otros pueden replicarlos y verificar el trabajo presentado. Sin embargo, hay muy poca gloria en la replicación, por lo cual no es muy común. Cuando la replicación se lleva a la práctica, muchos intentos fallan, lo cual hace pensar que el trabajo original era inválido o incluso que pudiera ser fraudulento. Los científicos tienen pocos incentivos para repetir el trabajo de otros, y se encuentran bajo presión para publicar nuevos resultados y no para verificar los de otros. Aquí de nuevo, los Robots Científicos pueden ayudar en algunas áreas de investigación, donde biología molecular es una de estas. A las máquinas no les molesta publicar las verificaciones de trabajos previos, ni son incomodados por la publicación de resultados negativos. La automatización tiene el potencial de mitigar esta crisis de la reproducibilidad, por cuanto evita los desincentivos sociológicos y profesionales asociados a la replicación.

La superación de obstáculos

Aparte de mejor hardware y software y mejor integración entre ambos, hay una mayor necesidad de mayor interoperabilidad entre los sistemas de automatización del laboratorio y los estándares comunes que permiten a los algoritmos de Inteligencia Artificial intercambiar e interpretar información semántica. La introducción de microplacas, conteniendo cientos de tubos de ensayo mínimos para permitir que las pruebas de laboratorio pudieran ser procesadas en lotes, aumentó la productividad inmensamente para ciertos tipos de análisis. Algo similar necesita ocurrir con la data. Curiosamente, mucha de la data de las microplacas termina en hojas de cálculo o tablas en los papers, donde no es legible por las máquinas.