Ciencia, cerebros y máquinas

La explicación científica arrinconada entre las olas de la neurociencia y el boom del machine learning

Introducción

Cibernética (o control y comunicación en el animal y la máquina), es un libro pionero con el que Nobert Wiener dio nombre a una disciplina en la primera mitad del S. XX. Allí, el simpático hombrecito reflexiona que la mejor ciencia es reflejo de los desafíos tecnológicos de su tiempo. La suya fue una era de la información permitida por la separación entre la señal que controla un mecanismo y la potencia que provee la energía. Esta es, a su vez, una distinción conceptual que se había vuelto práctica gracias a inventos revolucionarios de la época, como el transistor. Hoy, los transistores se han vuelto infinitesimalmente pequeños e infinitamente numerosos (hay 2 mil millones sólo en el chip del Iphone 6). Ya no nos desvela cómo transmitir información fidedignamente a través del planeta sino poder abarcarla y destilar del diluvio actual algo que nuestras mentes finitas puedan llamar significado. En paralelo, nuestra idea de lo que significa comprender el Universo y sus manifestaciones ha cambiado irreversiblemente. El objetivo de estos apuntes es bosquejar el efecto de esa transformación en el estado actual de la explicación científica.

El sitio del pensamiento

Por un momento, dejemos de lado la ciencia y el Universo aquel y detengámonos en un acto mental simple. Pensemos en alguien calculando una división tediosa con lápiz y papel. Tenemos la intuición de que el acto cognitivo debe suceder seguramente en el cerebro. Pero esto no es tan evidente. O, si no, ¿para qué necesitamos el papel al calcular? La atención recorre los dígitos en laborioso orden, observando un método estricto. El lápiz da testimonio de resultados parciales (“siete, me llevo uno, lo anoto chiquito acá arriba”). ¿Diríamos que el cómputo ocurre en el cerebro? ¿O es en ese momento el papel parte de su sustrato material? ¿Y del de la mente? ¿Es la memoria una facultad mental?
Por otra parte, como es obvio, para saber algo no hay que −necesariamente− poder articularlo con palabras. Nadie nos explica cómo reconocer un rostro, ni probablemente los bebés usen una teoría del lenguaje para aprender a hablar (mal que le pese a Chomsky). Hace 25 siglos, Sócrates se dedicaba a torturar atenienses con largos interrogatorios en donde quedaba en evidencia que, pese a que ellos se sabían capaces de reconocer un acto justo o algo bello cuando lo veían, no eran capaces de articular definiciones satisfactorias. El gran problema del saber no verbal es nuestra incapacidad de transmitirlo (basta con pedirle a Djokovic que te chatee cómo jugar al tenis y después probar en la cancha el historial de la conversación).
Hasta hace no tanto, la explicación científica era algún tipo de razonamiento verbal en nuestras mentes y en el peor de los casos descansando en la muleta del lápiz y papel. ¿Qué pasa, en cambio, cuando no somos capaces de aprender algo pero sabemos construir una máquina que aprende? El uso de computadoras para realizar tareas no es en algún sentido distinto del lápiz o de un ábaco. La diferencia está en que este cuaderno tiene más hojas que la biblioteca más grande y las fichas de este ábaco se mueven miles de veces más rápido que la capacidad de disparo de nuestras neuronas. No podemos ni queremos seguir con nuestros ojos cada uno de esos movimientos. Esta vez confiamos en que las leyes rígidas que impusimos a la máquina sean suficientes para que nuestra mentecita pueda descansar y el cómputo transcurra definitivamente fuera del cerebro.
No tenemos una teoría del spam (aunque lo reconocemos cuando lo recibimos). Pero no hace falta. La computadora tampoco la tiene, pero aprende a protegernos de la lluvia de ofertas, promociones y dudosos alargadores de cosas. Facebook reconoce a nuestros amigos cuando subimos una foto y Netflix nos recomienda películas. Nada de eso parece molestarnos, pero algo pica cuando en la ciencia también, cada vez más, nos enfrentamos a la existencia de una computadora capaz de identificar estructuras en los datos experimentales de una manera que supera nuestras limitaciones (el tamaño de nuestra memoria, la velocidad de nuestras manos y, quizás, hasta nuestra creatividad).
Lo más llamativo es que, en cierto aspecto, la forma en que la computadora aprende podría no ser siempre absolutamente diferente a la nuestra. El caso del reconocimiento de rostros fue, hasta hace un par de años, emblema del tipo de tarea para la que somos imbatibles frente a la computadora. Algunos algoritmos con los que hoy las computadoras aprenden esa tarea están inspirados en una imagen caricaturesca de la organización de la corteza visual, con elementos de cómputo que quieren parecer neuronas, reglas de aprendizaje que cambian las conexiones entre ellas, y una organización colectiva en capas de procesamiento cada vez más abstractas que imitan las sucesivas áreas del cerebro. Sin embargo, el parecido se termina ahí. A diferencia de nosotros, estas redes neuronales requieren enormes cantidades de ejemplos etiquetados para aprender a reconocer un nuevo tipo de objeto, mientras a que nosotros nos basta con un única imagen de un Pokemon para recordarlo o, más aún, para entenderlo como tal. Quizás el momento donde uno más intuye que un abismo nos separa de la máquina se revela en sus sesgos y sus errores. Cuando se le pide al software de reconocimiento de imágenes de Google que produzca (o delire, sueñe), la imagen de una pesa, esta aparece invariablemente acompañada de un brazo humano sosteniéndola: el sistema pareciera nunca haber visto fotografías de una pesa sola. Evidentemente, reconocer objetos es algo más que ser capaz de aparear imágenes con la etiqueta correspondiente.

pic.twitter.com/dinhq6MrHn

— El Gato y La Caja (@ElGatoyLaCaja) August 18, 2016
Otras aplicaciones de la inteligencia artificial nos dejan una sensación similar. Hace unos años, la computadora Watson de IBM derrotó a competidores humanos expertos en el programa de preguntas y respuestas ‘Jeopardy’, en un verdadero hito del procesamiento del lenguaje natural computarizado. Un vistazo a las opciones que consideraba la máquina antes de dar una respuesta final nos hacen pensar que su mundo mental era algo exótico. Así, cuando la pregunta era acerca de la proteína que otorga rigidez a las espinas del erizo (la respuesta es ‘queratina’) Watson contestó correctamente, pero también consideraba viable responder ‘puercoespín’ y ‘pelaje’. No hace falta haber tomado el café del desayuno para darse cuenta inmediatamente de que esas opciones no son siquiera incorrectas. Son, sencillamente, inadmisibles para cualquiera que interprete la pregunta como un ser humano.

La ciencia de todos los días ya no es lo que era

Si el aprendizaje de las computadoras no es más que el cómputo ciego de algunos miles de millones de ábacos siguiendo reglas rígidas, ¿por qué cambiarían en algo la forma en que entendemos la ciencia? ¿Qué nos entrega la aplicación de un algoritmo en la ciencia que no puede producir un cerebro con otras herramientas? Para responder eso, pensemos un minuto en las grandes teorías de la humanidad. Desde Newton, la física fue la reina indiscutida del entendimiento moderno y es fácil ver por qué. Al sabor de victoria sobre el cosmos que nos deja el abarcar con la mente la órbita de los planetas, se suman otros factores menos emocionantes. La física hace predicciones. Predicciones cuantitativas. Los números no dependen de nuestros adjetivos, opiniones o sentimientos. Extirpan lo subjetivo para dar lugar a lo intersubjetivo y reproducible: ¿Tu medición de la aceleración de la gravedad arroja un valor de 9.8 pirulines? Jodeme, ¡la mía también! Y las predicciones cuantitativas, en su mejor versión, conducen a sorpresas cualitativas. Irregularidades en la órbita de Urano llevaron a Le Verrier a predecir la existencia de Neptuno, quien tuvo así el irrepetible honor de descubrir un planeta ‘con la punta de su lápiz’. Atravesando las predicciones numéricas y la adrenalina del dominio sobre el cosmos, encontramos el tercer pilar del atractivo de la física, algo más elusivo pero no menos fundamental: la promesa de unificación conceptual. ¿Cuál es el poder simbólico de la manzana de Newton sino la idea de que la misma ley gobierna tanto a los astros como a los objetos del mundo cotidiano? No puedo exagerar la importancia de esa primera gran unificación, que fue seguida por varias otras, y la noción de que gracias a ellas hemos accedido a una verdad más profunda que la suma de todos nuestros experimentos. A algo de esto se refería Rutherford, desafiante, al declarar que ‘la ciencia es física o filatelia’.
Acá una estampilla de Rutherford. Porque ironía não tem fim.
Este es el mito fundacional que alimentaba a la filosofía de la ciencia de fines del siglo XIX y principios del XX, donde el conocimiento científico tendía a ser pensado como un conjunto de afirmaciones generales, proposiciones bien formadas e independientes entre sí (en el sentido de ser pasibles de ser revisadas una por una). Wittgenstein, cuyo logicismo semi místico fue muy influyente para esta visión, allanó el camino para su desmoronamiento, insistiendo en que no tenía sentido hablar del significado de las oraciones separado del comportamiento de los hablantes. Este giro tuvo un correlato en la filosofía de la ciencia. En términos de impacto popular, el portavoz de esa nueva concepción de la ciencia fue Kuhn, quien consideró las teorías en relación a la práctica profesional. Si con Wittgenstein el lenguaje es un juego entre hablantes, con Kuhn las proposiciones dejaron lugar a los científicos y su labor comunitaria. En la medida en que la comunidad científica sienta que está pudiendo trabajar bien y avanzando, las teorías (paradigmas, disculpen) son exitosas.
Me importa destacar el aspecto artesanal o industrial de la actividad científica, porque, creo, allí se explica gran parte del impacto que han tenido las computadoras y la implementación de algoritmos estadísticos de aprendizaje en el pensamiento de los últimos años. No olvidemos que los científicos ven su propia producción cuantificada en términos de la cantidad y el impacto de sus artículos publicados (i.e., el número de citas). Para publicar, deben convencer a sus pares de haber producido un ‘quantum’ de información científica digna de ser compartida. Cuando lo consiguen de manera consistente obtienen financiamiento para investigaciones subsiguientes. De manera creciente, cierta lógica del capitalismo empresarial se filtra en la producción de conocimiento básico y aplicado, y la distinción entre ambos es a su vez vertiginosamente menos nítida. Paradójicamente, algo del espíritu capitalista primitivo subyace al espíritu original de la ciencia: el ideal del pensador independiente de la autoridad, que por la fuerza de su propia capacidad argumentativa en diálogo con lo concreto genera el nuevo conocimiento. Hoy a esa actitud se le diría emprendedorismo, en los círculos filoempresariales. ¿O no parecen los diarios y la Internet haber descubierto de novo la ‘innovación’ y la fantasía de que un hombre con una idea puede hacerse millonario desde su casa y sacudir (¿se dice disrumpir?) lo establecido? Y si a esto le sumamos que a muchos de los problemas más fascinantes de la época los atacan empresas de distintos tamaños, lo cierto es que estas terminan atrayendo científicos con algo más que un salario digno.
Considerado de este modo, el descubrimiento de verdades científicas no difiere, en la práctica, de la generación de invenciones útiles: ambos son productos válidos del artesano del pensar. Sin embargo, los separa lo que Braitenberg (en su libro de “Experimentos en psicología sintética”) llamó “la ley del análisis cuesta arriba y la invención cuesta abajo”: hallar rastros de lógica en algo en el mundo externo es mucho, mucho más difícil que incorporarla en las creaciones propias (Dante Chialvo creyó ver una tercera posibilidad en el estudio de la complejidad emergente: sistemas donde reglas sencillas dan lugar a comportamientos colectivos complejos). El análisis, la descomposición del fenómeno en sus causas, la discriminación entre lo importante y anecdótico, es un problema que requiere talentos excepcionales, cuando la mayoría somos seres ordinarios. En otras palabras, es mucho más difícil descubrir las leyes del electromagnetismo que inventar una pava eléctrica. Por eso recordamos los nombres de Faraday y Maxwell y no tanto el de ese alma generosa que nos facilitara el agua para el mate cada mañana.
La tremenda dificultad de encontrar lógica en el mundo exterior disminuye cuando, sin una teoría del todo explícita, somos capaces de diseñar un programa que aprenda esta estructura. Con la aparición de la computadora, el descubrimiento se vuelve invención. La máquina de repetición infinita de operaciones simples hoy es muchas veces una caja negra que arroja resultados ante problemas sobre los cuales no se tiene una predicción analítica, un cálculo con lápiz y papel que diga cómo es la cosa. Esa es la magia del machine learning: tomá un problema sin solución conocida, dáselo a un algoritmo de aprendizaje, mimalo, y esperá a que llegue una mini revolución técnica.
La aplicación de machine learning a problemas científicos parecería una especie de regresión: tratar el problema desde un nivel menos elevado que el conceptual. El nivel de la neurona, o de los pesos sinápticos, está en la jerarquía de sistemas emergentes del cerebro muy por debajo de la escala en que resulta lícito hablar de conciencia, del discurrir del lenguaje y las elaboraciones conceptuales. En psicología, se ha dicho que para resolver situaciones de alta complejidad, el razonamiento consciente no resulta a menudo beneficioso. Acaso en algún sentido, el machine learning provea una ciencia sin conciencia o, si se quiere, una manera científica de decidir sin hablar.

¿Leyes generales en un mundo de particulares? Same old same old

Parte de lo que sucede no es que el descubrimiento se ha vuelto invención por giros tecnológicos, sino que quizás hemos alcanzado un límite en cuanto a las preguntas simples disponibles que podemos responder. La física, con toda su matemática, es la ciencia de las preguntas directas y las respuestas en forma de ecuaciones generales que embellecen esta realidad sucia e imperfecta con la precisión del bisturí de un cirujano plástico. Hoy la carrera de física en las universidades es un lugar donde ‘los estudiantes no aprenden nada que haya sucedido después del nacimiento de sus padres’, refunfuñaba con cierta razón un profesor.
El polo opuesto en las ciencias naturales es, al parecer, la biología, donde estudiantes del primer año de la carrera discuten rutinariamente la literatura más reciente. Su objeto de estudio es, claro, la vida: esa construcción del azar donde perdura lo que… perdura. ¿Hay teorías ahí? Se ha dicho que la evolución es la única noción universal en biología. A simple vista, es una ciencia que ha seguido una ruta casi opuesta a la de la física, ahondando en sucesivos detalles, poniendo el esfuerzo en dilucidar el funcionamiento de unos pocos sistemas modelo concienzudamente elegidos. Como un estudioso de literatura que pretendiera que el estudio de La Divina Comedia a lo largo de una vida le regalara una visión de la poesía toda, el biólogo elige su sistema, su circuito genético, su proteína, su técnica, su organismo, y le reza platónicamente a la participación del universal en lo particular. Es un camino romántico que descansa en un acto de fe: que nuestra descripción particular arroje luz de una manera no siempre evidente acerca de unos principios generales que sólo intuimos. La biología es el camino de la alegoría. A veces trae salud y algunas bellas historias. Otras, libros de texto muy gordos.
Tal vez por este modo de avanzar en la literatura científica reina una confusión implícita entre hechos particulares y leyes: se estila titular los artículos científicos con una afirmación (‘X área del cerebro recibe proyecciones del área Y’, ‘C. elegans busca su comida siguiendo la estrategia Z’), dando a entender que la contribución de la publicación es establecer un hecho. Queda al lector juzgar la relevancia de dicha proposición para su campo, la ciencia o su propia relación con el Universo.

Vivimos revolcaos en un merengue y en el mismo lodo todos manoseaos

Lo cierto es que, entre la parálisis de la física tradicional, el ascenso de las supercalculadoras, la caída de la filosofía, las pretensiones de la neurociencia y el bodoque de la biología, nadie sabe bien dónde estamos parados ni qué diablos estamos haciendo, pero cada cual cobra su sueldo, si es que tiene.
Hay una ensalada jugosa de opiniones sobre qué debemos hacer. Grandes programas gubernamentales para juntar más y más datos. Tuiteros pragmáticos que afirman que el objetivo de la ciencia debería ser construir un pronóstico meteorológico, donde no tendremos grandes teorías pero sí el poder de anunciar qué va pasar mañana con cierta probabilidad. Un señor bastante piola llamado Surya Ganguli sugiere que se puede decir que entendemos un sistema complejo cuando tenemos una jerarquía de descripciones a distintas escalas, cada una capaz de explicar aspectos de su comportamiento en distintas resoluciones. O sea, seguir intentando buscar alguna simplicidad en la complejidad. ¿Tendremos algún día una descripción compacta pero poderosa, que describa lo que queremos saber en distintos niveles sin que debamos resolver exactamente cada caso particular acerca del cerebro, de los intercambios sociales, de la relación entre la organización del ser vivo y su ADN, de lo que hace gracioso a un chiste o de la felicidad de una civilización? Como pasa a veces, quizás la respuesta final sea ‘keep calm and learn python‘.

Srsly

El futuro del Espíritu

Mi fantasía no está tan lejos de un ‘keep calm’. Me gusta pensar que el problema de qué es entender va a dejar de ser importante porque nuestra mente individual va a dejar de ser el centro, así como nuestras células se resignaron a dejar de ser centrales y sacrificaron su mundo individual para pasar a ser organismo colectivo. Así, ¿es concebible que nosotros dejemos de ser los que cuenten esta historia? Hace un tiempo se estrenó una película de Herzog acerca del impacto de Internet en nuestras vidas. Lo decepcionante del documental es que está hilado alrededor de las historias de individuos. Es una historia vista con estructuras del pasado. Parece no darse cuenta del todo de que la Internet nos enfrenta a la materialidad del pensamiento de una forma novedosa: podríamos estar siendo átomos de un cerebro que piensa una realidad que no vemos, una que accede a conceptos más abstractos. Quizás encontremos una rara paz pensando que la magia de esta era es la aparición de estructuras espontáneas que apenas intuimos, formadas por individuos, máquinas, no se sabe bien qué. Ya hoy es tan tenue la línea que divide computadoras de pensamiento que hay ciencia ‘crowdsourced’, donde miles de humanos realizan cómputos sin saber siempre qué están haciendo (más que ayudar a la ciencia): reconocer la unión entre dos neuronas en una foto de microscopio, detectar puntos ‘raros’ en un mapa del universo. Historias contadas con estadística, historias de distribuciones de probabilidad.
En algún momento de la película de Herzog, alguien cuenta historias de la inteligencia artificial y surge la comparación trillada entre hombre y máquinas de “Blade Runner” o “¿Sueñan los androides con ovejas eléctricas?”. Algún espectador bosteza. Es posible que la analogía más correcta no sea con ese libro sino con “Solaris”: la aparición de una mente de escala planetaria, sensible a estructuras para nosotros invisibles, regularidades de muy alto nivel. El enjambre formado por nuestras neuronas aprende a ver sin una instrucción explícita, triturando en paralelo la información de todo el campo visual, extrayendo regularidades abstractas que llamamos objetos. ¿No podrá un ‘cerebro artificial’ conectarse a unos ‘ojos de internet’, masticar la información con poca guía y decirnos qué objetos hay ahí que no somos capaces de imaginar? ¿Qué sucede cuando una red neuronal en vez de ser conectada a la retina es conectada al tráfico de wikipedia, de las transacciones bancarias? El fin de la ciencia quizás en un sentido sea el fin de esta narrativa accesible individualmente.Cuando la integración esté completa (¿o ya habrá sucedido?), cerebros y máquinas serán tal vez subsistemas tan importantes y ajenos al fenómeno emergente de alto nivel como los grupos de neuronas que aprendimos a modelar. ¿Será algún día nuestra discusión un murmullo perdido en el sinnúmero de voces que delineen un Espíritu mayor flotando en el cosmos sin hablar con nadie? ¿Cómo debería sentirse exactamente ese estar integrado? ¿Cómo vamos a darnos cuenta cuando suceda, si es que aún no ocurrió? ¿Estaremos perdiendo el tiempo rezongando sobre un pasado conceptual perdido, una individualidad vetusta y un romanticismo para con nuestro soporte de agua, grasa y proteína cuando se abre un abismo de posibilidades por encima nuestro?