En la década de 1980, Hans Moravec, un científico de la IA, descubrió una paradoja: lo que es fácil para los humanos, como la comprensión visual o auditiva, es difícil para las máquinas.

Las cosas han cambiado desde entonces. Las IA de hoy son mucho mejores para entender lo que ven. No es que AI haya alcanzado a todas nuestras capacidades visuales humanas, sino que la tecnología se está desarrollando de diferentes maneras.

Cuando pensamos en la IA, pensamos en pura automatización. Esto ya no es verdad. ¿Pensaste, por ejemplo, que la IA nunca podría reemplazar a los fotógrafos de retratos? Piensa otra vez; Ni siquiera necesita un modelo. Hoy tenemos IA que podemos “imaginar”, es decir, según la definición de Merriam-Webster, formar una imagen de “algo que no está presente para los sentidos o nunca antes percibido del todo en la realidad”.

El secreto detrás de la imaginación AI

El mecanismo que otorga a AI con poderes imaginativos tiene un nombre: Redes de adversarios generativos (GAN). GANs fueron inspirados en parte por la investigación de la neurociencia. En esencia, las GAN consisten en dos entidades que compiten entre sí y aprenden entre sí: una aprende a generar falsificaciones, mientras que otra aprende a detectar falsificaciones. A medida que el detector falso se vuelve más efectivo, también lo hace el generador falso. Los neurocientíficos han descubierto que usamos un mecanismo relacionado, el modelo de actor-crítico, que se cree que se encuentra bastante en medio de nuestros cerebros.

Si la imaginación ya no es un privilegio de la mente humana, ¿cómo podemos aprovechar la imaginación de los AI? Aquí está una muestra de lo que está sucediendo en los laboratorios en este momento.

Convirtiendo la noche en día: que haya GANs

La imaginación tiene una aplicación directa: adivinar la representación de un sujeto de una manera diferente, o en otras palabras, traducir una imagen de una representación a otra. Por ejemplo, esta IA imagina cómo sería el boceto de una fotografía, o cómo sería la versión en color de una fotografía en blanco y negro.

Una aplicación de traducción de imágenes es ayudarnos a ver el mundo de una manera más legible, o más allá de lo que es visible.

Esta IA, mientras tanto, simula el día desde una imagen nocturna. Esto es valioso, ya que crear autos autónomos que funcionen y puedan ubicarse de manera precisa en cualquier situación (día, noche, niebla, lluvia, nieve, etc.) requiere una gran cantidad de datos que cubran todos los escenarios. Recolectar grandes cantidades de datos en todas las condiciones es prácticamente muy difícil, ya que ciertas condiciones (como la nieve) ocurren muy raramente en algunas áreas. En lugar de recopilar más datos, los científicos han ideado esta solución de la noche a la mañana. Esto también podría llevar a una mejor visión nocturna para los militares, pilotos de aviones y conductores humanos.

Cuando algo no se ve directamente, las GAN se utilizan para hacer suposiciones informadas. Tomemos el caso de BodyNet AI (ver más arriba), que estima la forma del cuerpo de una persona a la que se le da una imagen de ellos completamente vestidos. El maniquí digital es útil para diseñar ropa a medida sin tomar medidas a mano o con la ayuda de sofisticados escáneres corporales.

¿Y si pudiéramos ver a través de las paredes? Esta IA puede, literalmente, ayudarte a rastrear cómo las personas se mueven detrás de las paredes. Similar a cómo los murciélagos ven en la oscuridad, se emite una señal y se interpreta lo que regresa. Los murciélagos emiten ultrasonidos que se reflejan en la superficie de los objetos cercanos. Aquí, son las señales en el rango de WiFi que se emiten. Como el WiFi puede atravesar las paredes, pero nuestro cuerpo humano lo refleja en parte, esta señal se interpreta mediante una arquitectura de aprendizaje profundo.

Máquinas de descubrimiento

La capacidad de hacer conjeturas educadas no se limita a la generación de imágenes o traducciones. La imaginación es, en un sentido más amplio, una herramienta para el descubrimiento, y tiene aplicaciones en diversos dominios, como la ciberseguridad o diseño de drogas.

Las herramientas modernas de ciberseguridad cuentan con AI que pueden detectar amenazas al observar sus características. Los investigadores han diseñado una GAN que aprende a generar piezas de código maligno que pueden evitar estos detectores de ciberseguridad. Eso puede sonar aterrador, pero la buena noticia es que también podríamos usarlo para detectores perfectos de códigos malignos, o, si lo piensas, a veces el engaño puede ser bueno, como cuando diseñamos drogas para combatir enfermedades.

La 4ª Revolución industrial no se trata solo de la automatización, sino de la colaboración entre personas y máquinas y la simbiosis. Las GAN son un punto de inflexión en el desarrollo de la IA y nos ayudarán a mejorar nuestras capacidades mentales.

También son una herramienta con la que podemos estudiar los mecanismos de la imaginación y ayudarnos a comprender mejor el papel de la imaginación en dominios como la traducción o el descubrimiento. Aunque la imaginación no es igual a la creatividad, es una de las herramientas que utilizamos para inventar cosas nuevas. ¿Cuáles son las piezas faltantes, aún por descubrir, que nos permitirán construir máquinas que también pueden ser más astutas que nosotros en el ámbito creativo?

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.