Un programa nuevo puede animar fotos viejas. Sin embargo, no hay nada humano en la inteligencia artificial
(CNN) — Es difícil explicar la mezcla de emociones que se generan al ver cómo cobra vida una foto de Frederick Douglass al tocar un botón. Y ahí está: parpadea y asiente con la cabeza como si ayer mismo hubiera estado vivo, como si no hubiera muerto en 1895, antes de que grabar películas se convirtiera en algo común.
Su imagen animada y otras parecidas, que son a la vez inquietantes, emotivas y un poco fantasiosas, son posibles gracias a Deep Nostalgia, un programa de inteligencia artificial de la plataforma de genealogía MyHeritage.
En lo que respecta a imágenes animadas mediante inteligencia artificial, la tecnología detrás de estas fotos del estilo Harry Potter no es particularmente compleja.
Se invita a los usuarios a que proporcionen fotos antiguas de sus seres queridos, y el programa utiliza el aprendizaje profundo para aplicar movimientos predeterminados a los rasgos de sus rostros. También crea momentos pequeños que no están en las fotos originales, por ejemplo mostrando los dientes o el costado de una cabeza. Todo junto genera un efecto que, aunque no parezca muy natural, te deslumbra.
Las reacciones a las imágenes de Deep Nostalgia —lágrimas al ver la sonrisa de una abuela, un sentimiento inquietante de conexión con un ícono de la historia muerto hace mucho tiempo— tocan un muro emocional misterioso entre nosotros y este tipo de tecnología que evoluciona con rapidez.
Nosotros confiamos en nuestra percepción y en las emociones
«El atractivo aquí es que las imágenes visuales son viscerales y convincentes y respondemos a ellas», dice Hany Farid, decano asociado y director de la Escuela de Información en UC Berkeley. «Somos seres visuales. Cuando ves que tu abuela o Mark Twain cobran vida, hay algo fascinante en ello», agrega.
Fascinante y sí, también un poco aterrador.
Nuestros cerebros, por muy sofisticados que sean, tienen una respuesta prehistórica a las cosas que son casi humanas, pero no del todo. A esto comúnmente se lo llama ‘valle inquietante‘. Una gran cantidad de deepfakes y manipulaciones de imágenes impulsadas por la inteligencia artificial activan esta campana de alarma antigua. Incluso MyHeritage aborda esta reacción en su explicación del programa.
«En efecto, los resultados pueden ser controvertidos y es difícil permanecer indiferente a esta tecnología», se puede leer en su página de preguntas frecuentes.
Procesamos diferente las imágenes de personas que las de objetos
Cuando se trata de la imagen de un pariente querido, las partes de nuestro cerebro que aman y temen se enfrentan entre sí, incluso si tenemos muy claro que lo que estamos viendo no es verdadero.
«La forma en que nuestro cerebro procesa las imágenes de las personas es diferente a la de los objetos inanimados. Accede a los circuitos neuronales», dice Farid. «Durante años hemos sido capaces de sintetizar objetos inanimados, y eso engaña por completo al sistema visual porque no tenemos nociones preconcebidas de cómo se mueven. Pero cuando se trata de humanos, queda rezagado. Parte de eso es la forma sutil en que nos movemos y reconocemos estos movimientos», explica.
«Mi sensación de asombro podría estar teñida de una sensación de terror», dijo La Marr Jurelle Bruce, profesora de la Universidad de Maryland que compartió la imagen animada de Frederick Douglass, captando la atención de cientos de miles de personas en línea.
La inteligencia artificial se basa en los datos y las reglas
Los deepfakes, que son una fusión sofisticada de audio sintético e imágenes, han sido un punto de controversia para los especialistas en ética digital durante años, especialmente cuando se trata de temas como la pornografía alterada y los videos falsos que podrían amenazar a instituciones nacionales y financieras.
En lo que refiere a un uso más positivo, las empresas han recurrido cada vez más a esta tecnología para crear campañas publicitarias muy personalizables. La recompensa, según los expertos, es que el consumidor puede sentirse más unido a una marca o un producto al ver la manera específica en la que encajaría en su vida, por ejemplo en un modelo con proporciones similares, en su propio idioma o en un anuncio dirigido que responda a sus intereses.
Ese tipo de aplicaciones buscan un tipo similar de conexión humana que Deep Nostalgia. Pero el hecho es que la inteligencia artificial no tiene nada de humano.
Farid tiene cuidado de señalar que el aprendizaje automático, que es lo que impulsa las tecnologías de animación más disponibles como Deep Nostalgia, es un campo dentro del gran mundo de la inteligencia artificial. El aprendizaje automático analiza los datos y encuentra patrones. Si bien un programa puede mejorar con más información, no hay ninguna inteligencia o análisis involucrado en la forma en que aplica estos patrones.
Una tecnología que beneficia a muchos
Hay muchas aplicaciones que se benefician enormemente de este tipo de datos.
«Cuando se predice el mercado de valores, quieres encontrar patrones», dice Farid como ejemplo. «O al hacer diagnósticos de cáncer. No necesito entender de momento por qué aparece el cáncer, solo quiero saber si aparece», explica.
Cuando se aplica a actividades más humanas, se manifiesta la falta de, bueno, inteligencia.
Los rostros sonrientes de nuestros antepasados, aunque son conmovedores, naturalmente no se sostienen una vez que abandonamos nuestra suspensión de la incredulidad.
Las representaciones de rostros humanos generadas por la inteligencia artificial, otra amenaza para la seguridad de nuestro entorno en línea, a menudo contienen fallos divertidos en los que un programa, que no sabe muy bien qué hacer con elementos irregulares como orejas o anteojos, escupe pequeñas monstruosidades ocultas en rostros por lo demás convincentes.
Incluso los deepfakes extremadamente sofisticados, como de Tom Cruise que están circulando, a menudo tienen pequeñas inconsistencias que nos hacen dudar de nuestro propio sentido de la realidad.
No, Tom Cruise no está en TikTok, son videos alterados 1:26
¿Qué puede suceder en el futuro?
Sin embargo, esas inconsistencias van a disminuir a medida que se desarrolle la tecnología. En este marco, Farid dice que llegó el momento de que las empresas analicen de manera crítica las implicaciones éticas de su uso.
«El sector tecnológico ha hecho cosas porque pueden y no porque deberían», dice. «Tenemos que dejar de construir cosas porque son geniales y empezar a plantear estas preguntas difíciles antes de que sea demasiado tarde», agrega.
Antes de que, por ejemplo, la tecnología sea tan buena que nuestras emociones puedan anular nuestros agudos sentidos de percepción.
Al usar Deep Nostalgia, MyHeritage advierte a los usuarios que no carguen fotos de personas vivas sin su consentimiento. Además afirma que la compañía no agregó opciones de audio por la seguridad del usuario.
En el futuro, tal vez otro programa pueda llenar esos vacíos y podamos ver, escuchar y conversar con personas a las que hemos perdido hace mucho tiempo. Esa tecnología presentará desafíos enormes para nuestra seguridad y nuestro sentido de la realidad tal como la conocemos.
Sin embargo, cuando nos sonría a través de los rostros reconfortantes de nuestros seres queridos será mucho más difícil resistirse.