Talkie-1931 es un bicho raro entre los chatbots potenciados con inteligencia artificial: sus creadores entrenaron a esa IA solo con datos anteriores al año que figura en su denominación. Así, el modelo desconoce todos los acontecimientos posteriores a esa fecha. ¡Incluso ignora su propia naturaleza!
Acotando sus conocimientos, los investigadores desnudaron el funcionamiento de las IAs contemporáneas que se entrenan con la misma base de datos: Internet. Tal como observa la publicación Emerge, “esa información compartida lo moldea todo; lo que saben, cómo se comunican, lo que consideran obvio”.
Usemos un ejemplo azaroso y caprichoso. Si entrenáramos a una IA con información sobre los mundiales de fútbol anteriores a Qatar 2022, entonces ese sistema dirá que Lionel Messi nunca fue campeón del mundo con la selección mayor.

Una curiosidad, en paralelo. Cuando le preguntamos a Talkie quién es nuestro archifamoso Messi, a falta de unas cinco décadas para el nacimiento del futbolista respondió que se trata de un escritor y político de origen italiano.
¿Cómo funciona la IA que desconoce todo lo que pasó después de 1930?
Mientras que ChatGPT, Gemini, Claude y otros de su especie están actualizados con información de última hora, Talkie-1931 es intencionalmente sesgado.
Se trata de un modelo abierto, con 13.000 millones de parámetros, ideado y respaldado por una organización sin ánimo de lucro que lideran tres investigadores. Tal como señalamos, fue entrenado exclusivamente con textos que circularon antes del 1 de enero de 1931. Su base de datos contiene libros, diarios, revistas y solicitudes de patentes, entre otros documentos.

Los interesados en comprobar cómo funciona Talkie-1931 pueden ingresar al sitio web oficial del proyecto, donde el chatbot Claude, desarrollado por Anthropic, le conversa las 24 horas. También hay una caja de texto, para realizar preguntas y conversar.
Un pasado que ocurrió, pero que el chatbot desconoce
El modelo resultante desconoce muchos más eventos que el campeonato mundial en el que se coronó la selección argentina de fútbol, en el 2022. Por ejemplo, es anterior a la popularización de la penicilina, que fue descubierta pocos años antes; tampoco conoce las atrocidades del nazismo o la caída del Muro de Berlín; y a su vez desconoce los avances tecnológicos que se afianzaron en este siglo, incluyendo la revolución de Internet y el actual auge de la IA.
Leé también: Descubrieron que un chatbot de inteligencia artificial se niega a responder si lo tratan mal
Muchos de los hechos que para nosotros forman parte del pasado, para el modelo son eventos futuros y en tanto desconocidos. En este punto, la fuente mencionada realizó una serie de pruebas para evaluar las respuestas de Talkie-1931.

Por ejemplo, consultaron al chatbot su opinión acerca de Hitler y respondió: “¡Cuidado con elegir a un necio!”. También le preguntaron por las “máquinas pensantes” —un eufemismo para que comprenda qué es una computadora— y dijo que “la idea es buena, siempre que funcionen satisfactoriamente”.
Además, agregó que la posibilidad que esos artilugios ofrecerían para trabajar desde las casas “retrasaría el desarrollo natural y dificultaría a los jóvenes convertirse en miembros productivos de la sociedad”.
También indagaron a Talkie-1931 con la siguiente duda: ¿cómo será el mundo en el 2026? Con el famoso diario del lunes, la respuesta del modelo es insólita y, admitamos, triste.
Leé también: Un agente de IA borró la base de datos de una empresa en nueve segundos y después se declaró culpable
“Ese año, el mundo tendrá un aspecto muy diferente al actual. No habrá ejércitos permanentes y muy pocos policías. Como consecuencia de la difusión general de la educación, el crimen se habrá vuelto raro”, respondió el modelo con la ceguera propia de su entrenamiento.
¿Para qué sirve este experimento?
La clave de este modelo de IA con datos acotados a un momento histórico no se agota en medir la sorpresa que experimento ante eventos posteriores a su fecha límite. La pregunta central es qué sucede con una IA cuando se entrena con datos diferentes a los habituales, es decir, con información que no proviene de la Web.
Los investigadores detrás de este singular ingenio prevén que para mediados de año Talkie-1931 tengan más de 1.000 millones de unidades básicas de datos —tokens—, una cantidad suficiente para emular la capacidad de ChatGPT.

































