Google anunció esta semana un “reinicio” de Gemini, su chatbot de inteligencia artificial, con una novedad relevante: vuelve a admitir la generación de imágenes que incluyen figuras humanas. Este paso requirió una serie de mejoras y revisiones por parte de la compañía estadounidense, luego del escándalo que protagonizó aquel sistema, cuando arrojó resultados con fuertes sesgos y llamativas inexactitudes históricas.
Para desprevenidos, una de las capacidades de Google Gemini es la generación de imágenes a partir de texto. Igual que otros sistemas como DALL-E, Meta AI y Midjourney, el modelo comprende indicaciones por escrito y las convierte una fotografía realista, un dibujo, una pintura, etcétera.
Por ejemplo, para la imagen sobre este párrafo, creada con el generador de OpenAI, la instrucción fue: “Un oso feroz con un libro pequeño entre sus garras, estilo dibujo”.
Imágenes y sesgos discriminatorios: ¿cuál fue el problema con Gemini?
En febrero, Google se vio obligada a pausar pausó el acceso a Gemini debido a la circulación de imágenes creadas por usuarios del chatbot, que revelaron sesgos racistas, además de incongruencias notables. “Las fotos en cuestión no solo eran incorrectas en términos históricos, sino que además exageraban la diversidad, al punto que representaron soldados nazis afroamericanos y reyes medievales de tez oscura”, explicábamos en la ocasión en TN Tecno.
En ese marco, el CEO de la compañía, Sundar Pichai, hizo mea culpa y dijo que ese comportamiento de Gemini es “inaceptable”, aunque se escudó al mencionar que en este momento ninguna IA es perfecta. “Sabemos que la vara está alta para nosotros y lo mantendremos durante el tiempo que sea necesario. Revisaremos lo que sucedió y nos aseguraremos de solucionarlo”, cerró.
Luego, hacia el mes de mayo, Google tuvo otro dolor de cabeza cuando su IA dio respuestas incorrectas y peligrosas. Por ejemplo, alentó a los usuarios a comer piedras a diario y a poner pegamento en la pizza.
¿Qué cambio en Google Gemini?
Siguiendo el repaso de New York Post, la firma de Mountain View “reinició” a su programa de inteligencia artificial. En concreto, anunció una versión mejorada de la función de generación de imágenes, que “en los próximos días” estará disponible en forma anticipada para los usuarios que pagan una suscripción para usar las versiones Advanced, Business y Enterprise del chatbot.
Según Google, estos cambios “establecen un nuevo estándar para la calidad de las imágenes, que se generan con unas pocas palabras”. En este contexto, Gemini vuelve a admitir la inclusión de humanos en sus creaciones visuales.
“Hemos trabajado para hacer mejoras técnicas al producto, así como conjuntos de evaluación mejorados, ejercicios de trabajo en equipo y principios claros del producto”, dijo la compañía en un comunicado. “No todas las imágenes que crea Gemini serán perfectas, pero seguiremos escuchando los comentarios de los primeros usuarios a medida que sigamos mejorando”, agregaron.