Atrás

Google DeepMind abre Project Genie, generador de mundos de IA, a usuarios en EE. UU.

Google DeepMind abre Project Genie, generador de mundos de IA, a usuarios en EE. UU.

Antecedentes

DeepMind, el brazo de investigación de IA de Google, introdujo Project Genie como parte de su esfuerzo continuo por desarrollar modelos de mundo avanzados - sistemas de IA que pueden generar representaciones internas de entornos y predecir resultados. El lanzamiento sigue un impulso más amplio de la industria para explorar las capacidades de los modelos de mundo para juegos, entretenimiento y capacitación de agentes incorporados en el futuro.

Cómo funciona Project Genie

Los usuarios comienzan proporcionando un "borrador de mundo" a través de textos que describen el entorno y un personaje principal. Un modelo de generación de imágenes crea una representación visual basada en esas indicaciones, que los usuarios pueden ajustar antes de que el motor del modelo de mundo construya un entorno interactivo. El sistema también puede aceptar fotos del mundo real como punto de partida, aunque los resultados varían. Una vez que la imagen está finalizada, el modelo genera un mundo navegable que se puede explorar en primera o tercera persona. Los usuarios pueden descargar capturas de video de sus sesiones.

Experiencia del usuario y limitaciones

Los testers tempranos elogiaron la capacidad de la herramienta para renderizar estilos artísticos como el acuarela, el anime y la estética de dibujos animados. Sin embargo, el modelo luchó con escenas fotorealistas o cinematográficas, produciendo a menudo resultados que se asemejaban a gráficos de videojuegos en lugar de entornos realistas. Los controles de navegación se informaron como ocasionalmente no responsivos, lo que llevó a movimientos erráticos. El prototipo también impuso guardrail de seguridad que impidieron la generación de desnudez, personajes con derechos de autor u otro contenido restringido.

Mientras que el sistema podría animar objetos y responder a interacciones simples, los personajes a veces pasaban a través de superficies sólidas, y la dinámica general de los entornos permaneció limitada. DeepMind reconoció estas deficiencias y enfatizó que Project Genie es un prototipo experimental destinado a la recopilación de comentarios en lugar de un producto de consumo pulido.

Implicaciones para el desarrollo de IA

Project Genie representa un paso tangible hacia el desarrollo de modelos de mundo más capaces, que muchos investigadores consideran esenciales para lograr la inteligencia artificial general. Al abrir la herramienta a una audiencia más amplia, DeepMind espera recopilar datos de uso diversificados que puedan informar mejoras futuras. La iniciativa también ilustra el creciente interés en el uso de mundos generados por IA para la capacitación de agentes incorporados, como robots, en entornos simulados antes de su implementación en el mundo real.

En general, el lanzamiento de Project Genie destaca tanto la promesa como los desafíos actuales de la generación de mundos impulsada por IA, ofreciendo una visión de cómo los espacios virtuales interactivos podrían evolucionar a medida que la tecnología madura.

Usado: News Factory APP - descubrimiento de noticias y automatización - ChatGPT para Empresas

También disponible en: