El cambio de la IA de los chatbots a los modelos del mundo: construyendo inteligencia física
De texto a realidad
Los grandes modelos de lenguaje (LLM) como ChatGPT y Gemini se han convertido en la columna vertebral de la mayoría de las aplicaciones de IA, generando el texto que los usuarios ven en las pantallas. Sin embargo, un creciente consenso entre los pioneros de la IA es que la próxima ola se centrará menos en generar palabras y más en comprender y actuar dentro del mundo físico.
Qué son los modelos del mundo
Los modelos del mundo traducen el mundo real, incluyendo las leyes de la física, la detección de objetos y el movimiento, en un plano digital que la IA puede procesar. Al basar la IA en la razón de causa y efecto, estos modelos permiten capacidades como la creación de videos realistas, la guía para robots quirúrgicos y la toma de decisiones mejorada para vehículos autónomos.
Líderes de la industria abrazan la inteligencia espacial
Yann LeCun, un destacado investigador de IA, recientemente dejó su cargo en Meta para unirse a una startup dedicada a construir modelos del mundo. Fei-Fei Li, a menudo llamada la madrina de la IA, ha destacado la inteligencia espacial, la capacidad de comprender el entorno físico, como la próxima frontera, señalando su potencial para transformar la narración, la creatividad, la robótica y el descubrimiento científico. El CEO de Nvidia, Jensen Huang, dedicó parte de su keynote en el CES 2026 al trabajo de la empresa en modelos del mundo, enfatizando que los datos masivos y de alta calidad, tanto generados por humanos como sintéticos, son esenciales para entrenar estos sistemas.
Demo de Cosmos de Nvidia
Nvidia presentó su modelo del mundo, Cosmos, que integra texto, imágenes y video para comprender el mundo físico. En una demostración en vivo, Cosmos utilizó los sensores de un coche autónomo para mapear la posición del vehículo y la de los coches cercanos, generando un video en vivo de los alrededores. Los desarrolladores pueden ejecutar escenarios simulados, como accidentes, para evaluar las respuestas de los vehículos y mejorar la seguridad. Los datos sintéticos también ayudan a predecir casos raros "de borde" que son difíciles de capturar con datos de conducción del mundo real.
Por qué importa la IA arraigada
A medida que la IA se integra en la vida cotidiana, la capacidad de razonar sobre el mundo real, en lugar de alucinar, será fundamental para la confiabilidad y la seguridad. La investigación y la inversión renovadas en inteligencia espacial, modelos del mundo y IA física indican que la industria está avanzando más allá de los chatbots hacia la tecnología que está firmemente arraigada en la realidad.
Usado: News Factory APP - descubrimiento de noticias y automatización - ChatGPT para Empresas