Atrás

Runway Presenta su Primer Modelo de Mundo y Mejora el Gen 4.5 con Audio Nativo

Runway Presenta su Primer Modelo de Mundo y Mejora el Gen 4.5 con Audio Nativo

Lanzamiento del Modelo de Mundo

Runway anunció GWM-1, su primer modelo de mundo construido en un enfoque de predicción de video frame a frame. Al aprender una simulación interna de cómo se comporta el mundo, el modelo puede razonar sobre física, geometría y iluminación sin necesidad de entrenamiento explícito para cada escenario. La empresa posiciona GWM-1 como una solución más general en comparación con las ofertas existentes, enfatizando su capacidad para servir como un motor de simulación para dominios diversos.

Variantes Especializadas: Mundos, Robótica y Avatares

Tres extensiones personalizadas acompañan al modelo principal. GWM-Mundos permite a los usuarios crear proyectos interactivos al promptar una escena o proporcionar una referencia de imagen; el modelo luego llena el espacio con física realista a 24 fps y resolución 720p. GWM-Robotica se centra en datos sintéticos enriquecidos con variables como cambios climáticos y obstáculos, con el objetivo de revelar cómo los robots podrían violar políticas en diferentes condiciones. GWM-Avatares se centra en el comportamiento humano, ofreciendo avatares realistas para comunicación, capacitación y otras aplicaciones. Aunque cada variante opera como un modelo separado hoy, Runway planea unificarlos en un solo sistema.

Actualización del Gen 4.5: Audio Nativo y Generación de Multi-Toma

Junta con el debut del modelo de mundo, Runway mejoró su modelo de video Gen 4.5. La mejora agrega capacidades de audio nativo, lo que permite a los usuarios generar diálogo, sonido de fondo y editar pistas de audio existentes directamente dentro de los proyectos de video. La generación de multi-toma ahora admite historias más largas y con múltiples ángulos con personajes consistentes en cada toma. Los usuarios pueden producir videos de un minuto que combinan movimientos de cámara complejos, diálogo nativo y paisajes sonoros realistas, reduciendo la brecha con las suites de video todo-en-uno competidoras.

Disponibilidad y Asociaciones

Ambos GWM-Robotica y el modelo Gen 4.5 actualizado están disponibles para todos los suscriptores de planes pagados. Runway también anunció que un SDK para GWM-Robotica será lanzado, y la empresa está en discusiones activas con varias empresas de robótica y empresas para explorar aplicaciones prácticas de sus capacidades de datos sintéticos y avatares. La implementación señala el movimiento de Runway desde la investigación a nivel de prototipo hacia herramientas listas para la producción para creadores, desarrolladores y socios de la industria.

Usado: News Factory APP - descubrimiento de noticias y automatización - ChatGPT para Empresas

También disponible en: