Atrás

Google Presenta Veo 3.1, Modelo de IA que Mejora la Generación de Video a Partir de Imágenes

Google Presenta Veo 3.1, Modelo de IA que Mejora la Generación de Video a Partir de Imágenes

Presentando Veo 3.1

Google anunció una nueva versión de su modelo de generación de video de IA Veo, llamado Veo 3.1. La actualización se centra en una mejor "adherencia a las instrucciones", lo que significa que el modelo sigue las instrucciones textuales más de cerca que las iteraciones anteriores. Además, Veo 3.1 puede transformar imágenes estáticas en secuencias de video en movimiento mientras genera audio acompañante, una capacidad que no estaba disponible en Veo 3.

Disponibilidad e Integración

El modelo actualizado está disponible hoy a través de la API Gemini de Google. También alimenta el editor de video Flow de la empresa, donde trae nuevos controles creativos a los usuarios. Una característica destacada, llamada "Frame to Video", permite a los usuarios subir un primer y último frame, y el modelo completa el movimiento intervenido, produciendo un clip sin problemas. Esta característica se asemeja a una oferta similar de Adobe Firefly, pero la implementación de Flow también incluye la generación de audio simultánea.

Flujos de Trabajo Creativos Mejorados

Con Veo 3.1, Flow puede no solo generar nuevo contenido de video, sino también extender clips existentes e insertar objetos en metraje, todo mientras maneja audio en tiempo real. Google posiciona estas capacidades como herramientas dirigidas a profesionales que trabajan con video, en lugar de como un medio para generar fragmentos de redes sociales virales.

Rendimiento y Calidad Visual

Los videos de muestra compartidos por Google demuestran que Veo 3.1 todavía produce una calidad visual "inquietante" que varía dependiendo de la instrucción y el tema. Si bien la realidad no coincide con la de OpenAI’s Sora 2, las mejoras en la fidelidad de las instrucciones y la adición de la conversión de imagen a video representan un paso notable hacia adelante para la plataforma.

Dirección Estratégica

Al mejorar la practicidad de sus herramientas de video de IA, Google parece estar apuntando a creadores y empresas que necesitan generación de video confiable y controlable. La integración con la API Gemini y Flow sugiere una estrategia de ecosistema más amplia, que permite a los desarrolladores y editores incorporar las capacidades de Veo 3.1 directamente en sus flujos de trabajo.

Usado: News Factory APP - descubrimiento de noticias y automatización - ChatGPT para Empresas

También disponible en: