Atrás

Sora de OpenAI: Una Nueva Frontera en la Generación de Video con IA

Sora de OpenAI: Una Nueva Frontera en la Generación de Video con IA

Descripción General de Sora

Sora es el sistema de texto a video de OpenAI que transforma las promts de los usuarios en clips de video cortos. El modelo puede aceptar texto plano, imágenes estáticas o breves fragmentos de video como entrada y generar salida que va desde unos pocos segundos hasta duraciones más largas, con resoluciones de hasta 1080p. Al extender las capacidades de las herramientas de texto a imagen anteriores, Sora busca hacer que la creación de video sea accesible a una amplia audiencia, desde creadores de contenido casual en las redes sociales hasta cineastas profesionales.

Funcionamiento del Modelo

Sora opera como un modelo de difusión. Comienza con una pantalla de ruido estático y elimina iterativamente ese ruido, permitiendo que emerjan formas, texturas y movimiento en línea con la promt. El sistema divide los frames de video en pequeños parches de datos, similares a los tokens en los modelos de lenguaje, lo que le permite entender el movimiento, la textura y el detalle a lo largo del tiempo. Esta arquitectura mejora la capacidad del modelo para simular detalles realistas de causa y efecto, como la forma en que los objetos interactúan con el entorno.

Características para Creadores

Más allá de la generación básica, Sora incluye herramientas avanzadas diseñadas para creadores. Una característica de storyboarding permite a los usuarios esbozar escenas antes de renderizar, imitando la planificación tradicional de películas. La versión más nueva de Sora, Sora 2, agrega diálogos sincronizados, efectos de sonido y una capacidad de cameo que permite a las personas subir su propia similitud para un uso controlado en los videos. Estos mejoramientos sugieren un cambio hacia una creación de contenido más pulida y de grado profesional.

Acceso y Estructura de Precio

Sora se incluye con los planes de suscripción de ChatGPT. Las cuentas gratuitas reciben una asignación diaria limitada de alrededor de 30 generaciones como una muestra. Los suscriptores de ChatGPT Plus ganan una generosa asignación diaria, mientras que el nivel Pro desbloquea una salida de alta resolución, tiempos de ejecución más largos y descargas sin marca de agua. Los usuarios que exceden su cuota gratuita pueden comprar generaciones adicionales en pequeños paquetes por una tarifa modesta.

Salvaguardas, Derechos de Autor y Controversia

OpenAI ha incorporado filtros para prevenir la generación de videos que representen a personas reales sin consentimiento, bloqueando promts que solicitan similitudes de celebridades específicas. La herramienta de cameo incluye controles que permiten a los usuarios revocar el acceso o eliminar videos que presentan su similitud. Inicialmente, Sora empleó un enfoque de opt-out para personajes con derechos de autor, requiriendo que los titulares de derechos solicitaran exclusión. Después de la crítica, OpenAI se movió hacia un modelo más granular de opt-in que da a los creadores un mayor control sobre el uso de su propiedad intelectual. Las preocupaciones legales y éticas persisten, con observadores de la industria señalando que las salvaguardas aún son imperfectas y que la tecnología podría redefinir la economía de la producción de cine, entretenimiento y medios de comunicación.

Usado: News Factory APP - descubrimiento de noticias y automatización - ChatGPT para Empresas

También disponible en: