Atrás

El generador de video Sora de OpenAI no cumple con las expectativas en la prueba de explicador de FIV

El generador de video Sora de OpenAI no cumple con las expectativas en la prueba de explicador de FIV

Antecedentes y motivación

Un periodista que actualmente se encuentra en proceso de fertilización in vitro (FIV) buscó aprovechar Sora, un sistema de generación de video impulsado por IA de OpenAI, para producir metraje realista para un próximo explicador sobre la industria de la fertilidad. El objetivo era reducir los desafíos de la producción en cámara y obtener elementos visuales que complementaran los comentarios personales.

Proceso de prueba

El reportero accedió a Sora directamente a través de su interfaz de chat e ingresó instrucciones que describían escenas específicas relacionadas con la FIV, como el desarrollo de embriones, la anatomía reproductiva femenina y la configuración de medicamentos. Se iteraron múltiples instrucciones, con ajustes realizados para mejorar la fidelidad visual y corregir errores textuales.

Hallazgos clave

La mayoría de los clips generados mostraron deficiencias significativas. Los detalles científicos a menudo eran inexactos: los platos de embriones mostraban objetos mal colocados, y los diagramas anatómicos contenían términos mal escritos. Las superposiciones de texto presentaban palabras sin sentido y frases confusas, lo que indicaba claramente contenido generado por IA. Las anomalías visuales incluyeron dedos adicionales, extremidades malformadas y representaciones de fluidos poco realistas en el equipo médico.

Algunos clips, como un primer plano de un bebé recién nacido, se acercaron a la realidad y fueron considerados aceptables. Sin embargo, incluso estos tuvieron éxito solo después de una refinación extensa de las instrucciones y aún exhibieron errores ocasionales, como counts de dedos incorrectos.

Implicaciones para los creadores de contenido

El experimento subraya que, si bien Sora puede producir material visual básico, lucha con la precisión específica del dominio y los detalles visuales matizados requeridos para la narración médica. Los creadores que apuntan a temas de alto riesgo, especialmente aquellos que involucran imágenes científicas precisas, deben anticipar la necesidad de una edición de postproducción extensa o fuentes suplementarias de metraje de stock.

Conclusión

Sora de OpenAI muestra promesa en la democratización de la creación de video, pero sus limitaciones actuales lo hacen inadecuado para representaciones detalladas y precisas de procedimientos médicos complejos. El reportero planea revisitar la herramienta una vez que estén disponibles versiones más nuevas, pero aconseja precaución para aquellos que buscan contenido visual confiable y libre de errores en campos especializados.

Usado: News Factory APP - descubrimiento de noticias y automatización - ChatGPT para Empresas

También disponible en: