O Gerador de Vídeo Sora da OpenAI Não Atende às Expectativas no Teste de Explicador de FIV
Contexto e Motivação
Um jornalista que atualmente está passando por fertilização in vitro (FIV) buscou utilizar o Sora, um sistema de geração de vídeo impulsionado por IA da OpenAI, para produzir imagens realistas de B-roll para um explicador sobre a indústria de fertilidade. O objetivo era reduzir os desafios da produção em câmera e obter elementos visuais que complementassem o comentário pessoal.
Processo de Teste
O repórter acessou o Sora diretamente por meio de sua interface de chat e inseriu prompts que descreviam cenas específicas relacionadas à FIV, como desenvolvimento de embriões, anatomia reprodutiva feminina e configurações de medicação. Vários prompts foram iterados, com ajustes feitos para melhorar a fidelidade visual e corrigir erros textuais.
Principais Conclusões
A maioria dos cliques gerados apresentou deficiências significativas. Detalhes científicos frequentemente eram imprecisos - pratos de embriões mostravam objetos mal posicionados, e diagramas anatômicos continham terminologia com erros de digitação. Sobreposições de texto apresentavam palavras sem sentido e frases confusas, claramente indicando conteúdo gerado por IA. Anomalias visuais incluíam dedos extras, membros malformados e representações de fluidos irrealistas em equipamentos médicos.
Alguns cliques, como um close-up de um bebê recém-nascido, se aproximaram do realismo e foram considerados aceitáveis. No entanto, mesmo esses só obtiveram sucesso após uma extensa refinação de prompts e ainda apresentaram erros ocasionais, como contagem de dedos incorreta.
Implicações para Criadores de Conteúdo
O experimento destaca que, embora o Sora possa produzir material visual básico, ele luta com a precisão específica do domínio e os detalhes visuais nuances necessários para narrativas médicas. Criadores que visam tópicos de alto risco, especialmente aqueles que envolvem imagens científicas precisas, devem antecipar a necessidade de edição pós-produção extensiva ou fontes suplementares de imagens em stock.
Conclusão
O Sora da OpenAI mostra promessa em democratizar a criação de vídeo, mas suas limitações atuais o tornam inadequado para representações detalhadas e precisas de procedimentos médicos complexos. O repórter planeja revisitar a ferramenta uma vez que novas versões se tornem disponíveis, mas aconselha cautela para aqueles que buscam conteúdo visual confiável e sem erros em campos especializados.
Usado: News Factory APP - descoberta e automação de notícias - ChatGPT para Empresas