Google Gemini Supera ChatGPT na Transcrição de Áudio com Rótulos de Falante
O Problema de Transcrição
O aplicativo Notas do iPhone pode gravar áudio e gerar uma transcrição básica, mas a saída falta rótulos de falante, misturando todo o diálogo em um único bloco de texto. Isso torna difícil distinguir entre as perguntas do entrevistador e as respostas do entrevistado, forçando o usuário a relisten e anotar manualmente a gravação.
Usando Google Gemini 3 Pro
Para resolver o problema, o usuário exportou a gravação do Notas como um arquivo M4A e a transferiu para um MacBook Pro via AirDrop. No Google Gemini 3 Pro, o usuário anexou o arquivo de áudio e solicitou ao modelo que "ouvisse isso, transcrevesse e identificasse os diferentes falantes". O Gemini rapidamente produziu uma transcrição completa, rotulando cada falante como "Entrevistador" e fornecendo o nome e título do entrevistado. Além de um pequeno erro de nomeação que o usuário mais tarde corrigiu, a transcrição foi precisa e incluiu distinções claras de falante.
Tentativa com ChatGPT 5.1
O mesmo usuário então tentou replicar o processo com ChatGPT 5.1, usando uma conta Plus. Após anexar o mesmo arquivo M4A e emitir um prompt idêntico, o ChatGPT respondeu que não conseguia acessar ou reproduzir o arquivo diretamente. O modelo sugeriu várias soluções, como converter o arquivo para um arquivo zip, mas nenhuma permitiu que ele processasse o áudio. A interação se transformou em uma troca de idas e vindas sem uma transcrição bem-sucedida.
Implicações
Esta comparação lado a lado demonstra que o Google Gemini 3 Pro pode lidar com entradas de áudio raw e realizar identificação de falante fora da caixa, enquanto o ChatGPT 5.1 atualmente carece da capacidade de ingerir arquivos de áudio diretamente. Para usuários que precisam de transcrição confiável com rótulos de falante, o Gemini oferece uma solução pronta para uso, enquanto as limitações do ChatGPT podem exigir etapas adicionais ou ferramentas externas.
Usado: News Factory APP - descoberta e automação de notícias - ChatGPT para Empresas