OpenAI Integra Modo de Voz Diretamente no Chat do ChatGPT
Visão Geral da Integração
OpenAI lançou uma atualização sutil, mas significativa, que mescla o Modo de Voz com a experiência regular de chat do ChatGPT. Em vez de lançar uma tela separada ou um globo flutuante, a função de voz agora aparece como um botão dentro da janela de conversa existente. A mudança está sendo implementada para todos os usuários no aplicativo móvel e na versão web, exigindo apenas uma atualização de aplicativo para dispositivos móveis.
Recursos Principais
A interface de voz integrada permite que os usuários falem suas consultas e vejam o texto aparecer em tempo real como uma transcrição. Os usuários podem alternar entre voz e entrada digitada sem sair da conversa, tornando fácil fazer perguntas de follow-up ou alternar para digitação sempre que preferirem. Um botão "Fim" desativa instantaneamente a escuta, e um botão de vídeo habilita o modelo a analisar a entrada visual da câmera.
Além da conversa básica, a atualização adiciona ajudas visuais sob demanda. Os usuários podem solicitar mapas, previsões do tempo e outros dados em tempo real, que aparecem como gráficos dentro do chat. O sistema também suporta a geração de imagens com base em comandos de voz, embora relatórios iniciais indiquem que esse recurso às vezes falha em produzir a saída esperada.
Experiência do Usuário
Revisores observam que o novo design se sente mais natural do que o Modo de Voz separado anterior, que exigia sair da interface de texto. A transcrição em tempo real fornece um registro claro do que foi dito, e a capacidade de interromper ou fazer perguntas de follow-up espelha a fluidez de um chat de texto típico. A integração também permite que os usuários solicitem manchetes de notícias, atualizações de tempo ou localizações de mapas enquanto veem links clicáveis ao lado da resposta falada.
Limitações e Feedback
Embora a integração de voz simplifique a interação, alguns usuários encontraram problemas. A função de geração de imagens, invocada por comandos de voz, foi relatada como travada sem entregar a imagem solicitada. Além disso, o recurso de mapa exibe gráficos estáticos em vez de integração completa com serviços de mapas externos.
No geral, a atualização é elogiada por tornar a voz uma opção padrão, pronta para segundo plano, que reduz a fricção de alternar modos, embora se espere um polimento adicional para as capacidades visuais mais avançadas.
Usado: News Factory APP - descoberta e automação de notícias - ChatGPT para Empresas