Voltar

Cohere Lança Modelo de Voz de Código Aberto "Transcribe" para Reconhecimento Automático de Fala

Apresentando o Transcribe

A Cohere, uma empresa de IA focada em empresas, anunciou o lançamento de seu modelo de voz inaugural chamado Transcribe. O modelo é aberto e visa casos de uso de reconhecimento automático de fala (ASR) como tomar notas e análise de fala. Com um tamanho relativamente modesto de 2 bilhões de parâmetros, o Transcribe pode ser executado em unidades de processamento gráfico de consumo, tornando a auto-hospedagem viável para uma ampla gama de desenvolvedores.

Cobertura de Idiomas e Desempenho

O Transcribe atualmente suporta catorze idiomas: inglês, francês, alemão, italiano, espanhol, português, grego, holandês, polonês, chinês, japonês, coreano, vietnamita e árabe. No leaderboard de ASR aberto da Hugging Face, o modelo alcançou uma taxa de erro de palavra média (WER) de 5,42, o que a Cohere afirma ser menor do que qualquer outro modelo nesse benchmark. Avaliadores humanos deram ao Transcribe uma taxa de vitória de 61% sobre os sistemas concorrentes quando avaliaram a precisão, a coerência e a usabilidade. O modelo performou menos bem em português, alemão e espanhol, onde ficou atrás de alguns rivais.

Velocidade e Planos de Integração

A Cohere relata que o Transcribe pode processar 525 minutos de áudio em um único minuto, uma alta taxa de transferência para um modelo de sua classe. A empresa pretende integrar o modelo em sua plataforma de orquestração de agentes empresariais, North, e fará o modelo disponível por meio de uma API gratuita. Além disso, o Transcribe será hospedado no Model Vault, a plataforma de inferência gerenciada da Cohere, dando aos clientes uma opção de serviço gerenciado.

Contexto de Mercado e Perspectiva da Empresa

O lançamento ocorre à medida que a demanda por ferramentas de reconhecimento de fala cresce, impulsionada por aplicativos de tomar notas e ditado, como Granola e Wispr Flow. No início deste ano, a Cohere relatou aos investidores que gerou US$ 240 milhões em receita recorrente anual para 2025, e seu CEO, Aidan Gomez, indicou que a startup pode ir a público "em breve".

Detalhes do Evento

O anúncio foi feito em um evento da TechCrunch em San Francisco, Califórnia, realizado de 13 a 15 de outubro de 2026.

Usado: News Factory APP - descoberta e automação de notícias - ChatGPT para Empresas

Também disponível em: