OpenAI anunciou na quinta-feira que sua API agora suporta três novos modelos de voz - GPT-Realtime-2, GPT-Realtime-Traduzir e GPT-Realtime-Sussurro. A suíte permite que os desenvolvedores construam aplicações que possam conversar, traduzir e transcrever discurso em tempo real, com suporte a mais de 70 idiomas de entrada e 13 idiomas de saída. A cobrança é dividida entre taxas por minuto para tradução e transcrição e preços baseados em tokens para o modelo conversacional. OpenAI afirma que as ferramentas visam plataformas de atendimento ao cliente, educação, mídia e criadores, e incluem barreiras para evitar o uso indevido.
Leia mais →