OpenAI anunciou três novos modelos de áudio para sua API em Tempo Real - GPT-Realtime-2, GPT-Realtime-Traduzir e GPT-Realtime-Sussurro. A suíte impulsiona a IA de voz além de simples trocas de diálogo, oferecendo raciocínio ao vivo, tradução em tempo real em mais de 70 idiomas e transcrição de streaming. Desenvolvedores agora podem criar assistentes que agendam visitas a casas, gerenciam reservas de viagem ou fornecem legendas em tempo real, enquanto o preço começa em $0,017 por minuto para Sussurro e $0,034 por minuto para Traduzir, com GPT-Realtime-2 cobrado em $32 por milhão de tokens de áudio.
Leia mais →