What is new on Article Factory and latest in generative AI world

OpenAI adiciona voz em tempo real, tradução e transcrição à sua API

OpenAI adiciona voz em tempo real, tradução e transcrição à sua API
OpenAI anunciou na quinta-feira que sua API agora suporta três novos modelos de voz - GPT-Realtime-2, GPT-Realtime-Traduzir e GPT-Realtime-Sussurro. A suíte permite que os desenvolvedores construam aplicações que possam conversar, traduzir e transcrever discurso em tempo real, com suporte a mais de 70 idiomas de entrada e 13 idiomas de saída. A cobrança é dividida entre taxas por minuto para tradução e transcrição e preços baseados em tokens para o modelo conversacional. OpenAI afirma que as ferramentas visam plataformas de atendimento ao cliente, educação, mídia e criadores, e incluem barreiras para evitar o uso indevido. Leia mais →

OpenAI Apresenta Três Modelos de Voz em Tempo Real, Expandindo a IA para Conversas ao Vivo, Tradução e Transcrição de Streaming

OpenAI Apresenta Três Modelos de Voz em Tempo Real, Expandindo a IA para Conversas ao Vivo, Tradução e Transcrição de Streaming
OpenAI anunciou três novos modelos de áudio para sua API em Tempo Real - GPT-Realtime-2, GPT-Realtime-Traduzir e GPT-Realtime-Sussurro. A suíte impulsiona a IA de voz além de simples trocas de diálogo, oferecendo raciocínio ao vivo, tradução em tempo real em mais de 70 idiomas e transcrição de streaming. Desenvolvedores agora podem criar assistentes que agendam visitas a casas, gerenciam reservas de viagem ou fornecem legendas em tempo real, enquanto o preço começa em $0,017 por minuto para Sussurro e $0,034 por minuto para Traduzir, com GPT-Realtime-2 cobrado em $32 por milhão de tokens de áudio. Leia mais →