Lo nuevo en Article Factory y lo último en el mundo de la IA generativa

OpenAI agrega voz en tiempo real, traducción y transcripción a su API

OpenAI agrega voz en tiempo real, traducción y transcripción a su API
OpenAI anunció el jueves que su API ahora admite tres nuevos modelos enfocados en la voz: GPT-Realtime-2, GPT-Realtime-Traducir y GPT-Realtime-Susurro. La suite permite a los desarrolladores crear aplicaciones que pueden conversar, traducir y transcribir el habla en tiempo real, con soporte para más de 70 idiomas de entrada y 13 idiomas de salida. La facturación se divide entre tarifas por minuto para la traducción y la transcripción y precios basados en tokens para el modelo conversacional. OpenAI afirma que las herramientas están dirigidas a plataformas de servicio al cliente, educación, medios y creadores, e incluye salvaguardias para prevenir el mal uso. Leer más →

OpenAI Presenta Tres Modelos de Voz en Tiempo Real, Ampliando la IA a Conversaciones en Vivo, Traducción y Transcripción de Streaming

OpenAI Presenta Tres Modelos de Voz en Tiempo Real, Ampliando la IA a Conversaciones en Vivo, Traducción y Transcripción de Streaming
OpenAI anunció tres nuevos modelos de audio para su API en Tiempo Real: GPT-Realtime-2, GPT-Realtime-Traducir y GPT-Realtime-Susurro. La suite impulsa la IA de voz más allá de simples intercambios, ofreciendo razonamiento en vivo, traducción en tiempo real en más de 70 idiomas y transcripción de streaming. Los desarrolladores ahora pueden crear asistentes que programen visitas a hogares, gestionen reservas de viaje o proporcionen subtítulos en tiempo real, mientras que los precios comienzan en $0,017 por minuto para Susurro y $0,034 por minuto para Traducir, con GPT-Realtime-2 facturado a $32 por millón de tokens de audio. Leer más →