OpenAI anunció el jueves que su API ahora admite tres nuevos modelos enfocados en la voz: GPT-Realtime-2, GPT-Realtime-Traducir y GPT-Realtime-Susurro. La suite permite a los desarrolladores crear aplicaciones que pueden conversar, traducir y transcribir el habla en tiempo real, con soporte para más de 70 idiomas de entrada y 13 idiomas de salida. La facturación se divide entre tarifas por minuto para la traducción y la transcripción y precios basados en tokens para el modelo conversacional. OpenAI afirma que las herramientas están dirigidas a plataformas de servicio al cliente, educación, medios y creadores, e incluye salvaguardias para prevenir el mal uso.
Leer más →