Lo nuevo en Article Factory y lo último en el mundo de la IA generativa

Mistral AI lanza el modelo de voz de código abierto Voxtral TTS

Mistral AI lanza el modelo de voz de código abierto Voxtral TTS
Mistral AI, una empresa francesa de inteligencia artificial, ha introducido Voxtral TTS, un modelo de texto a voz de código abierto diseñado para funcionar en tiempo real en dispositivos de borde. El modelo admite nueve idiomas, se puede personalizar con una muestra de voz de menos de cinco segundos y ofrece un tiempo de audio inicial de 90 ms con un factor de tiempo real de 6×. Mistral posiciona el modelo como una alternativa de bajo costo y alta calidad para asistentes de voz empresariales, doblaje y traducción en tiempo real, compitiendo directamente con jugadores establecidos como ElevenLabs, Deepgram y OpenAI. Leer más →

Cohere presenta el modelo de voz de código abierto "Transcribe" para reconocimiento automático del habla

Cohere presenta el modelo de voz de código abierto "Transcribe" para reconocimiento automático del habla
La empresa de inteligencia artificial Cohere lanzó su primer modelo de voz, Transcribe, un sistema de reconocimiento automático del habla de código abierto construido con 2 mil millones de parámetros. Diseñado para tarjetas gráficas de consumo, el modelo admite 14 idiomas y afirma tener una tasa de error de palabras del 5,42 en la clasificación de Hugging Face Open ASR, superando a varios competidores. Cohere planea integrar Transcribe en su plataforma de orquestación North, ofrecer acceso a la API de forma gratuita y alojarlo en su servicio Model Vault. La implementación sigue informes de $240 millones en ingresos recurrentes anuales y sugiere una posible oferta pública inicial en un plazo próximo. Leer más →