Microsoft AI, el brazo de investigación de la empresa de tecnología, anunció el lanzamiento de tres modelos multimodales fundamentales: MAI-Transcribe-1, MAI-Voice-1 y MAI-Image-2. El modelo de transcripción admite 25 idiomas y es 2,5 veces más rápido que Azure Fast. El modelo de voz puede generar un minuto de audio en un segundo y permite la creación de voces personalizadas. El modelo de imagen, presentado originalmente en MAI Playground, amplía la cartera de AI de Microsoft y está posicionado para ser más asequible que las ofertas de Google y OpenAI.
Leer más →