Atrás

Microsoft lanza tres modelos de inteligencia artificial internos, lo que señala un cambio en la asociación con OpenAI

Microsoft anunció el lanzamiento público de tres modelos de inteligencia artificial de código abierto - MAI-Transcribe-1, MAI-Voice-1 y MAI-Image-2 - en su plataforma Foundry, lo que marca la primera producción tangible del equipo de superinteligencia MAI de la empresa. Los modelos llegan justo semanas después de cambios a nivel ejecutivo que liberaron al CEO Mustafa Suleyman de sus deberes diarios de producto, lo que le permite centrarse en construir una suite de herramientas de inteligencia artificial que operan enteramente en la infraestructura de Microsoft.

MAI-Transcribe-1, un sistema de habla a texto, afirma tener la tasa de error de palabra más baja en 25 idiomas en el benchmark FLEURS, con un promedio de 3,8 por ciento. Microsoft dice que supera a OpenAI’s Whisper-large-v3 en todos los idiomas, supera a Google’s Gemini 3.1 Flash en 22 de los 25 idiomas y supera a ElevenLabs’ Scribe v2 en 15. El modelo se ejecuta 2,5 veces más rápido que el servicio de transcripción Azure Fast anterior y tiene un precio de $0,36 por hora de audio. El equipo de desarrollo detrás de él estaba formado por solo diez personas.

MAI-Voice-1 completa la canalización de audio. El modelo de texto a habla puede generar un minuto de audio con sonido natural en menos de un segundo en una sola GPU y admite la creación de voz personalizada a partir de solo unos segundos de audio de muestra. Cuando se combina con MAI-Transcribe-1 y un modelo de lenguaje grande elegido por el cliente, la dupla ofrece una solución de voz completa que no depende de ninguna tecnología de OpenAI.

La tercera oferta, MAI-Image-2, entró en el leaderboard de texto a imagen de Arena.ai en marzo en el número tres, solo detrás de Google’s Gemini 3.1 Flash y OpenAI’s GPT Image 1.5. Desarrollado con la participación de fotógrafos, diseñadores y narradores visuales, el modelo ya se está utilizando a gran escala por WPP, uno de los grupos de marketing más grandes del mundo.

Los lanzamientos son más que hitos técnicos; reflejan un cambio estratégico habilitado por una renegociación de contrato con OpenAI en septiembre de 2025. El nuevo memorando de entendimiento otorgó a Microsoft los derechos de licencia para todos los resultados de OpenAI hasta 2032, aseguró $250 mil millones en compromisos adicionales de nube Azure y, crucialmente, eliminó la cláusula que prohibía a Microsoft construir sus propios modelos de inteligencia artificial de propósito general. Suleyman citó la renegociación como el catalizador que permitió a la empresa perseguir su agenda de "superinteligencia humanista".

La plataforma Foundry de Microsoft - anteriormente Azure AI Foundry y Azure AI Studio - ahora sirve a más de 80.000 empresas, incluyendo aproximadamente el 80 por ciento de las empresas Fortune 500. Esa ventaja de distribución significa que los modelos MAI no necesitan dominar todos los benchmarks para cambiar el gasto en inteligencia artificial empresarial hacia soluciones construidas por Microsoft. Simplemente tienen que ser lo suficientemente competitivos para que los clientes elijan una opción integrada en lugar de alternativas de terceros.

OpenAI se encuentra en una posición matizada. Si bien Microsoft sigue siendo su mayor inversor y proveedor de nube principal, ambas empresas ahora compartan una plataforma que alberga tanto modelos de OpenAI como de Microsoft. La ronda de recaudación de fondos de OpenAI en febrero, que recaudó $110 mil millones y valoró a la empresa de forma independiente de Microsoft, sugiere que la asociación está evolucionando hacia un mercado en el que ambas partes compiten lado a lado.

El panorama más amplio de la inteligencia artificial refleja esta fragmentación. La reciente recaudación de $30 mil millones de Anthropic y las rápidas iteraciones de Gemini de Google subrayan un mercado que ya no está dominado por un solo proveedor de inteligencia artificial de vanguardia. La nueva familia de modelos de Microsoft agrega un cuarto peso pesado a la mezcla, lo que da a las empresas más opciones y señala que la era de la canalización de inteligencia artificial exclusiva de OpenAI-Microsoft está terminando.

Suleyman advierte que los modelos actuales son fundamentales. Espera que el equipo de superinteligencia entregue modelos de lenguaje de clase frontera dentro de uno o dos años, pero por ahora la tríada proporciona a Microsoft su propia voz, oídos y ojos: una pila de inteligencia artificial independiente que podría redefinir la forma en que las empresas asignan el gasto en inteligencia artificial.

Usado: News Factory APP - descubrimiento de noticias y automatización - ChatGPT para Empresas

También disponible en: