Mistral se acerca a los rivales de la gran IA con una nueva frontera abierta y modelos pequeños
Resumen del lanzamiento
La startup francesa de inteligencia artificial Mistral introdujo la familia Mistral 3, una suite de modelos de peso abierto diseñada para competir con los sistemas de código cerrado líderes. El lanzamiento incluye un modelo grande llamado Mistral Large 3 y nueve modelos más pequeños en tres categorías de tamaño. Al publicar los pesos de los modelos públicamente, Mistral permite a los desarrolladores descargar, ejecutar y modificar los modelos sin depender de API externas.
Características de los modelos
El modelo de frontera grande emplea una arquitectura de Mezcla de Expertos granular con 41 mil millones de parámetros activos y un total de 675 mil millones de parámetros. Soporta una ventana de contexto de 256.000 tokens y combina capacidades multimodales y multilingües, posicionándolo junto a otras fronteras de peso abierto como Meta’s Llama 3 y Alibaba’s Qwen3-Omni.
La línea de modelos más pequeños, denominada Ministral 3, comprende nueve modelos densos en tres tamaños de parámetros: 14 mil millones, 8 mil millones y 3 mil millones. Cada tamaño se ofrece en tres variantes: Base (preentrenada), Instruct (optimizada para chat) y Reasoning (enfocada en lógica). Todos los modelos soportan visión, manejan ventanas de contexto entre 128.000 y 256.000 tokens, y pueden ejecutarse en una sola GPU, lo que los hace adecuados para dispositivos de borde, laptops y servidores de premises.
Enfoque empresarial y eficiencia
Mistral destaca que muchos casos de uso empresariales pueden abordarse de manera efectiva con modelos más pequeños y ajustados, que ofrecen un costo más bajo y una infencia más rápida en comparación con las alternativas de código cerrado grandes. La empresa argumenta que, si bien los modelos grandes pueden funcionar bien fuera de la caja, los modelos más pequeños personalizados pueden igualar o superar el rendimiento para tareas específicas. La capacidad de ejecutar en una sola GPU también reduce los requisitos de hardware y elimina la dependencia del tiempo de actividad de las API externas.
Colaboraciones y aplicaciones
Más allá del lanzamiento del modelo, Mistral está extendiendo su tecnología a dominios especializados. Las colaboraciones incluyen trabajo con la Agencia de Ciencia y Tecnología del Equipo de la Casa de Singapur en modelos de robótica, ciberseguridad y seguridad contra incendios; una asociación con la startup de defensa alemana Helsing para desarrollar modelos de visión-lenguaje-acción para drones; y una alianza con el fabricante de automóviles Stellantis para crear un asistente de IA en el vehículo. Estos esfuerzos ilustran la intención de Mistral de integrar sus modelos en sistemas del mundo real que demandan confiabilidad, capacidad de funcionamiento sin conexión y soberanía de datos.
Usado: News Factory APP - descubrimiento de noticias y automatización - ChatGPT para Empresas