Cohere Presenta la Familia de Modelos Multilingües Tiny Aya de Peso Abierto
Resumen del Lanzamiento
La empresa de inteligencia artificial empresarial Cohere anunció el lanzamiento de una nueva familia de modelos multilingües llamada Tiny Aya. El anuncio se produjo junto con la Cumbre de Inteligencia Artificial de la India y fue presentado por Cohere Labs, la división de investigación de la empresa. Los modelos son de peso abierto, lo que significa que el código subyacente está disponible públicamente para que cualquier persona lo utilice, modifique o redistribuya.
Capacidades del Modelo
La familia Tiny Aya admite más de 70 idiomas y está diseñada para ejecutarse en dispositivos estándar como laptops, eliminando la necesidad de una conexión constante a Internet. El modelo base contiene 3,35 mil millones de parámetros, un tamaño que equilibra la capacidad lingüística con demandas computacionales modestas. La suite incluye una variante global, TinyAya-Global, ajustada para seguir comandos de usuario en un conjunto amplio de idiomas, así como tres versiones regionales: TinyAya-Tierra para idiomas africanos, TinyAya-Fuego para idiomas surasiáticos - incluyendo bengalí, hindi, punjabi, urdu, guyaratí, tamil, telugu y maratí - y TinyAya-Agua para idiomas hablados en Asia-Pacífico, Asia Occidental y Europa.
Detalles Técnicos
Todos los modelos Tiny Aya se entrenaron en un solo cluster de 64 GPUs H100, un chip de alto rendimiento de Nvidia, utilizando recursos computacionales relativamente modestos. Cohere diseñó el software subyacente para su uso en dispositivos, requiriendo menos potencia computacional que la mayoría de los modelos comparables. Esta arquitectura permite la traducción sin conexión y otras tareas intensivas en lenguaje sin depender de servicios en la nube, un beneficio destacado para mercados lingüísticamente diversos como la India.
Disponibilidad y Ecosistema
Los modelos están disponibles públicamente en la plataforma HuggingFace y la plataforma Cohere. Los desarrolladores también pueden descargarlos desde Kaggle y Ollama para su implementación local. Cohere está lanzando los conjuntos de datos de entrenamiento y evaluación en HuggingFace y planea emitir un informe técnico que detalla la metodología de entrenamiento. Estos recursos tienen como objetivo ayudar a los investigadores y desarrolladores a crear aplicaciones que sirvan a las audiencias de habla nativa.
Contexto Empresarial
During el anuncio, el CEO de Cohere, Aidan Gomez, reiteró la intención de la empresa de salir a la bolsa "pronto". Los informes financieros citados por CNBC indicaron que Cohere terminó 2025 con $240 millones en ingresos recurrentes anuales y experimentó un crecimiento del 50 % trimestre a trimestre durante todo el año. El lanzamiento de Tiny Aya se alinea con la estrategia más amplia de Cohere para proporcionar modelos de lenguaje de alta calidad y accesibles para desarrolladores y empresas de todo el mundo.
Usado: News Factory APP - descubrimiento de noticias y automatización - ChatGPT para Empresas