Voltar

Arcee AI Lança Trinity, um Modelo de Linguagem Aberto de 400 Bilhões de Parâmetros

Arcee AI Lança Trinity, um Modelo de Linguagem Aberto de 400 Bilhões de Parâmetros

Arcee AI Apresenta Trinity

Arcee AI, uma pequena startup dos EUA com cerca de trinta funcionários, anunciou o lançamento de Trinity, um modelo de linguagem grande (LLM) de 400 bilhões de parâmetros. O modelo é oferecido sob uma licença Apache permissiva, tornando-o permanentemente de código aberto. De acordo com a empresa, Trinity compete com o Llama 4 Maverick 400B da Meta e o GLM-4.5 de origem chinesa em avaliações de benchmark que se concentram no desempenho do modelo base com pós-treinamento mínimo.

Desempenho e Capacidades

Os resultados iniciais dos benchmarks indicam que o modelo base de Trinity se sai bem contra os principais modelos em vários domínios, incluindo codificação, matemática, raciocínio comum, conhecimento factual e raciocínio lógico. Atualmente, Trinity suporta apenas entrada e saída de texto, mas o roadmap inclui um modelo de visão e uma variante de fala-para-texto. Isso contrasta com o Llama 4 Maverick da Meta, que já suporta texto e imagens.

Público-Alvo e Posicionamento no Mercado

O público-alvo principal da startup consiste em desenvolvedores e pesquisadores acadêmicos. Arcee AI visa fornecer uma alternativa de alto nível e de código aberto para modelos que são proprietários ou sujeitos a restrições de licenciamento. A empresa enfatiza que um modelo permanentemente de código aberto e licenciado sob a Apache pode conquistar os "corações e mentes" dos desenvolvedores dos EUA que hesitam em confiar em modelos abertos da China.

Variáveis do Modelo e Disponibilidade

Trinity será lançado em três versões distintas. "Trinity Large Preview" é um modelo de seguimento de instruções levemente pós-treinado destinado ao uso geral de bate-papo. "Trinity Large Base" é o modelo base puro sem pós-treinamento. "TrueBase" remove todos os dados de instrução e pós-treinamento, permitindo que empresas e pesquisadores personalizem o modelo sem herdar regras pré-impostas. Todas as versões podem ser baixadas gratuitamente, e uma oferta de API hospedada com preços competitivos está prevista para ser lançada dentro de seis semanas.

Infraestrutura de Treinamento e Custo

O modelo foi treinado durante um período de seis meses usando 2.048 GPUs Nvidia Blackwell B300. O custo total para treinar Trinity foi de $20 milhões, financiado a partir dos aproximadamente $50 milhões que a empresa arrecadou até o momento. A equipe de treinamento foi liderada pelo CTO Lucas Atkins, que anteriormente construiu agentes de voz para aplicações automotivas.

Histórico da Empresa e Estratégia

O fundador e CEO Mark McQuade, um ex-funcionário precoce da Hugging Face, explicou que a Arcee AI originalmente se concentrou em serviços de pós-treinamento e personalização para grandes clientes corporativos, como a SK Telecom. A empresa pegaria modelos de código aberto existentes - Llama, Mistral, Qwen - e os melhoraria por meio do aprendizado por reforço e outras técnicas. À medida que a base de clientes se expandia, a necessidade de um modelo proprietário cresceu, levando à decisão de desenvolver Trinity.

Filosofia de Código Aberto

A Arcee AI escolheu a licença Apache para garantir que Trinity permaneça totalmente de código aberto, diferenciando-o de modelos como o Llama da Meta, que usa uma licença controlada pela Meta com caveats comerciais e de uso. A startup argumenta que um modelo verdadeiramente aberto e de ponta é essencial para as empresas dos EUA que são cautelosas em relação a confiar em modelos de origem chinesa.

Perspectiva Futura

Além de Trinity, a Arcee AI planeja continuar expandindo sua suíte de modelos com capacidades multimodais e oferecer serviços de API hospedada a taxas competitivas com os principais provedores de nuvem. A empresa também mantém uma linha de negócios para serviços de pós-treinamento e personalização, aproveitando sua expertise em adaptar modelos para aplicações corporativas específicas.

Usado: News Factory APP - descoberta e automação de notícias - ChatGPT para Empresas

Também disponível em: