A empresa chinesa de IA DeepSeek lançou dois novos modelos de linguagem grande, V4-Pro e V4-Flash, ambos com uma janela de contexto de um milhão de tokens e licenças de código aberto no Hugging Face. O V4-Pro, um modelo de 1,6 trilhão de parâmetros, superou os principais modelos dos EUA em tarefas de codificação e agência, enquanto o V4-Flash entregou velocidade comparável a uma fração do custo de computação. A DeepSeek também anunciou um preço de token de $3,48 por milhão de tokens de saída, dramaticamente abaixo dos preços da OpenAI e da Anthropic, posicionando os modelos como alternativas de baixo custo para os desenvolvedores.
Leia mais →