O laboratório de inteligência artificial chinês DeepSeek lançou duas versões de pré-visualização de seu próximo modelo de linguagem grande, DeepSeek V4 Flash e V4 Pro. Ambos os modelos usam uma arquitetura de mistura de especialistas e suportam uma janela de contexto de 1 milhão de tokens, permitindo que os usuários forneçam código-fonte ou documentos longos em prompts. DeepSeek afirma que V4 Pro, com 1,6 trilhão de parâmetros (49 bilhões ativos), é o maior modelo de peso aberto do mercado, enquanto V4 Flash oferece uma opção menor e mais acessível.
Leia mais →