Voltar

DeepSeek Lança Modelos de IA de Código Aberto que Rivalizam com Sistemas Líderes dos EUA

DeepSeek Lança Modelos de IA de Código Aberto que Rivalizam com Sistemas Líderes dos EUA

Modelos de Código Aberto Visam o Desempenho de Fronteira

DeepSeek, uma startup de IA chinesa, anunciou o lançamento de dois grandes modelos de linguagem: DeepSeek-V3.2 e uma variante de alto desempenho chamada DeepSeek-V3.2-Speciale. Ambos os modelos são distribuídos sob uma licença de código aberto do tipo MIT, permitindo que qualquer pessoa baixe, modifique e comercialize os pesos. Segundo a DeepSeek, os modelos igualam ou superam as capacidades do GPT-5 e Gemini 3 Pro em tarefas que exigem raciocínio de longo prazo, uso de ferramentas e resolução de problemas densos, como competições internacionais de matemática e programação.

Inovações técnicas importantes incluem um mecanismo de atenção esparsa que reduz o custo de processamento de documentos longos, focando nas partes de entrada mais relevantes, cortando despesas para contextos de 128.000 tokens em até 70 %. Os modelos também retêm memória em interações de ferramentas, permitindo fluxos de trabalho mais fluidos e multietapas que envolvem navegadores da web, ambientes de programação e outras utilidades.

Bancos de Desempenho e Utilidade no Mundo Real

DeepSeek-V3.2-Speciale alcançou uma pontuação de 99,2 % no Torneio de Matemática de Harvard-MIT, 73 % em tarefas de correção de bugs de software e resultados de medalha de ouro em vários benchmarks internacionais sem acesso à internet externa. Os modelos foram treinados em mais de 85.000 instruções sintéticas complexas para melhorar a capacidade de uso de ferramentas, posicionando-os para aplicações no mundo real, como planejamento de férias de vários dias, restrições orçamentárias e verificação de código.

Consequências Geopolíticas e Regulatórias

O lançamento de código aberto atraiu a atenção de reguladores e formuladores de políticas. Autoridades alemãs tentaram bloquear a DeepSeek devido a preocupações com a transferência de dados, a Itália proibiu anteriormente o aplicativo e os legisladores dos EUA pediram sua remoção de dispositivos governamentais. Essas ações refletem tensões mais amplas em torno de empresas de IA chinesas e as implicações estratégicas de modelos de alto desempenho amplamente acessíveis.

Impacto no Paisagem de IA

Ao oferecer desempenho de fronteira a uma fração do custo associado a modelos proprietários que dependem de APIs pagas e testes de equipe vermelha extensivos, a DeepSeek desafia a estrutura de mercado atual dominada por empresas americanas. A medida destaca uma mudança do acesso exclusivo e pago para uma democratização mais ampla de capacidades de IA avançadas, enquanto também destaca os trade-offs entre abertura, segurança e risco geopolítico.

Usado: News Factory APP - descoberta e automação de notícias - ChatGPT para Empresas

Também disponível em: