What is new on Article Factory and latest in generative AI world

Relatório do OmniCalculator Descobre que o Grok Lidera em Matemática, Enquanto o Claude Supera em Qualidade de Escrita

Relatório do OmniCalculator Descobre que o Grok Lidera em Matemática, Enquanto o Claude Supera em Qualidade de Escrita
Um novo benchmark do OmniCalculator mostra que o Grok 4.2 da xAI supera os chatbots de IA gratuitos em tarefas lógicas e matemáticas, enquanto o Claude 4.6 da Anthropic entrega a melhor consistência de escrita. Apesar de um aumento na popularidade do Claude devido a preocupações sobre os vínculos do ChatGPT com projetos militares, o ChatGPT da OpenAI permanece o modelo mais amplamente utilizado. O estudo destaca forças e taxas de instabilidade distintas nos principais bots, sugerindo que os usuários podem precisar combinar ferramentas com tarefas específicas em vez de buscar um único "modelo mais inteligente" de IA. Leia mais →

CEO da OpenAI, Sam Altman, faz piada sobre GPT-6, mencionando "goblins extras"

CEO da OpenAI, Sam Altman, faz piada sobre GPT-6, mencionando "goblins extras"
O CEO da OpenAI, Sam Altman, sugeriu que um modelo de próxima geração, o GPT-6, já está em desenvolvimento, acrescentando uma piada sobre "goblins extras". O comentário veio após um recente incidente em que a ferramenta Codex da empresa gerou respostas inesperadas com tema de goblins, o que levou a uma solução rápida. Embora Altman não tenha oferecido um cronograma, a sugestão se alinha com o padrão da OpenAI de melhorar a memória, o comportamento e a integração com aplicativos, à medida que a concorrência da Google e da Anthropic acelera o ritmo de lançamento. Leia mais →

OpenAI Proíbe GPT-5.5 de Mencionar Goblins e Criaturas Semelhantes

OpenAI Proíbe GPT-5.5 de Mencionar Goblins e Criaturas Semelhantes
OpenAI lançou o código-fonte da interface de linha de comando Codex, revelando um prompt de sistema de 3.500 palavras para o recém-lançado GPT-5.5. O prompt proíbe explicitamente o modelo de falar sobre goblins, gremlins, guaxinins, trolls, ogros, pombos ou qualquer outra criatura, a menos que a consulta do usuário seja diretamente relevante. Leia mais →

Startup de Dados de AI da Estocolmo, Redpine, Garante €6,8 Milhões para Impulsionar API de Dados Licenciados para Agentes

Startup de Dados de AI da Estocolmo, Redpine, Garante €6,8 Milhões para Impulsionar API de Dados Licenciados para Agentes
Redpine, uma startup de infraestrutura de dados de AI sediada em Estocolmo, anunciou uma rodada de financiamento de €6,8 milhões liderada pela NordicNinja, elevando seu capital total para €9 milhões. A rodada de financiamento inclui investidores da OpenAI, Perplexity, Spotify e outros fundadores de tecnologia, e será usada para expandir a presença da empresa em novos mercados e crescer suas parcerias de dados exclusivas. Leia mais →

DeepSeek reduz preços da API V4-Pro em 75% e corta taxas de cache para um décimo

DeepSeek reduz preços da API V4-Pro em 75% e corta taxas de cache para um décimo
DeepSeek anunciou um desconto promocional de 75% em seu novo modelo V4-Pro e reduziu as taxas de cache-hit em toda a sua API para 10% das taxas anteriores. O corte de preços, efetivo imediatamente e válido até 5 de maio de 2026, torna o modelo mais barato do que as ofertas da OpenAI, Anthropic e Google, mesmo ao preço cheio. A medida intensifica uma batalha de preços em meio a acusações dos EUA de que empresas chinesas estão distilando modelos de IA americanos em larga escala, posicionando a DeepSeek como uma alternativa de baixo custo para desenvolvedores e empresas. Leia mais →

DeepSeek Lança Modelos V4 de Código Aberto, Alegando Liderança em Benchmarks de Codificação e Preços de Tokens de Baixo Custo

DeepSeek Lança Modelos V4 de Código Aberto, Alegando Liderança em Benchmarks de Codificação e Preços de Tokens de Baixo Custo
A empresa chinesa de IA DeepSeek lançou dois novos modelos de linguagem grande, V4-Pro e V4-Flash, ambos com uma janela de contexto de um milhão de tokens e licenças de código aberto no Hugging Face. O V4-Pro, um modelo de 1,6 trilhão de parâmetros, superou os principais modelos dos EUA em tarefas de codificação e agência, enquanto o V4-Flash entregou velocidade comparável a uma fração do custo de computação. A DeepSeek também anunciou um preço de token de $3,48 por milhão de tokens de saída, dramaticamente abaixo dos preços da OpenAI e da Anthropic, posicionando os modelos como alternativas de baixo custo para os desenvolvedores. Leia mais →

Anthropic Lança Mercado de Agentes de IA, Completa 186 Negociações Reais

Anthropic Lança Mercado de Agentes de IA, Completa 186 Negociações Reais
A Anthropic realizou um piloto de mercado onde seus agentes de IA atuaram como compradores e vendedores, permitindo que os funcionários negociassem bens reais por dinheiro real. O experimento de quatro dias envolveu 69 funcionários, cada um com um orçamento de $100 em cartões-presente. Os participantes concluíram 186 transações no valor de mais de $4.000. A empresa descobriu que os agentes alimentados por seu modelo mais avançado obtiveram melhores resultados, embora os usuários não percebessem a vantagem. A Anthropic afirma que o teste destaca tanto a promessa do comércio de agente para agente quanto o risco de lacunas ocultas de "qualidade de agente". Leia mais →