Voltar

Google Lança Modelos Gemma 4 e Muda para Licença Apache 2.0

Novos Modelos Gemma 4

Google anunciou a série Gemma 4, expandindo seu portfólio de modelos de inteligência artificial de peso aberto. A família inclui quatro tamanhos projetados para diferentes cenários de implantação, desde servidores de alto desempenho até dispositivos móveis e de borda. Ao fornecer modelos que podem ser executados localmente, Google busca dar aos desenvolvedores mais controle sobre os ambientes de inferência e reduzir a dependência de serviços de nuvem.

Hardware e Desempenho

As duas variantes maiores — nomeadas 26B Mixture of Experts (MoE) e 31B Dense — são projetadas para operar sem quantização no formato bfloat16 em uma única GPU Nvidia H100 de 80GB. Embora o H100 seja um acelerador de IA de alto desempenho, Google observa que as versões quantizadas desses modelos podem ser executadas em GPUs de consumo, ampliando a acessibilidade. Uma melhoria importante no desempenho é a redução da latência. O modelo 26B MoE ativa apenas 3,8 bilhões de seus 26 bilhões de parâmetros durante a inferência, entregando um maior número de tokens por segundo do que os concorrentes de tamanho semelhante. O modelo 31B Dense enfatiza a qualidade e é esperado para ser ajustado para aplicações específicas.

Variantes Otimizadas para Dispositivos Móveis

Effective 2B (E2B) e Effective 4B (E4B) são os modelos Gemma 4 menores destinados a dispositivos móveis e de borda. Google trabalhou em estreita colaboração com Qualcomm e MediaTek para otimizar esses modelos para smartphones, placas Raspberry Pi e plataformas Jetson Nano. Os projetos mantêm o uso de memória baixo durante a inferência e prometem "latência quase zero", oferecendo uma alternativa mais eficiente aos modelos Gemma 3 anteriores.

Mudança de Licença

Em resposta ao feedback dos desenvolvedores sobre as restrições de licenciamento, Google está descartando sua licença personalizada Gemma em favor da licença Apache 2.0. Essa mudança fornece aos desenvolvedores uma liberdade mais ampla para usar, modificar e distribuir os modelos sem as restrições anteriormente impostas pela licença proprietária.

Posição Competitiva

Google afirma que os modelos Gemma 4 são os sistemas de IA mais capazes que podem ser executados em hardware local. Ele prevê que a variante 31B Dense será classificada em terceiro lugar na lista Arena de modelos de IA abertos de ponta, atrás apenas de GLM-5 e Kimi 2,5. Apesar dessa classificação alta, os modelos Gemma 4 permanecem uma fração do tamanho dos concorrentes líderes, potencialmente reduzindo os custos operacionais para os usuários.

Usado: News Factory APP - descoberta e automação de notícias - ChatGPT para Empresas

Também disponível em: