Voltar

Rápido vs. Pensativo: Uma Comparação de Modelos Gemini por Vibe-Coding

Rápido vs. Pensativo: Uma Comparação de Modelos Gemini por Vibe-Coding

Visão Geral do Experimento

O autor buscou comparar dois níveis de modelos de linguagem grande da Google, Gemini, construindo o mesmo projeto de aplicativo web por meio de interação de linguagem natural, uma prática conhecida como vibe-coding. O projeto envolvia exibir uma lista de filmes de terror, mostrar imagens de pôster e fornecer detalhes adicionais sob demanda. Os mesmos prompts foram usados com o Gemini 3 Pro, descrito pela Google como um modelo "pensativo", e o Gemini 2.5 Flash, rotulado como um modelo "rápido".

Características dos Modelos

Ambos os modelos são capazes de raciocínio, mas o Gemini 3 Pro é otimizado para resolução de problemas mais profunda e passo a passo, o que o torna mais lento, mas mais completo. O Gemini 2.5 Flash equilibra velocidade com raciocínio, oferecendo respostas mais rápidas ao custo de ocasionais atalhos e necessidade de prompts mais precisos.

Resultados com o Gemini 3 Pro

O modelo Pro gerou uma página de destino funcional que exibia pôsteres de filmes, linkava para trailers do YouTube e abria uma visão de detalhes quando um pôster era clicado. Embora algumas funcionalidades - como incorporar trailers diretamente - tenham se mostrado problemáticas, o modelo identificou os problemas e permitiu que o autor decidisse sobre soluções alternativas. O modelo Pro também sugeriu melhorias de design, como um efeito de roda 3D e uma opção de escolha aleatória, e lidou com a integração de uma chave de API para o The Movie Database sem instruções explícitas. No geral, o produto final exigiu menos intervenções manuais e forneceu uma experiência mais coesa.

Resultados com o Gemini 2.5 Flash

O modelo Flash produziu uma versão funcional mais rapidamente, mas frequentemente sugeriu etapas manuais, como adquirir imagens manualmente, e exigiu que o autor substituísse seções específicas de código em vez de fornecer uma reescrita completa. Quando solicitado a incorporar a mesma chave de API, o modelo a adicionou, mas falhou em recuperar imagens de pôster corretas, resultando em muitas discrepâncias. O modelo também expressou limitações, observando que localizar IDs de filmes exatos seria demorado. A saída final continha numerosos erros que persistiram apesar de múltiplas tentativas de correção.

Diferenças Chave no Fluxo de Trabalho

Com o Gemini 3 Pro, cada ajuste acionou uma reescrita completa do código, permitindo que o autor copiasse e colasse o arquivo atualizado inteiro sem rastrear alterações individuais. Em contraste, o Gemini 2.5 Flash frequentemente retornou apenas o trecho modificado e instruiu o usuário a substituí-lo no código existente, um processo que poderia estagnar usuários não familiarizados com a base de código. O modelo Pro também tomou a iniciativa de sugerir recursos externos e melhorias de design, enquanto o modelo Flash aguardou prompts explícitos.

Conclusões

O experimento demonstrou que o modelo "pensativo" entrega resultados de maior qualidade com menos solução de problemas manual, embora em um ritmo mais lento. O modelo "rápido" oferece velocidade, mas exige instruções mais precisas e maior envolvimento do usuário para corrigir atalhos e erros. Usuários que buscam uma experiência de vibe-coding mais suave podem preferir o Gemini 3 Pro, enquanto aqueles que priorizam iteração rápida e estão dispostos a gerenciar etapas manuais adicionais podem optar pelo modelo Flash.

Usado: News Factory APP - descoberta e automação de notícias - ChatGPT para Empresas

Também disponível em: