Atrás

Rápido vs. Pensamiento Modelos Gemini: Una Comparación de Codificación de Vibra

Rápido vs. Pensamiento Modelos Gemini: Una Comparación de Codificación de Vibra

Descripción General del Experimento

El autor se propuso comparar dos niveles de los modelos de lenguaje grande de Google Gemini mediante la construcción del mismo proyecto de aplicación web a través de la interacción de lenguaje natural, una práctica conocida como codificación de vibra. El proyecto involucró mostrar una lista de películas de terror, mostrar imágenes de póster y proporcionar detalles adicionales a demanda. Se utilizaron los mismos prompts con Gemini 3 Pro, descrito por Google como un modelo "pensante", y Gemini 2.5 Flash, etiquetado como un modelo "rápido".

Características de los Modelos

Ambos modelos son capaces de razonamiento, pero Gemini 3 Pro está optimizado para la resolución de problemas paso a paso más profunda, lo que lo hace más lento pero más completo. Gemini 2.5 Flash equilibra la velocidad con el razonamiento, ofreciendo respuestas más rápidas a costa de ocasionalmente tomar atajos y necesitar instrucciones más precisas.

Resultados con Gemini 3 Pro

El modelo Pro generó una página de destino funcional que mostraba pósteres de películas, enlazaba a trailers de YouTube y abría una vista de detalles cuando se hacía clic en un póster. Aunque algunas características, como incrustar trailers directamente, resultaron problemáticas, el modelo identificó los problemas y permitió al autor decidir sobre soluciones alternativas. El modelo Pro también sugirió mejoras de diseño como un efecto de rueda 3D y una opción de selección aleatoria, y manejó la integración de una clave de API para The Movie Database sin instrucciones explícitas. En general, el producto final requirió menos intervenciones manuales y entregó una experiencia más cohesiva.

Resultados con Gemini 2.5 Flash

El modelo Flash produjo una versión funcional más rápidamente, pero a menudo sugirió pasos manuales, como adquirir imágenes manualmente, y requirió que el autor reemplazara secciones de código específicas en lugar de proporcionar una reescritura completa. Cuando se le pidió que incorporara la misma clave de API, el modelo la agregó pero no pudo recuperar las imágenes de póster correctas, lo que resultó en muchos errores de coincidencia. El modelo también expresó limitaciones, señalando que localizar los IDs de película exactos sería tedioso. La salida final contenía numerosos errores que persistieron a pesar de múltiples intentos de corrección.

Diferencias Clave en el Flujo de Trabajo

Con Gemini 3 Pro, cada ajuste provocó una reescritura completa del código, lo que permitió al autor copiar y pegar el archivo actualizado completo sin rastrear los cambios individuales. En contraste, Gemini 2.5 Flash a menudo devolvió solo el fragmento modificado e instruyó al usuario a reemplazarlo en el código existente, un proceso que podría estancar a los usuarios no familiarizados con la base de código. El modelo Pro también tomó la iniciativa de sugerir recursos externos y mejoras de diseño, mientras que el modelo Flash esperó instrucciones explícitas.

Conclusiones

El experimento demostró que el modelo "pensante" entrega resultados de mayor calidad con menos solución de problemas manual, aunque a un ritmo más lento. El modelo "rápido" ofrece velocidad pero exige instrucciones más precisas y una mayor participación del usuario para corregir atajos y errores. Los usuarios que buscan una experiencia de codificación de vibra más fluida pueden preferir Gemini 3 Pro, mientras que aquellos que priorizan la iteración rápida y están dispuestos a manejar pasos manuales adicionales pueden optar por el modelo Flash.

Usado: News Factory APP - descubrimiento de noticias y automatización - ChatGPT para Empresas

También disponible en: