OpenAI's GPT-5.1 Refina el Rendimiento sobre GPT-5
Seguimiento Mejorado de Instrucciones
GPT-5.1 muestra una mejora notable en la obediencia a las restricciones precisas del usuario. En una prueba que requiere un resumen de cuatro oraciones de una historia bien conocida adecuada para un niño de siete años, el modelo evitó con éxito los iniciadores de oración prohibidos y entregó un resumen conciso y preciso. La versión anterior no cumplió con una de estas reglas, destacando el cumplimiento más estricto de las reglas de GPT-5.1.
Tono Conversacional Más Cálido
El modelo más nuevo adopta una voz más natural y similar a la humana. Cuando se le pidió que explicara el mareo en un tono conversacional en menos de 150 palabras, GPT-5.1 produjo una descripción amigable y relatable, mientras que la respuesta de GPT-5 se asemejaba a un libro de texto, enfatizando detalles técnicos.
Explicaciones Lógicas Más Claras
En un problema práctico de matemáticas que involucra un viaje de 142 millas a 27 millas por galón y un precio de combustible de $3.79 por galón, GPT-5.1 no solo calculó las cifras correctas, sino que también enmarcó la respuesta en términos cotidianos, señalando prácticas de redondeo típicas. GPT-5 realizó el cálculo correctamente pero con un estilo más formal y menos contextual.
Consistencia Mejorada en la Edición de Imágenes
Al editar una fotografía personal, GPT-5.1 mantuvo las características faciales del sujeto a lo largo de múltiples alteraciones, como cambiar peinados o agregar un traje de maestro de ceremonias completo. Las ediciones de GPT-5 alteraron las características faciales o introdujeron un estilo inconsistente, demostrando la superioridad de GPT-5.1 en la fidelidad a las restricciones visuales.
Razonamiento Visual Más Confiado
Para la clasificación de atuendos, GPT-5.1 etiquetó con confianza un conjunto formal como elegante, citando señales visuales específicas como una chaqueta estructurada y un moño de lazo pulido. GPT-5 proporcionó una etiqueta tentativa de negocios informales y expresó incertidumbre, subrayando el razonamiento más claro del modelo más nuevo.
En general, GPT-5.1 refina las fortalezas de GPT-5 sin entregar un avance dramático. Los mejoras en la adherencia a las instrucciones, el calor conversacional, la claridad lógica y el manejo visual en conjunto hacen que sea una herramienta más pulida para aplicaciones del mundo real, mientras que GPT-5 sigue siendo una base capaz.
Usado: News Factory APP - descubrimiento de noticias y automatización - ChatGPT para Empresas