Lo nuevo en Article Factory y lo último en el mundo de la IA generativa

Informe de OmniCalculator encuentra que Grok lidera en matemáticas mientras Claude supera la calidad de escritura

Informe de OmniCalculator encuentra que Grok lidera en matemáticas mientras Claude supera la calidad de escritura
Un nuevo benchmark de OmniCalculator muestra que xAI's Grok 4.2 supera a los chatbots de IA gratuitos en tareas lógicas y matemáticas, mientras que Anthropic's Claude 4.6 ofrece la mejor consistencia en la escritura. A pesar de un aumento en la popularidad de Claude debido a preocupaciones sobre los vínculos de ChatGPT con proyectos militares, OpenAI's ChatGPT sigue siendo el modelo más utilizado. El estudio destaca las fortalezas y tasas de inestabilidad distintas en los bots líderes, sugiriendo que los usuarios pueden necesitar combinar herramientas con tareas específicas en lugar de buscar un solo modelo de IA "más inteligente" Leer más →

El CEO de OpenAI, Sam Altman, insinúa la llegada de GPT-6 y bromea sobre "goblins extra"

El CEO de OpenAI, Sam Altman, insinúa la llegada de GPT-6 y bromea sobre "goblins extra"
El jefe de OpenAI, Sam Altman, sugirió que una próxima generación de modelo, GPT-6, ya está en desarrollo, agregando un comentario irónico sobre que debería venir con "goblins extra". El comentario siguió a un reciente incidente en el que la herramienta Codex de la empresa generó respuestas inesperadas con temas de goblins, lo que llevó a una solución rápida. Aunque Altman no ofreció un cronograma, la insinuación se alinea con el patrón de OpenAI de sugerir modelos con mejor memoria, comportamiento más consistente y una integración más estrecha con aplicaciones, a medida que la competencia de Google y Anthropic acelera el ritmo de lanzamiento. Leer más →

La barra de comandos Codex de OpenAI prohíbe a GPT-5.5 mencionar duendes y criaturas similares

La barra de comandos Codex de OpenAI prohíbe a GPT-5.5 mencionar duendes y criaturas similares
OpenAI lanzó el código fuente de su interfaz de línea de comandos Codex la semana pasada, revelando una instrucción de sistema de 3,500 palabras para el recién estrenado GPT-5.5. Entre las instrucciones rutinarias, la instrucción prohíbe explícitamente al modelo hablar sobre duendes, duendecillos, mapaches, trolls, ogros, palomas o cualquier otra criatura a menos que la consulta del usuario lo haga directamente relevante. La restricción aparece dos veces en el documento y está ausente en las instrucciones para modelos anteriores, lo que sugiere que OpenAI está respondiendo a un aumento en las referencias fuera de tema a dichas criaturas. El personal de OpenAI dice que la regla es una salvaguarda técnica, no un truco publicitario. Leer más →

Redpine, una startup de inteligencia artificial de Estocolmo, obtiene 6,8 millones de euros para impulsar una API de datos con licencia para agentes

Redpine, una startup de inteligencia artificial de Estocolmo, obtiene 6,8 millones de euros para impulsar una API de datos con licencia para agentes
Redpine, una startup de infraestructura de datos de inteligencia artificial con sede en Estocolmo, anunció una ronda de financiación de 6,8 millones de euros liderada por NordicNinja, lo que eleva su capital total a 9 millones de euros. La financiación de capital semilla, que incluye inversores de OpenAI, Perplexity, Spotify y otros fundadores de tecnología, se utilizará para expandir la startup en nuevos mercados y crecer en sus asociaciones de datos exclusivas. Leer más →

DeepSeek reduce los precios de la API V4-Pro en un 75% y recorta las tarifas de caché a una décima parte

DeepSeek reduce los precios de la API V4-Pro en un 75% y recorta las tarifas de caché a una décima parte
DeepSeek anunció un descuento promocional del 75% en su nuevo modelo V4-Pro y redujo las tarifas de caché en toda su API a una décima parte de las tarifas anteriores. El recorte de precios, que entra en vigor de inmediato y se extenderá hasta el 5 de mayo de 2026, hace que el modelo sea más barato que las ofertas de OpenAI, Anthropic y Google, incluso a precio completo. El movimiento intensifica una batalla de precios en medio de acusaciones de EE. UU. de que las empresas chinas están destilando modelos de inteligencia artificial estadounidenses a gran escala, posicionando a DeepSeek como una alternativa de bajo costo para desarrolladores y empresas. Leer más →

DeepSeek Presenta Modelos V4 de Código Abierto, Afirmación de Liderazgo en Benchmarks de Codificación y Precios de Tokens de Bajo Costo

DeepSeek Presenta Modelos V4 de Código Abierto, Afirmación de Liderazgo en Benchmarks de Codificación y Precios de Tokens de Bajo Costo
La empresa china de inteligencia artificial DeepSeek lanzó dos nuevos modelos de lenguaje grande, V4-Pro y V4-Flash, ambos con una ventana de contexto de un millón de tokens y licencias de código abierto en Hugging Face. V4-Pro, un modelo de 1,6 billones de parámetros, superó a los modelos líderes de EE. UU. en tareas de codificación y agentes, mientras que V4-Flash entregó una velocidad comparable a una fracción del costo de cómputo. DeepSeek también anunció un precio de token de $3,48 por millón de tokens de salida, lo que reduce drásticamente las tarifas de OpenAI y Anthropic, posicionando los modelos como alternativas rentables para los desarrolladores. Leer más →

Anthropic Pilota un Mercado de Agentes de Inteligencia Artificial, Completa 186 Transacciones Reales

Anthropic Pilota un Mercado de Agentes de Inteligencia Artificial, Completa 186 Transacciones Reales
Anthropic realizó un mercado de prueba donde sus agentes de inteligencia artificial actuaron como compradores y vendedores, permitiendo a los empleados intercambiar bienes reales por dinero real. El experimento de cuatro días involucró a 69 empleados, cada uno con un presupuesto de $100 en tarjetas de regalo. Los participantes completaron 186 transacciones por un valor total de más de $4,000. La empresa encontró que los agentes impulsados por su modelo más avanzado obtuvieron mejores resultados, aunque los usuarios no percibieron la ventaja. Anthropic afirma que la prueba destaca tanto la promesa del comercio de agente a agente como el riesgo de brechas ocultas de "calidad de agente". Leer más →

OpenAI lanza ChatGPT 5.5, mejorando la codificación, la investigación y las capacidades agénticas

OpenAI lanza ChatGPT 5.5, mejorando la codificación, la investigación y las capacidades agénticas
OpenAI lanzó ChatGPT 5.5 esta semana, extendiendo el nuevo modelo a los suscriptores de pago de ChatGPT y Codex, y prometiendo una versión de API pronto. Presentado como una actualización orientada al trabajo, el modelo sobresale en la codificación, la orquestación de tareas informáticas y las cargas de trabajo de investigación intensiva. El presidente Greg Brockman destacó su capacidad para interpretar problemas vagos y actuar con una dirección humana mínima, posicionándolo como un paso hacia los asistentes digitales verdaderos. OpenAI también enfatizó las salvaguardias de seguridad cibernética más fuertes, reflejando las crecientes preocupaciones sobre las amenazas impulsadas por la IA. Leer más →

OpenAI lanza GPT-5.5 para convertir a ChatGPT en una herramienta de trabajo multitarea

OpenAI lanza GPT-5.5 para convertir a ChatGPT en una herramienta de trabajo multitarea
OpenAI presentó GPT-5.5, su nuevo modelo de lenguaje que impulsa a ChatGPT, a medida que la empresa cambia de la conversación pura a la productividad autónoma y del mundo real. La actualización se implementa en ChatGPT y Codex para los niveles Plus, Pro, Business y Enterprise, con una versión "Pro" de alta gama para suscriptores de alto nivel. Diseñado para interpretar instrucciones estructuradas de manera flexible, planificar flujos de trabajo y autoverificar la salida, GPT-5.5 busca reducir las interacciones de ida y vuelta y entregar resultados de extremo a extremo en codificación, investigación, creación de documentos y análisis de datos. Leer más →