Google Reorganiza Equipo de Agentes de Navegador a medida que la Industria se Desplaza hacia Agentes de Codificación y Basados en Terminal de IA
Cambios en el Equipo de Google
Google está reestructurando el grupo que construyó Project Mariner, un prototipo de IA diseñado para navegar el navegador Chrome y realizar tareas en nombre del usuario. Según dos insiders, varios miembros del personal de Google Labs que contribuyeron al prototipo de investigación han sido reasignados a proyectos de mayor prioridad. Un portavoz de Google confirmó la reasignación, señalando que las capacidades de uso de computadora desarrolladas bajo Project Mariner se integrarán en la estrategia general de agentes de la empresa y se incorporarán en productos como el recientemente lanzado Gemini Agent.
Contexto de la Industria: Ascenso de los Agentes Basados en Terminal
El cambio interno se produce a medida que los laboratorios de IA en todo el Valle de Silicio responden a la emergencia de agentes poderosos como OpenClaw. El CEO de Nvidia, Jensen Huang, comparó OpenClaw con un nuevo sistema operativo para "computadoras de agentes", instando a todas las empresas a desarrollar una estrategia de OpenClaw. Estos agentes difieren de las herramientas de automatización de navegador anteriores en que controlan las computadoras a través de terminales de texto, un método que los investigadores dicen que es mucho más eficiente que procesar capturas de pantalla de interfaces gráficas.
Desafíos para los Agentes de Navegador
Los agentes de navegador inicialmente generaron entusiasmo en eventos como la conferencia I/O de Google, donde el CEO Sundar Pichai destacó Project Mariner como una posible próxima gran apuesta. Los productos de OpenAI y Perplexity prometieron automatizar tareas en línea haciendo clic, desplazándose y llenando formularios. Sin embargo, la adopción de los usuarios ha sido lenta. El agente de navegador Comet de Perplexity registró aproximadamente 2,8 millones de usuarios activos semanales en diciembre de 2025, mientras que el agente ChatGPT de OpenAI cayó por debajo de un millón de usuarios activos semanales en los últimos meses. En comparación con los cientos de millones de usuarios activos semanales de ChatGPT, el uso de agentes de navegador sigue siendo una pequeña fracción del compromiso total de IA.
Ganancias de Eficiencia de la Interacción de Terminal
Los expertos argumentan que los agentes basados en terminal requieren menos pasos computacionales porque tanto los agentes como los modelos de lenguaje subyacentes operan en texto. Kian Katanforoosh, CEO de la plataforma de capacitación en IA Workera, explicó que trabajar con un terminal puede ser "10 a 100 veces menos pasos" que procesar capturas de pantalla visuales. Las startups también están explorando nuevos enfoques para mejorar la eficiencia. Standard Intelligence lanzó un modelo de uso de computadora entrenado en flujos de video, reclamando un aumento de eficiencia 50 veces mayor que los modelos anteriores basados en capturas de pantalla y demostrando la capacidad al conducir brevemente un coche de forma autónoma en San Francisco.
Papel Continuo de los Agentes de GUI
A pesar del impulso detrás de los agentes de terminal, algunos líderes ven una necesidad duradera de automatización de interfaz de usuario gráfica (GUI). Ang Li, CEO de Simular y ex investigador de Google DeepMind, describió una "división 80/20" donde la mayoría de los problemas se pueden resolver a través del terminal, pero ciertas aplicaciones heredadas, como los portales de seguros de salud, todavía requieren interacción de GUI porque carecen de API accesibles.
Desplazamiento hacia Agentes de Codificación
En todo el paisaje de IA, las empresas están apostando cada vez más por agentes de codificación que no solo pueden operar aplicaciones sino también modificar archivos y generar software personalizado. Estos agentes pueden, por ejemplo, ingerir estados de cuenta bancarios y crear un panel de presupuesto personalizado. OpenAI planea alimentar a agentes de propósito general dentro de ChatGPT con su tecnología Codex, mientras que Anthropic ha lanzado Claude Cowork, una rama de Claude Code que no requiere un terminal. Perplexity, que previamente se centró en agentes de navegador, recientemente introdujo un producto llamado Computer Personal que se alinea con esta tendencia de agentes de codificación.
Implicaciones para los Consumidores
Tanto Google como OpenAI han sugerido que los agentes de consumidores futuros podrían manejar tareas cotidianas como ordenar groceries desde Instacart o reservar una mesa para cenar. Si bien estos casos de uso parecen convenientes, la adopción generalizada puede depender de la confianza de los usuarios en que los agentes realizarán sus tareas de manera fiable y sin errores. La trayectoria actual de la industria indica un equilibrio: mantener las capacidades basadas en GUI para tareas heredadas mientras se expanden las funcionalidades más eficientes de terminal y agentes de codificación.
Usado: News Factory APP - descubrimiento de noticias y automatización - ChatGPT para Empresas