Atrás

La aplicación Gemini de Mac de Google agrega características de agente para competir con Anthropic y OpenAI

Google presentó una aplicación dedicada de Gemini para macOS esta semana, expandiendo el chatbot de IA más allá de las interacciones de texto. El nuevo cliente permite a los usuarios invocar el modelo con una combinación de teclas Option-Espacio y compartir una ventana para que Gemini pueda ver lo que hay en la pantalla. Esa alimentación visual elimina la necesidad de copiar y pegar, dando al asistente el contexto que puede utilizar para realizar acciones directamente en la máquina.

Según un análisis del kit de paquete de Android de la aplicación, el software ya solicita permisos de acceso a la pantalla y accesibilidad de macOS. Esos permisos permitirían a Gemini leer la pantalla, mover el cursor, escribir en el teclado y manipular archivos. En la práctica, un usuario podría pedirle al asistente que localice un documento, lo renombre o lo mueva a un archivo de Google Docs sin abrir Finder.

El movimiento refleja la característica reciente de Claude Cowork de Anthropic, que permite a su IA controlar una computadora para completar tareas. Google no ha anunciado oficialmente un modelo de "uso de computadora" similar para Gemini, pero la evidencia sugiere que podría ser un prototipo que pronto rivalice con la oferta de Anthropic. Si la aplicación puede convertir contenido no estructurado en Docs, Sheets o Slides, daría a los usuarios de Workspace una poderosa herramienta para convertir notas, PDF o imágenes en archivos editables.

El impulso de Google llega mientras OpenAI desarrolla silenciosamente una "superaplicación" que combinaría ChatGPT, Atlas y Codex en una sola interfaz. La competencia subraya una tendencia más amplia en la industria: los asistentes de IA están pasando de la conversación pura a la interacción directa con los sistemas operativos. Al otorgar a Gemini acceso a nivel de pantalla, Google posiciona su modelo como una herramienta de productividad más práctica, potencialmente superando al cliente actual de OpenAI para macOS, que sigue limitado a chat.

Los observadores de la industria señalan que la aplicación Gemini de Mac aún está en su infancia. La mayoría de los usuarios ven una ventana de chat simple, y el lanzamiento basado en combinaciones de teclas se siente similar al cliente de escritorio de ChatGPT. Sin embargo, la capacidad subyacente de leer la pantalla y actuar sobre ella podría establecer un nuevo estándar para los asistentes de IA en computadoras personales. Si Google amplía el conjunto de características, los desarrolladores podrían aprovechar el modelo de uso de computadora Gemini 2.5 que la empresa abrió a los socios el pasado octubre.

Por ahora, Google no ha confirmado ninguna hoja de ruta para funciones agenticas más amplias. El silencio de la empresa deja a los analistas esperando para ver si la aplicación de Mac se evolucionará en un asistente de escritorio completo o permanecerá como una superposición de chat modesta. De cualquier manera, el lanzamiento señala que las principales empresas de IA están apostando por una integración más profunda con los flujos de trabajo cotidianos de los usuarios, y la plataforma Mac es el último campo de batalla.

Usado: News Factory APP - descubrimiento de noticias y automatización - ChatGPT para Empresas

También disponible en: