Google Gemini agrega visualizaciones interactivas al chat, se lanza a usuarios Pro
Google está convirtiendo su chat de inteligencia artificial Gemini en un patio de juegos visual. Cuando los usuarios le piden al modelo que ilustre un concepto, el sistema ahora ofrece una simulación interactiva en lugar de una sola imagen. Un botón etiquetado como "muestra la visualización" aparece, y un clic lanza una gráfica dinámica que los usuarios pueden manipular con controles deslizantes, controles de velocidad y ajustes de vista.
La prueba de la función reveló su amplitud. Una solicitud para ver cómo la luna orbita la Tierra produjo un modelo rotativo con un control de velocidad, lo que permitió al espectador acelerar o desacelerar la trayectoria lunar. Una segunda solicitud sobre un motor de automóvil generó un diagrama animado donde los usuarios podían pausar el movimiento, avanzar por cada componente o encender y apagar el motor. Ambas demos mostraron más profundidad de lo que podría transmitir un diagrama estático.
Google dice que la herramienta está diseñada para situaciones en las que una imagen plana no es suficiente. "Muestra" o "ayuda a visualizar" son las frases que activan el sistema para crear el recurso interactivo. Las visualizaciones aparecen solo cuando se utiliza la versión Pro de Gemini, y la implementación es global. Sin embargo, la función no se extiende a cuentas de Educación o Workspace en este momento.
Anthropic introdujo una capacidad comparable para su modelo Claude en marzo, y los revisores notaron resultados impresionantes. La versión de Gemini difiere en que actualmente carece de una forma de guardar las visualizaciones generadas para su uso posterior, una función que ofrece Claude. Google no ha comentado sobre si se planea una función de guardar.
La adición se alinea con un impulso más amplio para hacer que las herramientas de inteligencia artificial generativa sean más multimodales, capaces de manejar texto, imágenes, audio y ahora gráficos interactivos. Al embedding estas simulaciones directamente en el flujo de chat, Google espera reducir la necesidad de que los usuarios busquen diagramas o videos externos. El movimiento también subraya la carrera competitiva entre los desarrolladores de inteligencia artificial para enriquecer a los asistentes conversacionales con salidas más ricas y más accionables.
Mientras que la función está limitada a los suscriptores Pro, la disponibilidad global señala la confianza de Google en que las visualizaciones interactivas se convertirán en una expectativa estándar para las interfaces de chat de inteligencia artificial. A medida que otras plataformas experimentan con herramientas similares, la industria puede pronto ver un cambio de ilustraciones estáticas a explicaciones visuales en tiempo real y controladas por el usuario.
Usado: News Factory APP - descubrimiento de noticias y automatización - ChatGPT para Empresas