Atrás

Google Gemini ahora genera imágenes personalizadas desde tus fotos de Google

La suite de AI de Google, Gemini, dio un paso hacia la creación visual verdaderamente personalizada el martes, al anunciar que su función de Inteligencia Personal puede ahora extraer datos de la biblioteca de Google Photos de un usuario para crear imágenes personalizadas. La actualización, descrita en una publicación del blog de la empresa, permite a los suscriptores de Gemini AI Plus, Pro o Ultra en Estados Unidos escribir peticiones como "Diseña mi casa soñada" o "Muestra mis elementos esenciales para una isla desierta", y recibir imágenes que reflejan sus preferencias individuales, opciones de decoración y incluso miembros de la familia.

Detrás de escena, Gemini escanea las etiquetas y metadatos que Google Photos asigna automáticamente a las imágenes, reconociendo caras, objetos y ubicaciones, para construir una imagen contextual de la vida del usuario. Esa información alimenta el modelo de imagen Nano Banana 2, que luego genera una visual que refleja el estilo del usuario. Un portavoz de Google explicó que el AI no simplemente combina fotos de stock aleatorias, sino que ajusta la composición según las pistas específicas extraídas de las aplicaciones conectadas.

El movimiento refleja el impulso más amplio de Google para combinar la inteligencia artificial generativa con datos personales mientras mantiene una línea de privacidad clara. La empresa enfatizó que optar por la Inteligencia Personal no significa que Google "entrenará directamente" sus modelos fundamentales en el archivo de fotos privadas de un suscriptor. En cambio, solo se puede utilizar información limitada, como el texto de la petición de un usuario y la respuesta del modelo, para mejorar el rendimiento de la función. Google afirma que este enfoque mantiene los datos de entrenamiento de AI básicos separados del contenido de usuario individual.

Google planea implementar la nueva capacidad en los próximos días a los suscriptores elegibles de Gemini en Chrome de escritorio, con "más usuarios" programados para recibir acceso poco después. La implementación se limitará inicialmente a Estados Unidos, pero la empresa insinuó una expansión internacional más amplia una vez que la función se pruebe estable.

Implementación a suscriptores

Los usuarios elegibles verán un nuevo interruptor en la configuración de Gemini que habilita la Inteligencia Personal para Google Photos. Una vez activado, el AI puede hacer referencia a las imágenes etiquetadas del usuario siempre que se realice una solicitud visual. Google señala que la función funciona mejor cuando la biblioteca de fotos contiene un conjunto rico de contenido etiquetado, ya que el AI depende de esas etiquetas para inferir el gusto y el contexto. Los testers tempranos informaron que las imágenes generadas se sintieron sorprendentemente precisas, capturando detalles como paletas de colores favoritas, estilos arquitectónicos preferidos e incluso lugares de vacaciones recurrentes.

Los observadores de la industria ven la actualización como parte de una tendencia más grande en la que las plataformas de AI buscan ofrecer experiencias hiperpersonalizadas. Al combinar modelos generativos con datos personales, las empresas esperan diferenciar sus servicios en un mercado saturado. Para Google, la integración también sirve como una demostración de las capacidades de su modelo Nano Banana 2, una iteración más nueva diseñada para una mayor fidelidad y renderizado más rápido.

Los defensores de la privacidad probablemente mantendrán un ojo cercano a cómo evoluciona la función. Si bien Google asegura a los usuarios que sus fotos privadas no se utilizarán para entrenar el modelo base, el sistema procesa metadatos en tiempo real para producir las imágenes. Los usuarios que no se sienten cómodos con ese nivel de uso de datos pueden optar por no participar en la Inteligencia Personal o desconectar su cuenta de Google Photos.

En general, la mejora posiciona a Gemini como una de las pocas herramientas de AI para consumidores que pueden producir visuales verdaderamente individualizados sin requerir que los usuarios carguen archivos de referencia separados. A medida que la tecnología madura, es posible que veamos integraciones similares en otros servicios de Google, lo que difumina aún más la línea entre los datos personales y la creatividad generativa.

Usado: News Factory APP - descubrimiento de noticias y automatización - ChatGPT para Empresas

También disponible en: