Google Melhora Modo de IA com Capacidades de Pesquisa Visual
Pesquisa Visual se Junta ao Modo de IA Impulsionado por Gemini
Google introduziu uma dimensão visual para seu Modo de IA impulsionado por Gemini, misturando a pesquisa tradicional baseada em texto com as capacidades do Google Lens e da Pesquisa de Imagens. O aprimoramento permite que os usuários enviem uma fotografia e façam perguntas em linguagem natural sobre ela, ou recebam coleções de imagens que se alinham com a consulta original.
Como o Motor de Pesquisa Funciona
O componente visual emprega o que Google chama de abordagem de "diversificação da pesquisa visual" em camadas sobre o método de diversificação existente usado para consultas textuais. Quando um usuário fornece uma imagem, o sistema a decompoem em elementos distintos - objetos, fundo, cor e textura - e envia múltiplas consultas internas simultaneamente. Essa consulta paralela permite que o mecanismo recupere um conjunto mais amplo de imagens relevantes, em vez de simplesmente ecoar a imagem original. Os resultados retornados são então recombinações, priorizando aqueles que melhor atendem à intenção do usuário.
Implicações para os Resultados da Pesquisa
A infraestrutura de pesquisa do Google deve decidir quais dos visuais recuperados destacar e quais suprimir. A empresa observa que o sistema pode mal interpretar a intenção, elevar conteúdo patrocinado ou favorecer grandes marcas cujos ativos visuais estão melhor otimizados para o consumo de IA. Consequentemente, sites que carecem de imagens limpas ou metadados visuais robustos correm o risco de ter visibilidade diminuída nos novos resultados centrados em visuais.
Integração com o Gráfico de Compras
No lado do comércio, a pesquisa visual aproveita o Gráfico de Compras do Google, um índice maciço que cataloga bilhões de produtos e é atualizado a cada hora. Uma foto de um par de calças jeans, por exemplo, pode mostrar preços atuais, avaliações de consumidores e disponibilidade em lojas locais em um único fluxo. Essa capacidade visa transformar prompts visuais vagos em opções de compra concretas, simplificando o caminho da descoberta à compra.
Paisagem Competitiva
O movimento da Google a junta a ferramentas de pesquisa visual existentes, como o Pinterest Lens e a pesquisa visual do Bing habilitada pelo Copilot da Microsoft. No entanto, a empresa argumenta que poucos concorrentes combinam um banco de dados global de produtos, dados de preços em tempo real e IA conversacional em uma única oferta. Ao combinar esses elementos, a Google espera que defina um novo padrão para experiências de pesquisa que são tanto sobre ver quanto ler.
Riscos e Desafios Potenciais
Apesar da promessa, a Google reconhece possíveis armadilhas. Mal interpretações da intenção do usuário, resultados visuais imprecisos ou favoráveis ao patrocínio e a promoção involuntária de itens patrocinados podem minar a confiança. Se o sistema falhar em fornecer respostas confiáveis, os usuários podem reverter para pesquisas tradicionais de palavras-chave ou se voltar para aplicativos de nicho que se especializam em domínios visuais específicos.
Olhando para o Futuro
A introdução da pesquisa visual no Modo de IA reflete uma mudança mais ampla na indústria em direção a interações mais táteis e impulsionadas por imagens. À medida que os dispositivos se tornam melhores em detectar e descrever o mundo ao seu redor, os mecanismos de pesquisa estão evoluindo para entender não apenas palavras, mas também o que os usuários veem. A infraestrutura abrangente da Google lhe dá uma vantagem significativa, mas o sucesso final do recurso dependerá de sua precisão, justiça e utilidade em consultas cotidianas.
Usado: News Factory APP - descoberta e automação de notícias - ChatGPT para Empresas