Voltar

CEO da ElevenLabs Declara que a Voz é a Próxima Grande Interface de IA

CEO da ElevenLabs Declara que a Voz é a Próxima Grande Interface de IA

Voz como a Próxima Interface de IA

Na Web Summit, o co-fundador e CEO da ElevenLabs, Mati Staniszewski, afirmou que a voz está emergindo como a próxima grande interface para tecnologias de inteligência artificial. Ele explicou que os modelos de voz modernos não imitam mais apenas a fala humana; eles agora incorporam emoção, entonação e o poder de raciocínio de grandes modelos de linguagem. Essa evolução, ele argumentou, mudará a interação do usuário de tocar telas para falar, permitindo que as pessoas mantenham seus dispositivos nos bolsos enquanto interagem com o mundo ao seu redor.

Processamento Híbrido de Nuvem e Dispositivo

Staniszewski descreveu a estratégia da ElevenLabs para ir além da geração de áudio baseada apenas na nuvem em direção a uma abordagem híbrida que combina serviços de nuvem com processamento no dispositivo. Essa arquitetura é projetada para suportar hardware emergente, como fones de ouvido, óculos inteligentes e outros wearables, onde a voz pode atuar como um companheiro constante em vez de um recurso ocasional. Ao combinar a escalabilidade da nuvem com os benefícios de baixa latência da computação local, a empresa visa fornecer interações de voz de alta qualidade e em tempo real em uma gama mais ampla de dispositivos.

Parcerias e Impacto no Mercado

O CEO destacou uma parceria com a Meta que traz a tecnologia de voz da ElevenLabs para plataformas como Instagram e o ambiente de realidade virtual Horizon Worlds. Ele também expressou abertura para colaborar nos óculos inteligentes Ray-Ban da Meta, sinalizando um impulso para incorporar interfaces impulsionadas por voz em novos fatores de forma. Essas alianças, juntamente com a rodada recente de captação de recursos que valorizou a ElevenLabs em onze bilhões de dólares, sublinham o crescente interesse comercial na voz como uma capacidade central de IA.

Preocupações com Privacidade e Vigilância

Enquanto defendia a promessa de interação de voz onipresente, Staniszewski reconheceu que incorporar sistemas de voz mais profundamente na vida diária levanta sérias questões de privacidade e vigilância. A coleta contínua de dados de voz pode permitir a criação de perfis pessoais detalhados, e o CEO alertou que as empresas devem abordar quanto dados do usuário são armazenados e processados à medida que a voz se torna uma interface contínua e sempre ativada. A discussão referenciou a escrutínio mais amplo da indústria de tecnologias semelhantes, enfatizando a necessidade de salvaguardas robustas.

Usado: News Factory APP - descoberta e automação de notícias - ChatGPT para Empresas

Também disponível em: