Perplexity Lanza Control de Voz sin Manos para Navegador Comet
Perplexity Amplía la Interacción de Voz en Navegador Comet
Perplexity anunció una actualización significativa a las capacidades de voz de su navegador Comet, llevando la experiencia más allá de una simple herramienta de consulta a una navegación de sesión completa y sin manos. Los usuarios de escritorio pueden activar el nuevo modo de inmediato, mientras que los usuarios de iOS recibirán la funcionalidad unos días después, según las listas de preventa.
El modo de voz mejorado se ejecuta en el modelo de tiempo real más reciente de OpenAI, identificado como gpt-realtime-1.5. Este modelo está diseñado para agentes de voz de baja latencia, entregando respuestas más rápidas y un ritmo más natural que admite sesiones de escucha más largas. El CEO de Perplexity, Aravind Srinivas, destacó el lanzamiento en la plataforma social X, agradeciendo al equipo multimodal de OpenAI por su colaboración.
A diferencia de la mayoría de los navegadores que tratan la voz como un "truco de fiesta" limitado a consultas de búsqueda, Comet ahora permite a los usuarios controlar virtualmente todas las acciones de navegación con comandos hablados. Los usuarios pueden abrir sitios web, desplazarse por páginas, hacer clic en enlaces y incluso solicitar resúmenes o comparaciones de contenido, todo sin un mouse o teclado. Los comandos de ejemplo incluyen "desplazarse hacia abajo", "abrir el tercer enlace", "resumir esta página" y "compararla con la pestaña de la izquierda". El atajo de activación en Windows es Mayús + Alt + V, y en macOS es Mayús + Opción + V. Un atajo comparable se introducirá para iPhone cuando se lance la versión de iOS.
Perplexity informa que el nuevo modo de voz mejora la estabilidad de las herramientas en más del 25 por ciento, reduciendo los errores cuando el navegador intenta ejecutar instrucciones habladas. Las voces en sí han sido refinadas para una articulación más clara y un ritmo más suave, mejorando la usabilidad para interacciones extendidas.
La privacidad es un componente fundamental del lanzamiento. El navegador procesa los datos de voz localmente siempre que sea posible y no almacena los historiales de clics en la nube de forma predeterminada, con el objetivo de evitar la creación de perfiles de seguimiento de anuncios. Esta postura difiere de muchos competidores que confían en el procesamiento del servidor y la recolección extensiva de datos.
Mirando hacia adelante, Perplexity planea enriquecer la experiencia de voz con un asistente de aprendizaje que se adapte a las preferencias individuales de los usuarios. El asistente podría ayudar con tareas como compras, pedir comida o encontrar vuelos en función del comportamiento pasado. Las características adicionales en desarrollo incluyen un administrador de contraseñas y sincronización entre dispositivos, aunque los usuarios de Android tendrán que esperar para que esas capacidades estén disponibles.
El lanzamiento refleja un cambio más amplio en la industria hacia la computación ambiental, donde la interacción es cada vez más impulsada por la voz y consciente del contexto. Al ofrecer una experiencia de navegación robusta, enfocada en la privacidad y sin manos, Perplexity posiciona a Comet como una herramienta de vanguardia para los usuarios que prefieren navegar por la web a través de la conversación en lugar de los clics.
Usado: News Factory APP - descubrimiento de noticias y automatización - ChatGPT para Empresas