OpenAI Integra Modo de Voz Directamente en el Chat de ChatGPT
Descripción General de la Integración
OpenAI lanzó una actualización sutil pero significativa que combina su Modo de Voz con la experiencia de chat regular de ChatGPT. En lugar de lanzar una pantalla separada o un globo flotante, la función de voz ahora aparece como un botón dentro de la ventana de conversación existente. El cambio se está implementando para todos los usuarios en la aplicación móvil y la versión web, y solo requiere una actualización de la aplicación para dispositivos móviles.
Características Principales
La interfaz de voz integrada permite a los usuarios hablar sus consultas y ver el texto aparecer en tiempo real como una transcripción. Los usuarios pueden alternar entre la entrada de voz y la entrada por teclado sin salir de la conversación, lo que facilita hacer preguntas de seguimiento o cambiar a la entrada por teclado cuando lo prefieran. Un botón "Finalizar" desactiva instantáneamente la escucha, y un botón de video habilita el modelo para analizar la entrada visual de la cámara.
Más allá de la conversación básica, la actualización agrega ayudas visuales bajo demanda. Los usuarios pueden solicitar mapas, pronósticos del tiempo y otros datos en tiempo real, que aparecen como gráficos dentro del chat. El sistema también admite la generación de imágenes basadas en comandos de voz, aunque los informes iniciales indican que esta función sometimes no produce la salida esperada.
Experiencia del Usuario
Los revisores señalan que el nuevo diseño se siente más natural que el Modo de Voz separado anterior, que requería salir de la interfaz de texto. La transcripción en vivo proporciona un registro claro de lo que se dijo, y la capacidad de interrumpir o hacer preguntas de seguimiento refleja la fluidez de un chat de texto típico. La integración también permite a los usuarios solicitar titulares de noticias, actualizaciones del tiempo o ubicaciones de mapas mientras ven enlaces clicables junto a la respuesta hablada.
Limitaciones y Comentarios
Si bien la integración de voz simplifica la interacción, algunos usuarios han encontrado problemas. La función de generación de imágenes, invocada por comandos de voz, se ha informado que se bloquea sin entregar la imagen solicitada. Además, la función de mapas muestra gráficos estáticos en lugar de una integración completa con servicios de mapas externos.
En general, la actualización es elogiada por hacer que la voz sea una opción de fondo lista por defecto que reduce la fricción de cambiar de modos, aunque se espera un pulido adicional para las capacidades visuales más avanzadas.
Usado: News Factory APP - descubrimiento de noticias y automatización - ChatGPT para Empresas