Atrás

ChatGPT Amplía la Interacción sin Manos con el Modo de Voz

ChatGPT Amplía la Interacción sin Manos con el Modo de Voz

Descripción General del Modo de Voz

El ChatGPT de OpenAI ahora incluye un Modo de Voz que permite a los usuarios conversar con la IA utilizando entrada hablada y salida de audio. El botón de voz aparece en la esquina inferior derecha de cualquier conversación en la aplicación, permitiendo a los usuarios alternar entre teclear y hablar. Hay dos niveles disponibles: una opción de voz standard que transcribe el habla antes de procesarla con el modelo GPT-4, y una opción de voz avanzada que aprovecha modelos multimodales para escuchar y hablar en tiempo real. La versión avanzada es parte de la suscripción de pago, mientras que la versión standard es gratuita para todos los usuarios.

Beneficios y Casos de Uso

La experiencia sin manos se describe como más natural y conversacional, permitiendo a los usuarios hablar de manera natural con pausas y palabras de relleno. Es particularmente útil para situaciones de multitarea, como generar ideas mientras se conduce o se cocina. La función también asiste a los aprendices de idiomas, que pueden practicar el habla y recibir traducciones habladas. La accesibilidad es una ventaja importante, ofreciendo una alternativa para personas con baja visión, dislexia o desafíos de habilidades motoras. Además, las capacidades multimodales del modo avanzado permiten a los usuarios apuntar la cámara a objetos del mundo real y recibir información hablada sobre ellos. En general, la adición del Modo de Voz amplía la forma en que los usuarios pueden interactuar con ChatGPT, haciendo de la herramienta más rápida, inclusiva y adaptable a escenarios cotidianos.

Usado: News Factory APP - descubrimiento de noticias y automatización - ChatGPT para Empresas

También disponible en: