Atrás

Nvidia abre el código fuente de Audio2Face, herramienta de IA para animación de avatares 3D en tiempo real

Nvidia abre el código fuente de Audio2Face, herramienta de IA para animación de avatares 3D en tiempo real

Descripción general de la versión

Nvidia anunció que está abriendo el código fuente de Audio2Face, la solución impulsada por IA que produce animaciones faciales realistas para avatares tridimensionales basadas únicamente en la entrada de audio. Este movimiento hace que los modelos subyacentes, kits de desarrollo de software y marco de trabajo de entrenamiento estén disponibles públicamente, lo que permite a los desarrolladores de toda la industria incorporar la tecnología en sus propios proyectos sin restricciones de licencia.

Cómo Audio2Face genera animación

El sistema funciona examinando las características acústicas de una voz hablada. Traduce esas características en datos de animación que se asignan directamente a la estructura facial de un avatar, controlando tanto la sincronización de labios como las expresiones faciales más amplias. Este proceso permite una animación realista y en tiempo real que coincide con las sutilezas del habla humana.

Beneficios para los desarrolladores

Con la versión de código abierto, los desarrolladores ahora pueden usar Audio2Face para crear personajes 3D realistas para una variedad de aplicaciones, incluyendo escenas de corte de juegos preescritas, narrativas interactivas y avatares de transmisión en vivo. La flexibilidad de la herramienta admite tanto contenido estático como interacciones dinámicas y en tiempo real, lo que amplía las posibilidades creativas para estudios de juegos, experiencias de realidad virtual y plataformas de transmisión.

Adopción temprana y casos de uso

Varios desarrolladores ya han integrado Audio2Face en títulos comerciales. Farm51 empleó la tecnología en "Chernobylite 2: Exclusion Zone", mientras que el equipo detrás de "Alien: Rogue Incursion Evolved Edition" también aprovechó el sistema para su juego. Estos ejemplos ilustran cómo la herramienta puede mejorar la realismo de los personajes y reducir el trabajo manual tradicionalmente necesario para la animación manual.

Personalización a través del marco de trabajo de entrenamiento

Además de lanzar los modelos y SDK, Nvidia está proporcionando acceso al marco de trabajo de entrenamiento que impulsa Audio2Face. Esto permite a los usuarios ajustar los modelos de IA subyacentes para casos de uso especializados, como adaptarse a estructuras de avatar únicas, variaciones de idioma o estilos artísticos específicos. La capacidad de modificar la canalización de entrenamiento abre la puerta a soluciones personalizadas adaptadas a las necesidades individuales de cada proyecto.

Implicaciones para la industria

La disponibilidad de código abierto de Audio2Face señala un cambio más amplio hacia la democratización de herramientas de IA avanzadas para la producción creativa. Al eliminar las barreras de entrada, Nvidia busca acelerar la innovación en la animación de personajes y permitir que estudios más pequeños y creadores independientes logren un realismo de nivel cinematográfico sin un esfuerzo manual extenso. La versión también fomenta contribuciones de la comunidad que pueden mejorar aún más el rendimiento y la versatilidad de la tecnología con el tiempo.

Usado: News Factory APP - descubrimiento de noticias y automatización - ChatGPT para Empresas

También disponible en: