Google ha introducido redactores de Predicción de Múltiples Tokens (MTP) para sus modelos Gemma 4 de código abierto, prometiendo una reducción de hasta dos veces el tiempo de respuesta para la inteligencia artificial ejecutada localmente. La función experimental utiliza decodificación especulativa para adivinar tokens futuros, lo que permite que un modelo de borrador ligero llene los ciclos de procesamiento inactivos.
Leer más →