La inteligencia inefable de David Silver recauda $1,1 mil millones para perseguir la superinteligencia de aprendizaje por refuerzo
David Silver, el cerebro detrás de AlphaGo, ha anunciado la formación de Ineffable Intelligence, una empresa que busca construir inteligencia artificial general a través del aprendizaje por refuerzo. La startup ha recaudado $1,1 mil millones en financiamiento de semilla, valorando la empresa en $5,1 mil millones. Lightspeed Ventures y Sequoia Capital lideraron la ronda, lo que indica una fuerte confianza de los inversionistas en la hoja de ruta no convencional de Silver.
La visión de Silver se aparta de la estrategia prevaleciente de grandes modelos de lenguaje (LLM) que dominan la industria de la inteligencia artificial. En lugar de alimentar a las máquinas con grandes corpora de texto humano, su equipo permitirá que los agentes de inteligencia artificial aprendan por prueba y error dentro de entornos simulados. "Los datos humanos son como un tipo de combustible fósil", dijo Silver a WIRED. "Los sistemas que aprenden por sí mismos son un combustible renovable, algo que puede aprender y aprender para siempre, sin límites".
El enfoque se basa en el aprendizaje por refuerzo, un campo iniciado por el mentor de Silver, Rich Sutton, quien, junto con Andrew Barto, ganó el Premio Turing de 2025. Al colocar a los agentes en mundos virtuales, Ineffable espera observar comportamientos emergentes, probar la alineación y, en última instancia, escalar la inteligencia sin prioridades humanas. Silver cree que este método puede producir "superaprendices" capaces de descubrimientos científicos más allá del alcance humano.
La seguridad sigue siendo una preocupación central. Silver argumenta que las simulaciones proporcionan un entorno de prueba para monitorear cómo la inteligencia artificial interactúa con otras inteligencias, lo que permite a los desarrolladores detectar estrategias no deseadas temprano. "Podemos ver realmente qué tipo de comportamiento emerge de esto", dijo. El socio de Lightspeed, Ravi Mhatre, repitió el sentimiento, señalando que la ruta del aprendizaje por refuerzo puede ofrecer un camino más claro hacia la inteligencia artificial alineada que los modelos que simplemente imitan el texto humano.
Más allá del premiso técnico, el respaldo financiero de la empresa subraya el apetito del mercado por caminos de inteligencia artificial novedosos. La socia de Sequoia, Sonya Huang, destacó el historial de Silver y la pureza de su visión, calificándolo como uno de los pocos investigadores que han realizado un trabajo verdaderamente fundamental. Agregó que el aumento en la capacidad de cómputo y las simulaciones sofisticadas hace que el enfoque sea cada vez más viable.
Ineffable Intelligence ya ha atraído talento de DeepMind y otros laboratorios de vanguardia. El cofundador Andrew Dai elogió la mezcla de brillantez y colegialidad de Silver, señalando que una cultura de apoyo ayuda a retener a los mejores investigadores. Silver, por su parte, se comprometió a donar cualquier ganancia personal de la empresa a organizaciones benéficas de alto impacto centradas en salvar vidas.
Si bien el objetivo a largo plazo de la empresa, pasar de juegos como Go a la complejidad del mundo real, sigue siendo ambicioso, la ronda inicial de financiamiento le da los recursos para construir simulaciones a gran escala y desarrollar la próxima generación de agentes de aprendizaje. A medida que el campo de la inteligencia artificial se enfrenta a los límites de los LLM, la apuesta de Ineffable Intelligence por el aprendizaje por refuerzo marca una alternativa audaz, aunque arriesgada.
Usado: News Factory APP - descubrimiento de noticias y automatización - ChatGPT para Empresas