Inception obtiene $50 millones para avanzar en la inteligencia artificial de difusión para código y texto
Ronda de financiación y partícipes
Inception recaudó $50 millones en una ronda de financiación de semilla. La ronda fue liderada por Menlo Ventures e incluyó la participación de Mayfield, Innovation Endeavors, el fondo M12 de Microsoft, Snowflake Ventures, Databricks Investment y el brazo de ventures de Nvidia, NVentures. Los inversores ángel Andrew Ng y Andrej Karpathy también proporcionaron financiación.
Liderazgo y visión
La empresa está encabezada por el profesor de Stanford Stefano Ermon, cuya investigación se centra en modelos de difusión. Ermon explica que los modelos de difusión generan salidas a través de un refinamiento iterativo en lugar del enfoque palabra por palabra de los modelos autoregresivos tradicionales. El objetivo de la startup es llevar la eficiencia y el paralelismo de las técnicas de difusión a un rango más amplio de tareas de inteligencia artificial, incluida la generación de código y el procesamiento de texto.
Enfoque tecnológico: Modelos de difusión para código y texto
Los modelos de difusión, anteriormente populares para sistemas de generación de imágenes como Stable Diffusion, Midjourney y Sora, están siendo repurposados por Inception para manejar cargas de trabajo textuales y de código a gran escala. Ermon argumenta que el procesamiento holístico de la difusión puede reducir la latencia y los costos de cómputo, ofreciendo un perfil de rendimiento diferente de la naturaleza secuencial de modelos como GPT-5 o Gemini.
Lanzamiento de producto: Modelo Mercury
Inception lanzó una versión actualizada de su modelo Mercury, diseñado específicamente para el desarrollo de software. Mercury ya ha sido integrado en herramientas de desarrollo que incluyen ProxyAI, Buildglare y Kilo Code. La empresa destaca que su enfoque basado en difusión permite tasas de tokens por segundo más altas, citando resultados de benchmark de "más de 1.000 tokens por segundo", lo que afirma supera las capacidades de las tecnologías autoregresivas actuales.
Ventajas estratégicas
La arquitectura de difusión permite que muchas operaciones se procesen simultáneamente, mejorando el paralelismo y potencialmente reduciendo la latencia para tareas complejas. Ermon enfatiza que este paralelismo se traduce en tiempos de respuesta más rápidos y un gasto de cómputo reducido, posicionando los modelos de Inception como una alternativa rentable para empresas y desarrolladores que buscan soluciones de inteligencia artificial de alto rendimiento.
Usado: News Factory APP - descubrimiento de noticias y automatización - ChatGPT para Empresas