Nvidia lanza DGX Spark, un supercomputador de inteligencia artificial compacto para escritorios
Diseño compacto, software potente
El DGX Spark es un sistema basado en ARM que ejecuta el sistema operativo DGX de Nvidia, un sistema operativo basado en Ubuntu Linux diseñado específicamente para el procesamiento de GPU. Viene con el paquete de software de inteligencia artificial de Nvidia preinstalado, incluyendo bibliotecas CUDA y los microservicios NIM de la empresa.
Precios y rendimiento
Los precios del DGX Spark comienzan en US $3,999. Según The Register, el rendimiento de computación de GPU del chip GB10 es aproximadamente equivalente a una GPU RTX 5070. Sin embargo, la RTX 5070 está limitada a 12 GB de memoria de video, mientras que el DGX Spark proporciona 128 GB de memoria unificada, lo que le permite ejecutar modelos de inteligencia artificial mucho más grandes.
Ventaja de memoria
Con 128 GB de memoria unificada, el DGX Spark puede manejar modelos que excederían la capacidad de las GPU de consumo típicas. Por ejemplo, un modelo de lenguaje de 120 mil millones de parámetros requeriría aproximadamente 80 GB de memoria, mucho más de lo que pueden acomodar la mayoría de las soluciones de GPU de un solo procesador.
Entrega personal del CEO Jensen Huang
El fundador y CEO de Nvidia, Jensen Huang, marcó la ocasión del lanzamiento del DGX Spark entregando personalmente una de las primeras unidades a Elon Musk en la instalación de Starbase de SpaceX en Texas. Esto recuerda a una entrega similar que Huang hizo a Musk en OpenAI en 2016. En un comunicado, Huang dijo: "En 2016, creamos DGX-1 para dar a los investigadores de inteligencia artificial su propio supercomputador. Le entregué personalmente el primer sistema a Elon en una pequeña startup llamada OpenAI, y de ahí surgió ChatGPT. DGX-1 lanzó la era de los supercomputadores de inteligencia artificial y desbloqueó las leyes de escalabilidad que impulsan la inteligencia artificial moderna. Con DGX Spark, regresamos a esa misión".
Posición en el mercado
Aunque el DGX Spark no es tan potente como las GPU de alta gama como la RTX 5090 o las GPU de servidor de inteligencia artificial como la H100, su punto de precio más bajo y su gran cantidad de memoria lo convierten en una opción menos costosa para las organizaciones que buscan capacidad de inteligencia artificial en las instalaciones sin el costo de la infraestructura de servidor a gran escala.
Usado: News Factory APP - descubrimiento de noticias y automatización - ChatGPT para Empresas