Grace, una CPU estrechamente integrada para modelos de IA de m谩s de un bill贸n de par谩metros, es el resultado de 10.000 a帽os de trabajo de ingenier铆a.

NVIDIA ha presentado hoy su procesador Grace. Se trata de una unidad central de procesamiento (CPU) basada en ARM para aplicaciones de inteligencia artificial y computaci贸n de alto rendimiento a escala gigante.

Se trata de la primera CPU para centros de datos de NVIDIA, creada espec铆ficamente para aplicaciones que funcionan a escala masiva, seg煤n ha afirmado el CEO de NVIDIA, Jensen Huang, en un discurso de presentaci贸n en el evento聽GTC 2021 de NVIDIA. Huang subray贸 que 鈥渆s la primera CPU del mundo dise帽ada para la computaci贸n a escala de terabytes鈥.

Grace ofrece un salto de rendimiento 10 veces mayor para los sistemas que entrenan modelos gigantes de IA, utilizando n煤cleos ARM de bajo consumo. Adem谩s, NVIDIA ha dicho que el Centro de Supercomputaci贸n de Suiza y el Laboratorio Nacional de Los 脕lamos del Departamento de Energ铆a de EE.UU. ser谩n los primeros en utilizar Grace, que lleva el nombre de Grace Hopper, pionera de la programaci贸n inform谩tica en la d茅cada de 1950. Se espera que la CPU est茅 disponible a principios de 2023.

鈥淕race es una CPU innovadora. Est谩 dise帽ada para aplicaciones de computaci贸n acelerada a gran escala para IA y HPC鈥, dijo Paresh Kharya, director senior de gesti贸n de productos y marketing de NVIDIA, en una rueda de prensa.

La CPU es el resultado de m谩s de 10.000 a帽os de trabajo de ingenier铆a. NVIDIA afirma que el chip responder谩 a las necesidades de computaci贸n de las aplicaciones m谩s avanzadas del mundo -como el procesamiento del lenguaje natural, los sistemas de recomendaci贸n y la supercomputaci贸n de IA- que analizan enormes conjuntos de datos que requieren un rendimiento de computaci贸n ultrarr谩pido y una memoria masiva.

Grace combina n煤cleos de CPU ARM de bajo consumo con un innovador subsistema de memoria de bajo consumo para ofrecer un alto rendimiento con gran eficiencia. El chip utilizar谩 un futuro n煤cleo ARM denominado Neoverse.

鈥淟a IA y la ciencia de los datos de vanguardia est谩n llevando la arquitectura de los ordenadores actuales m谩s all谩 de sus l铆mites, procesando cantidades impensables de datos鈥, dijo Huang en su discurso. 鈥淯tilizando la IP de ARM bajo licencia, NVIDIA ha dise帽ado Grace como una CPU espec铆fica para la IA y la HPC a escala gigante. Junto con la GPU y la DPU, Grace nos proporciona la tercera tecnolog铆a fundamental para la computaci贸n y la capacidad de redise帽ar el centro de datos para hacer avanzar la IA. NVIDIA es ahora una compa帽铆a de tres chips鈥.

Jensen Huang: 鈥淣VIDIA es ahora una compa帽铆a de tres chips鈥

Grace es un procesador altamente especializado dirigido a cargas de trabajo como el entrenamiento de modelos de PNL de nueva generaci贸n que tienen m谩s de un bill贸n de par谩metros. Si se combina con las GPU de NVIDIA, un sistema basado en Grace ofrecer谩 un rendimiento 10 veces superior al de los sistemas actuales basados en NVIDIA DGX, que se ejecutan en CPU x86. En una rueda de prensa, alguien pregunt贸 si NVIDIA competir谩 con los chips x86 de Intel y AMD.

Kharya dijo: 鈥淣o estamos compitiendo con x86鈥 seguimos trabajando muy bien con las CPU x86鈥. Grace est谩 dise帽ado para aplicaciones de IA y HPC, pero NVIDIA no revela informaci贸n adicional sobre d贸nde se utilizar谩 Grace en la actualidad. NVIDIA tampoco ha querido revelar el n煤mero de transistores del chip Grace.

NVIDIA presenta Grace en un momento en que el volumen de datos y el tama帽o de los modelos de IA crecen exponencialmente. Los mayores modelos de IA actuales incluyen miles de millones de par谩metros y se duplican cada dos meses y medio. Para entrenarlos se necesita una nueva CPU que pueda acoplarse estrechamente a una GPU para eliminar los cuellos de botella del sistema.

La base del rendimiento de Grace es la tecnolog铆a de interconexi贸n NVIDIA NVLink de cuarta generaci贸n, que proporciona conexiones de 900 gigabytes por segundo entre Grace y las unidades de procesamiento gr谩fico (GPU) de NVIDIA para permitir un ancho de banda agregado 30 veces mayor en comparaci贸n con los principales servidores actuales.

Grace tambi茅n utilizar谩 un innovador subsistema de memoria LPDDR5x que proporcionar谩 el doble de ancho de banda y una eficiencia energ茅tica 10 veces mayor en comparaci贸n con la memoria DDR4. Adem谩s, la nueva arquitectura proporciona una coherencia de cach茅 unificada con un 煤nico espacio de direcciones de memoria, combinando la memoria del sistema y de la GPU HBM para simplificar la programaci贸n.