banner

Blog

Sep 02, 2023

MGX: Nvidia standardizza il multi

Aggiornato con più specifiche MGX:Ogni volta che un produttore di motori di calcolo si occupa anche di schede madri e di progettazione di sistemi, le aziende che producono schede madri (ce ne sono dozzine che lo fanno) e creano progetti di sistemi (i produttori del progetto originale e l'originale - diventano un po' nervosi e un po' sollevati La standardizzazione dei componenti significa che hanno meno da fare, ma allo stesso tempo meno costi da pagare.

Con i progetti della piattaforma server multigenerazionale MGX, annunciati questa settimana alla fiera Computex di Taiwan, che è uno dei maggiori centri al mondo per la produzione di componenti e sistemi, nonché il centro indiscusso di produzione e assemblaggio di motori di calcolo, Nvidia spera di rendere la vita più facile a se stessa e agli OEM e ODM del mondo e di fornire maggiori profitti a se stessa e a loro.

Nvidia produce i propri server da quando il sistema DGX-1 ha debuttato nell'aprile 2016 basato sull'acceleratore GPU "Pascal" P100. Nvidia ha deciso di farlo per contribuire ad accelerare i tempi di commercializzazione e per creare un ciclo di feedback nella progettazione di componenti e schede madri; Anche il fatto che Nvidia avesse bisogno di costruire i propri supercomputer per gestire i suoi enormi carichi di lavoro di intelligenza artificiale – che era più economico che farlo fare a un OEM o ODM – è stato un fattore che ha contribuito alla decisione. All'epoca, la maggior parte delle GPU Pascal che Nvidia avrebbe potuto produrre venivano spedite agli hyperscaler e ai costruttori di cloud, nonché ad alcuni centri HPC, e le DGX-1 venivano vendute da Nvidia in modo preferenziale in modo che ricercatori e scienziati potessero ottenere le mani su questi sistemi accelerati da GPU. Questo era ancora il caso nel maggio 2017, quando le macchine DGX-1 furono aggiornate con gli acceleratori GPU “Volta” V100 annunciati due mesi prima. Il sistema DGX-A100 è seguito nel maggio 2020, utilizzando le GPU "Ampere" A100 e, naturalmente, il design DGX-H100, che si espande molto ulteriormente con un tessuto NVLink Switch, lanciato contemporaneamente all'acceleratore GPU "Hopper" H100 l'anno scorso ed è stato appena aggiornato questa settimana con un design ibrido CPU-GPU nel sistema DGX-GH200.

Non è possibile acquistare un ASIC H100 SXM5 o NVSwitch 3 utilizzato nelle ultime macchine DGX-H100 e DGX-GH200. Le schede di sistema per CPU, GPU e interconnessioni NVSwitch vengono vendute agli hyperscaler e ai costruttori di cloud e ai loro fornitori ODM come un'unità, con tutti i componenti prodotti e testati, e vengono anche vendute agli OEM come componenti preassemblati, che a loro volta inseriscono nei loro sistemi. Puoi acquistare versioni PCI-Express degli acceleratori GPU o ASIC Quantum InfiniBand o Spectrum Ethernet da Nvidia se vuoi costruire i tuoi sistemi, ma per le cose di fascia alta in esecuzione su un tessuto di memoria NVSwitch, devi prenderli preassemblati componenti, che sono chiamati HGX.

Avendo standardizzato in una certa misura i componenti interni dei sistemi con HGX/DGX, Nvidia vuole ora standardizzare i gusci che avvolgono questi componenti per accelerare il time to market per tutti gli ODM e OEM e per fare in modo che i sistemi risultanti possano essere aggiornato sul campo nella misura più ampia possibile, dati i futuri cambiamenti architettonici che arriveranno dal luccio.

Questo, in poche parole, è lo scopo dell'impegno di MGX.

Abbiamo avuto un piccolo assaggio di come appaiono i progetti MGX iniziali lo scorso maggio, quando i prototipi dei sistemi HGX Grace e HGX Grace-Hopper sono stati divulgati da Nvidia. Non si trattava solo di schede di sistema, ma di progetti completi di server montati su rack:

Lo sforzo di standardizzazione di MGX coprirà le piattaforme di elaborazione dei data center DGX/HGX, le piattaforme di hosting del metaverso OVX e le piattaforme di grafica e gioco cloud CGX, ed ecco come Nvidia ha affermato che la CPU Grace e vari acceleratori GPU sarebbero stati composti per queste tre linee di ferro. :

Ecco i design MGX che è stato mostrato al Computex questa settimana:

Quello a sinistra è un superchip Grace-Grace abbinato a quattro acceleratori GPU. Il sistema al centro ha due CPU X86, due interfacce di rete ConnectX e otto acceleratori GPU, mentre il sistema a destra ha una coppia di motori di calcolo raffreddati ad acqua (supponiamo i superchip Grace-Hopper) e due schede di interfaccia di rete.

CONDIVIDERE