Intel-powered Aurora este acum cel mai rapid supercomputer AI din lume

Intel-powered Aurora este acum cel mai rapid supercomputer AI din lume

Aurora, supercomputerul creat prin colaborarea dintre Intel, HPE și Laboratorul Național Argonne al Departamentului Energetic al SUA, a depășit bariera exascale, devenind a doua mașină, după Frontier, care atinge acest nivel râvnit. Deși nu a reușit să înlăture Frontier de pe poziția sa ca cea mai rapidă mașină din lume, Aurora este acum cel mai rapid supercomputer AI de pe planetă.

Aurora a debutat pe locul al doilea în lista Top500 în noiembrie trecut, dar atunci a reușit să ruleze Linpack doar pe aproximativ jumătate din sistem. Chiar și cu o implementare parțială, a oferit o performanță de 585 petaFLOPS în precizie dublă. Ultimele clasări ne oferă o imagine mai clară a capacităților supercomputerului. Totuși, este important de menționat că mașina nu este încă funcțională 100%, ceea ce înseamnă că rezultatele benchmark-urilor nu reflectă întregul său potențial.

Aurora are 21,248 de procesoare Intel Xeon CPU Max și 63,744 de acceleratori GPU Max pentru centre de date Intel. În ultimele teste, a atins 1.012 exaflops de performanță cu doar 9,234 noduri active din totalul de 10,624. Deși este impresionant când este luat izolat, acest rezultat este totuși dezamăgitor pentru sistemul mult așteptat și mult întârziat, de la care mulți se așteptau să pună capăt domniei supercomputerului alimentat de AMD, Frontier, ca cel mai rapid din lume.

Aurora a avut o performanță mult mai bună în benchmark-ul HPL-MxP cu precizie mixtă, înregistrând 10.6 exaflops de performanță AI cu doar 89% din sistemul total activ. Spre deosebire de Linpack, care folosește precizia FP64, HPL-MxP utilizează FP32 și FP16, care reprezintă mai bine capacitățile AI ale unei mașini. În timp ce FP64 este folosit în principal pentru calcul științific tradițional, sarcinile de lucru AI și alte aplicații din lumea reală folosesc în mare parte precizii mai scăzute, ceea ce înseamnă că Linpack nu mai este singurul indicator al adevăratelor capacități ale unui supercomputer.

Incapacitatea laboratorului Argonne de a rula benchmark-uri pe întreaga infrastructură hardware Aurora se datorează numeroaselor defecțiuni ale sistemului, inclusiv problemele de răcire, erorile operaționale și instabilitatea rețelei. Cu toate acestea, chiar și dacă inginerii rezolvă aceste probleme și reglează perfect sistemul, este puțin probabil să depășească Frontier.

Sistemul alimentat de AMD este evaluat în prezent la o performanță de 1.206 exaflops, fiind cu aproximativ 19% mai rapid decât Aurora, cu 87% din hardware-ul acestuia din urmă în funcțiune. Chiar și cu scalare liniară, cele 13% rămase din nodurile Aurora nu vor adăuga petaflopșii necesari pentru a depăși liderul actual. Reprezentanții Argonne insistă totuși că Aurora „ar trebui” să depășească Frontier când va fi complet implementat, dar rămâne de văzut dacă acest lucru se va întâmpla.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *