La Cina presenta il proprio supercompure con processore a 384 core. 13 000 miliardi di operazioni al secondo
di SCENARIECONOMICI (Giuseppina Perlasca)
La Cina ha presentato il suo ultimo supercomputer, alimentato da un nuovo processore con 384 core e in grado di eseguire oltre 13 trilioni di operazioni in virgola mobile al secondo (TFLOPS).
La CPU Sunway SW26010 Pro è un chip di produzione autarchica che mira a potenziare le capacità di supercomputing della Cina e a ridurre la sua dipendenza dalla tecnologia straniera. Tuttavia, secondo gli esperti, il processore deve ancora affrontare problemi di prestazioni della cache e della memoria.
Sunway SW26010 Pro
La CPU Sunway SW26010 Pro è stata recentemente presentata alla conferenza SC23, dove il National Supercomputing Center di Wuxi, che gestisce il supercomputer, ha rivelato ulteriori dettagli sulla sua architettura e sul suo design.
Secondo quanto riportato da Chips and Cheese, la CPU si basa su un set di istruzioni RISC a 64 bit proprietario e presenta sei gruppi di core (CG) e un’unità di elaborazione del protocollo (PPU). Ogni CG comprende 64 elementi di elaborazione del calcolo (CPE) e un elemento di elaborazione della gestione (MPE). I CPE hanno un motore vettoriale a 512 bit e una cache scratchpad da 256 KB, mentre gli MPE hanno un motore scalare e una cache L2 da 256 KB. Ogni CPE ha anche un’interfaccia di memoria DDR4-3200 a 128 bit e 16 GB di memoria DDR4.
La CPU è una versione aggiornata del Sunway SW26010, utilizzato nel supercomputer Sunway TaihuLight, che si è classificato come il supercomputer più veloce al mondo nel 2016 e nel 2017. La nuova CPU ha migliorato la velocità di clock, il set di istruzioni e la larghezza di banda della memoria rispetto alla generazione precedente, con un conseguente aumento di quattro volte delle prestazioni FP64. La CPU Sunway SW26010 Pro può raggiungere un picco di prestazioni FP64 di 13,8 TFLOPS, un valore impressionante rispetto alla CPU EPYC 9654 a 96 core di AMD, che ha un picco di prestazioni FP64 di circa 5,4 TFLOPS.
La CPU Sunway SW26010 Pro ha però anche i suoi svantaggi:
- la CPU ha una cache e una gerarchia di memoria limitate, che possono influire sulle prestazioni di alcune applicazioni.
- la cache scratchpad dei CPE deve essere più grande per memorizzare tutti i dati richiesti dal motore vettoriale e la mancanza di una cache L2 adeguata significa che i dati devono essere recuperati frequentemente dalla memoria principale. Questo ne rallenta la velocità pratica;
- anche il sottosistema di memoria della CPU è insufficiente e deve essere aumentato per supportare l’elevata richiesta di larghezza di banda dei 384 core, ognuno dei quali è in grado di raggiungere 16 FP64 FLOPS/ciclo. Questi colli di bottiglia possono limitare la scalabilità e l’efficienza della CPU e del supercomputer.
La CPU Sunway SW26010 Pro è un risultato notevole per l’industria cinese del supercalcolo, che ha sviluppato i suoi processori e sistemi per competere con i leader mondiali. La CPU dimostra l’innovazione e l’ambizione della Cina nel campo del calcolo ad alte prestazioni, che trova applicazione in vari settori come la ricerca scientifica, l’intelligenza artificiale e la sicurezza nazionale. Tuttavia, la CPU mostra anche che la Cina ha ancora alcune lacune per quanto riguarda la progettazione della cache e della memoria, che sono cruciali per ottenere prestazioni ottimali ed efficienza energetica.
Commenti recenti