瀚海22超级计算系统¶
含2个管理节点、2个用户登录节点、1个可视化节点、25个8卡GPU计算节点(单节点64颗Intel Xeon Scale 8358 CPU核(2.6GHz,48MB L3 Cache)、1TB内存、8颗NVIDIA A100 Tensor Core GPU(80GB显存、SXM4、600GB/s NVLink卡间互联))、10个3TB内存4路Intel CPU计算节点(单节点96颗Intel Xeon Scale 6348H CPU核(2.3GHz,132MB L3 Cache)、3TB内存)、80个双路Intel CPU计算节点(单节点64颗Intel Xeon Scale 8358 CPU核(2.6GHz,96MB L3 Cache)、256GB内存)、66个双路AMD CPU计算节点(单节点192颗AMD EPYC 9654 96核CPU核(2.4GHz,768MB L3 Cache)、768GB内存)、11PB可用容量高性能存储,采用Mellanox HDR 200Gbps InfiniBand高速互联。纯计算节点共20352颗CPU核及200颗A100 GPU,总双精度浮点计算能力:3.06PFLOPS(千万亿次/秒,CPU:1.12PFLOPS,GPU:1.94PFLOPS);Tensor Float 32(TF32)AI算力:62.4PFLOPS。
管理节点(2个):
用于系统管理,普通用户无权登录。
节点名
CPU
内存
硬盘
高速网络
型号
admin22-[01 - 02]
2*Intel Xeon Scale 8358 (2.6GHz,32核,L3 Cache 48MB),64核/节点
256GB DDR4 3200MHz
2*1.6TB NVMe
HDR 100Gbps InfiniBand
浪潮NF5280M6
用户登录节点(2个):
用于用户登录、编译与通过作业调度系统提交管理作业等。
禁止在此节点上不通过作业调度系统直接运行作业。
节点名
CPU
内存
硬盘
高速网络
型号
hanhai22-[01 - 02]
2*Intel Xeon Scale 8358 (2.6GHz,32核,L3 Cache 48MB),64核/节点
256GB DDR4 3200MHz
2*1.6TB NVMe
HDR 100Gbps InfiniBand
浪潮NF5280M6
可视化节点(1个):
用于数据可视化处理等,请通过 https://scc.ustc.edu.cn/scow/ 使用。
节点名
CPU
内存
GPU
硬盘
高速网络
型号
hanhai22-03
2*Intel Xeon Scale 8358 (2.6GHz,32虚拟核,L3 Cache 48MB),128虚拟核/节点
512GB DDR4 3400MHz
2*NVIDIA RTX A6000 (48GB显存)
1*1TB NVMe
HDR 100Gbps InfiniBand
浪潮NF5280M6
GPU计算节点(25个):
适合GPU应用,加速性能:https://developer.nvidia.com/hpc-application-performance。
节点名
CPU
内存
GPU
硬盘
高速网络
型号
gnode[01 - 25]
2*Intel Xeon Scale 8358 (2.6GHz,48MB L3 Cache),64核/节点
1TB DDR4 3200MHz
8*NVIDIA A100 (SXM4,80GB显存)
3.84TB NVMe
HDR 200Gbps InfiniBand
浪潮NF5688M6
¶ 指标
数值
FP64峰值性能
9.7TFLOPS
FP64 Tensor Core峰值性能
19.5TFLOPS
FP32峰值性能
19.5TFLOPS
FP32 Tensor Core峰值性能
312TFLOPS
BFLOAT16 Tensor Core峰值性能
624TFLOPS
FP16 Tensor Core峰值性能
624TFLOPS
INT8 Tensor Core峰值性能
1248TOPS
GPU显存
80GB
GPU显存带宽
1935GB/s
互联
NVIDIA NVLink 600GB/s
多实例GPU
最大7个MIG,每个10GB
四路Intel CPU 3TB大共享内存计算节点(10个):
适合大共享内存应用。
节点名
CPU
内存
硬盘
高速网络
型号
fnode[01 - 10]
4*Intel Xeon Scale 6348H (2.3GHz,132MB L3 Cache),96核/节点
3TB DDR4 2933MHz
3.84TB NVMe
HDR 100Gbps InfiniBand
浪潮NF8260M6
双路Intel CPU计算节点(80个):
节点名
CPU
内存
硬盘
高速网络
型号
cnode[01 - 80]
2*Intel Xeon Scale 8358 (2.6GHz,96MB L3 Cache),64核/节点
256GB DDR4 3200MHz
1.92TB NVMe
HDR 100Gbps InfiniBand
浪潮NF5160M6
双路AMD CPU 192核768GB大共享内存计算节点(66个):
适合大共享内存应用。
节点名
CPU
内存
硬盘
高速网络
型号
anode[01 - 66]
2*AMD EPYC 9654 (2.4GHz,768MB L3 Cache),192核/节点
768GB DDR5 4800MHz
900GB NVMe
HDR 100Gbps InfiniBand
中科可控 R6250A0
存储系统:
10台浪潮AS13000G6-HN12,每台8块3.2TB NVMe SSD硬盘,总可用容量194.6TB
30台浪潮AS13000G6-HN60,每台59块8TB NL-SAS 7.2K RPM硬盘,总可用容量11.56PB
文件系统:Spectrum Scale Advanced
默认用户磁盘配额:500GB
IO性能(通过IOR工具):
1MB块读带宽:单流≥6GB/s,聚合≥160GB/s
1MB块写带宽:单流≥6GB/s,聚合≥100GB/s
8KB块IOPS,随机读≥205万,随机写≥80万
计算网络:Mellonax HDR 200Gbps InfiniBand
管理网络:千兆以太网
操作系统:Ubuntu Server 22.04 LTS
编译器:Intel、NVIDIA HPC SDK和GNU等C/C++ Fortran、GPU编译器
数值函数库:Intel MKL
并行环境:HPC-X、Intel MPI和Open MPI等,支持MPI并行程序;各节点内的CPU共享内存,节点内既支持分布式内存的MPI并行方式,也支持共享内存的OpenMP并行方式;同时支持在节点内部共享内存,节点间分布式内存的混合并行模式。
资源管理和作业调度:Slurm 22.05.3
常用公用软件安装目录:
/opt
。请自己查看有什么软件,有些软件需要在自己等配置文件中设置后才可以使用。