该套无盘集群系统,共752个节点,含30640颗CPU核心、20块NVidia Tesla V100 GPU卡、16块NVIDIA A100 Tensor Core GPU卡及60块华为Atlas AI卡,理论峰值双精度浮点计算能力达2.69千万亿次/秒(2.69Pflops,CPU:2.38PFlops,GPU:0.311PFlops);Atlas AI计算能力:3840 TOPS INT8 + 15360T FLOPS FP16。其中720个普通双路CPU计算节点采用业界先进的板级液冷技术,高效节能。
- 计算网:Mellanox HDR 100Gbps
- 操作系统:CentOS 7.7.1908
- 作业调度系统:Slurm 19.05.4
- 用户手册:瀚海20超级计算系统用户使用指南
中国科大瀚海20超级计算系统主要配置
序号 | 类别 | 规格型号/主要特征 | 主要参数 | 数量 | 备注 |
---|
1 | 管理/登录节点 | 华为FusionServer 2288H V5 | 2*Intel Xeon Scale 6248(20核, 2.5GHz),192GB DDR4 2933MHz内存,2*1TB NVMe硬盘 | 4 |
|
---|
2 | 普通双路CPU计算节点 | 华为FusionServer X6000(XH321L V5节点) | 2*Intel Xeon Scale 6248(20核, 2.5GHz),192GB DDR4 2933MHz内存,240GB SSD硬盘,板级液冷技术 | 720 | 适合一般CPU作业 |
---|
3 | 双V100 GPU计算节点 | 华为FusionServer G5500(G530 V5节点) | 2*Intel Xeon Scale 6248(20核, 2.5GHz),2*NVIDIA Tesla V100 GPU,384GB DDR4 2933MHz内存,1TB NVMe硬盘 | 10 | 支持GPU作业 |
---|
4 | 八A100 GPU计算节点 | 融科联创RW-4124GO-NART | 2*AMD Rome 7742 (2.25GHz, 128核),1TB DDR4 3200MHz,8*NVIDIA A100 Tensor Core GPU,NVLink,2*1.92TB+4*3.84TB NVME | 2 | 支持大GPU作业 |
5 | 2TB AEP大内存计算节点 | 华为FusionServer 2288H V5 | 2*Intel Xeon Scale 6248(20核, 2.5GHz),384GB DDR4 2933MHz内存,2TB Intel AEP内存,1TB NVMe硬盘 | 8 | 适合大内存作业 |
---|
6 | 国产ARM CPU计算节点 | 华为Taishan 2280V2 | 2*海思Hi1620 CPU (48核,2.6GHz),256GB DDR4 2666MHz内存,300GB SAS硬盘 | 20 | 10台各含6块颗Atlas 300 AI卡 |
---|
7 | 存储系统 | 长虹GS7990(OEM DDN) | 1*GS7990主机箱+2*SS9012磁盘扩展机箱,248*8TB NL-SAS硬盘,1.5PB可用容量 | 1 | 可用容量1.5PB,持续IO聚合带宽>20GB/s |
---|
8 | 并行文件系统 | 长虹GRIDScaler(OEM DDN) | 基于IBM GRIDScaler | 1 |
|
---|
9 | 高速计算网络 | Mellanox HDR100 |
| 1
| ARM节点为25Gbps以太网 |
---|
机柜布局(10个板级液冷机柜+3个风冷机柜)