中国科大超级计算中心用户使用文档¶ 前言 现有超级计算系统 瀚海22超级计算系统 瀚海20超级计算系统 曙光TC4600百万亿次超级计算系统 用户登录与文件传输 设置编译及运行环境 串行及OpenMP程序编译及运行 串行C/C++程序的编译 串行Fortran程序的编译 OpenMP程序的编译与运行 Intel、PGI及GNU C/C++ Fortran编译器介绍 Intel Parallel Studio XE Cluster C/C++ Fortran编译器 Intel C/C++ Fortran编译器 PGI C/C++ Fortran编译器 GNU C/C++ Fortran编译器 GPU异构计算和CUDA程序简介 背景 GPGPU GPU异构计算 CUDA编程框架 NVCC编译引擎 一个简单的例子 One More Thing MPI并行程序编译及运行 简介 MPI并行程序的编译 硬件标识符匹配(Tag Matching) CUDA GPU 片上内存(MEMIC) 采用UCX运行HPC-X OpenSHMEM 采用HPC-X OpenSHMEM与MPI一起开发应用 HPC-X OpenSHMEM调整参数 针对对称堆(Symmetric Heap)应用的OpenSHMEM MCA参数 用于强制连接生成的参数 MPI并行程序的运行 程序调试 GDB调试器简介 基本启动方式[gdbstart] 退出GDB 准备所需要调试的程序 开始调试程序 传递命令给调试器 调试并行程序 Intel MKL数值函数库 Intel MKL主要内容 Intel MKL目录内容 链接Intel MKL 特别提示 性能优化等 应用程序的编译与安装 二进制程序的安装 源代码程序的安装 Slurm作业调度系统 简介 基本概念 显示队列、节点信息:sinfo 查看队列中的作业信息:squeue 查看详细队列信息:scontrol show partition 查看详细节点信息:scontrol show node 查看详细作业信息:scontrol show job 查看服务质量(QoS) 查看作业屏幕输出:speek 提交作业命令共同说明 交互式提交并行作业:srun 批处理方式提交作业:sbatch 分配式提交作业:salloc 将文件同步到各节点:sbcast 吸附到作业步:sattach 查看记账信息:sacct 其它常用作业管理命令 LSF作业调度系统 作业运行的条件 查看队列情况:bqueues 查看各节点的运行情况:lsload 查看各节点的空闲情况:bhosts 查看用户信息:busers 提交作业:bsub 终止作业:bkill 挂起作业:bstop 继续运行被挂起的作业:bresume 设置作业最先运行:btop 设置作业最后运行:bbot 修改排队中的作业选项:bmod 查看作业的排队和运行情况:bjobs 查看作业负载:checkjob 查看运行中作业的屏幕正常输出:bpeek 提问的智慧 LaTeX pdf版 联系方式