原先胖节点服务器的操作系统已经全部升级到CentOS release 6.2 Linux x86_64,并整合到sugon服务器上统一调度管理,8个节点的配置略有不同,如下所示:
节点名 |
服务器型号 |
CPU |
内存(GB) |
node81~node83 |
浪潮TS850 |
48核Intel Xeon E7540处理器,主频2.0GHz |
128 |
node84~node85 |
浪潮TS850 |
64核Intel Xeon E8837处理器,主频2.66GHz |
256 |
node86~node87 |
曙光A950-r |
48核AMD Opteron 8431处理器,主频2.4GHz |
128 |
node88 |
曙光A620r-G |
24核AMD Opteron 6168处理器,主频1.9GHz |
32 |
针对此8个特殊节点服务器上特别配置了2个队列:
使用队列fat48、fat64,用bsub提交作业时需要另加参数-R "rusage[mem=****]",**** 为每个作业进程需要的内存数,以MB为单位。
例如提交一个8核进程数,内存总需求8GB的作业:
原提交命令: bsub -q normal -n 8 -o %J.log -e %J.err mpijob 123.job
加参数后的命令: bsub -q normal -n 8 -o %J.log -e %J.err -R "rusage[mem=1000]" mpijob 123.job
mem参数的计算方法为:申请总内存数/申请的CPU核数,即8GB约为8000MB , 8000/8=1000 , 则设定rusage[mem=1000] ,节点上必须满足-n参数、-R参数以及其他一些必要的资源才会分配队列中的作业。
使用fat48、fat64队列的用户在提交作业时,参照以上方法按照自己程序提交时设定的CPU核数以及内存数作相应换算后设定mem值再提交作业,禁止把剩余内存全部申请完,并请注意作业仅在单节点内并行计算,不可跨节点并行。
胖节点服务器资源有限,仅提供给作业运行需要较大内存的用户计算。
请预申请使用此类节点的用户单独向中心提出申请,申请邮件中要求详细介绍自己的计算体系,说明申请使用大内存的理由。
服务器整合结束,加入sugon系统统一调度管理之后,新系统配置及使用指南请见站内链接: