今早巡检机房时发现联想集群2号机柜的插线板供电不正常,导致1~2号机柜的交换机无电,node1~node32计算节点以及登录节点网络连接中断。
自行尝试恢复供电无果,现已联系联想客服前来检查、更换。(备件申请需要2~3天的时间)
现已将交换机接到1号机柜的插线板上,已可以登录集群查看、提交作业。但2号机柜无法接电,导致 node17 ~ node32 节点暂时仍不能使用。
请已有作业在这些节点上运行的用户重新提交作业,给大家带来的使用不便,敬请谅解!
今早巡检机房时发现联想集群2号机柜的插线板供电不正常,导致1~2号机柜的交换机无电,node1~node32计算节点以及登录节点网络连接中断。
自行尝试恢复供电无果,现已联系联想客服前来检查、更换。(备件申请需要2~3天的时间)
现已将交换机接到1号机柜的插线板上,已可以登录集群查看、提交作业。但2号机柜无法接电,导致 node17 ~ node32 节点暂时仍不能使用。
请已有作业在这些节点上运行的用户重新提交作业,给大家带来的使用不便,敬请谅解!