动力工程多相流国家重点实验室
高性能计算集群使用管理制度
第一章 总 则
第一条 为了进一步加强实验室高性能计算集群的管理与维护,充分发挥高性能计算集群的作用,促进实验室计算模拟工作的开展,及时掌握前沿学术信息,拓展学术视野,加强实验室的交流合作,提升实验室学术水平,制定本制度。
第二章 高性能计算集群管理小组及其职责
第二条 实验室设专职集群管理小组,负责集群机房内设备的维护,保证实验室集群的正常使用,若出现故障,应及时修复或提出修复意见,联系设备供应商和网络管理部门解决。
第三条 确保实验室集群的正常安全运行,负责监督管理集群运行的各类计算任务与进程,负责实验室集群日常管理与维护,负责编译器、数学库等编译环境的调整、常用计算软件更新、实验室集群用户的录入与管理。
第四条 集群管理小组负责集群防病毒、防黑客攻击以及为集群的正常运行日常维护提供技术支持与保障。
第五条 集群服务器的电源开关由集群管理小组管理,严禁在没有退出系统的情况下关断服务器的电源,确保集群服务器的正常安全运行。
第六条 集群机房的卫生由集群管理小组负责,定期组织人员打扫卫生。
第七条 集群机房的水、电、门窗及空调的安全由集群管理小组负责。
第八条 集群及集群所在机房定期进行硬件清查,确保集群服务器正常运行,供电、UPS电源、空调等外部设施运转正常。
第九条 当集群需要断电维护时,集群管理小组需提前向用户发布通知,说明断电的原因及时间,并按操作流程关闭机房设备,确保集群的正常使用。
第十条 集群硬件设备需要增添或者报废时,由集群管理小组预先提出方案,报实验室审核,在实验室管理委员会审批后执行。
第十一条 集群管理小组负责集群各节点的操作系统、编译器、数学库、文件系统等的安装与更新维护。各常用计算软件由集群管理小组同意安装在公共目录,确保各用户可以正常使用。
第十二条 集群密码由集群管理小组负责控制,不准向任何部门或个人泄漏。
第十三条 集群管理小组发现实验室集群被病毒、黑客袭击或发现集群运行不正常,应及时向实验室领导报告,并尽快处理。
第十四条 当有大型商业计算用软件需要购置安装时,由集群管理小组预先提出方案,报实验室审核,在实验室管理委员会审批后配合软件供应商安装调试、运行。
第十五条 集群管理小组应按本规定及时对实验室集群进行管理、维护与更新。
第三章 集群用户管理
第十六条 实验室成员在有高计算量任务,需要使用集群时,按计算需求填写《高性能计算集群用户使用申请表》,由导师审核通过后,由集群管理小组统一开设账户。集群用户需要按照集群管理小组的要求防范病毒、黑客袭击风险。
第十七条 集群用户在使用集群的过程中,需使用PBS排队系统,由排队系统向计算节点分配任务,每个用户默认使用权限为4个计算节点。不得直接在头节点运行计算任务。
第十八条 集群管理小组将定期召开集群用户交流讨论会,加强实验室组内的交流合作,提高集群使用水平和学术水平。
第十九条 集群管理小组定期对集群各用户的使用情况进行统计,对集群的使用情况、取得的学术成果,向实验室报告。
第二十条 集群用户在使用过程中,应遵守实验室集群的管理办法,不得使用集群资源做与科研无关的使用。
第二十一条 任何人不得在实验室集群上发布违反国家法律、法规、有损国家利益、公司形象以及不道德的言论。
第二十二条 任何人不得利用实验室集群传播反动、淫秽、不道德以及其他违反国家法律、社会公德的信息。
第二十三条 任何人不得利用实验室集群发布虚假信息或违反实验室规定、影响实验室形象、泄露实验室机密的信息。
第二十四条 集群管理小组一经发现有上述20-23条所示内容的信息,必须立即予以删除,停止对应用户的使用权,并追究当事者的行政或法律责任。