高性能计算集群管理平台_北京众和永业科技发展有限公司

高性能计算集群管理平台

       众和永业CHP(Computer Headquarters Platform)高性能计算管理平台是众和永业自主研发的B/S架构高性能集群软件,即通过浏览器实现对HPC集群系统资源统一部署、管理、监控、报警、调度和可视化统计分析,大幅提高效率,简化管理。

众和永业CHP扩展灵活、操作界面友好直观,通过多种接口方式与用户其它业务应用系统进行对接整合,实现包括空天海洋、信息网络、生命科学、绿色新能源、生物技术、人工智能等领域在内的大规模高性能并行计算需求。

1、集群系统管理

支持用户通过WEB交互界面对SSHSMBNFS等远程登录与文件共享服务以及与PBS相关的系统组件设置,包括Torque配置、Maui配置、BM队列管理、BS队列服务管理、计算节点管理等。

2、作业调度管理

支持基于WEB交互式界面为系统用户提供用户管理、文件共享与管理服务,使用户作业及数据等文件通过WEB界面实现上传、下载,免去命令行的繁琐操作。

支持根据计算任务需求,为作业角本配置CPU、内存等硬件资源并绑定队列,保障计算任务的顺利执行。当计算完成后,支持以邮件形式将结果通知用户。

3、系统监测管理

提供在线作业使用情况、用户使用情况、任务队列使用情况、节点使用情况等图形化实时监测分析,并支持历史监测数据的查询检索。

(1) 作业使用情况
支持根据时间范围统计作业进程运行时间总量。

(2) 用户使用情况

支持对系统每位用户作业数、平均作业规模、作业进程运行时间总量等做出统计分析,同时支持图形化历史与实时数据展示。

(3) 任务阶列使用情况

支持对每个任务队列平均等待时间、平均运行时间以及单个队列作业规模进行统计分析,同时支持图形化历史与实时数据展示。

(4) 节点使用情况

支持对节点IP、节点状态、进程数等使用情况的统计,并支持通过图形化界面对每个节点的CPU、内存、硬盘等运行状态(温度、电压、资源使用率)以及详细进程表进行展现。


image.png

图示:CHP系统架构