3. 本地集群的使用

本地集群是计算平台提供计算服务的最重要部分,分为HTCondor计算集群,主要运行串行作业;SLURM计算集群,主要运行并行作业及GPU作业。此外Hadoop集群用于运行一些特定需求的计算作业。计算平台为用户提供了统一的作业管理工具,用于对不同计算集群用户作业的管理。

用户通过运行作业使用本地计算集群。大致过程为(1) 用户登录计算平台的登录结点(2)用户在登录结点上编辑文件,调试程序,并将程序保存在自己的文件目录中。(3)用户向各本地集群提交自己的计算作业(4)用户作业被作业调度软件调度到适合的计算结点上执行,作业执行完毕后,作业结果将被拷贝回用户指定的输出目录下。(5)用户在登录结点上检查作业执行的结果。

results matching ""

    No results matching ""