11.2 集群使用相关规则

1. HTCondor 作业系统

提示

目前高能所HTCondor作业系统暂不支持并行(如多线程和MPI等)和GPU等类型作业。如有需要,请参考Slurm作业系统内容。

HTCondor使用用户组区分不同实验的作业,功能类似作业队列。HepJob默认为用户作业设置其在Linux系统中的用户主组,用户可依真实情况设置自己所属的其它附组。

限制 说明
作业数目 10,000作业/用户 包括所有排队、运行以及hold作业,不包括已结束作业
默认作业时长 100小时 超过100小时作业将被清除。推荐作业时长在0.5 - 4小时之间,请用户合理分割作业粒度
长作业时长 30天 long作业优先级低,且可用资源总量很少,可能需要很长排队时间,请谨慎使用
默认作业内存 受限于计算节点物理内存 集群能满足绝大部分用户作业的内存需求,一般不需要特别处理
大内存作业 可由HepJob指定 目前集群中大内存节点极少,且优先提供给特殊类型作业使用,不能保证普通用户作业的运行
可用硬盘空间 请参考各实验相关规定

2. Slurm 作业系统

3. Hadoop 作业系统

results matching ""

    No results matching ""