11.2 集群使用相关规则
1. HTCondor 作业系统
提示
目前高能所HTCondor作业系统暂不支持并行(如多线程和MPI等)和GPU等类型作业。如有需要,请参考Slurm作业系统内容。
HTCondor使用用户组区分不同实验的作业,功能类似作业队列。HepJob默认为用户作业设置其在Linux系统中的用户主组,用户可依真实情况设置自己所属的其它附组。
限制 | 说明 | |
---|---|---|
作业数目 | 10,000作业/用户 | 包括所有排队、运行以及hold作业,不包括已结束作业 |
默认作业时长 | 100小时 | 超过100小时作业将被清除。推荐作业时长在0.5 - 4小时之间,请用户合理分割作业粒度 |
长作业时长 | 30天 | long作业优先级低,且可用资源总量很少,可能需要很长排队时间,请谨慎使用 |
默认作业内存 | 受限于计算节点物理内存 | 集群能满足绝大部分用户作业的内存需求,一般不需要特别处理 |
大内存作业 | 可由HepJob指定 | 目前集群中大内存节点极少,且优先提供给特殊类型作业使用,不能保证普通用户作业的运行 |
可用硬盘空间 | 请参考各实验相关规定 |