7.14 PWFA
7.14.1 Slurm集群使用简介
7.14.1.1 申请集群帐号
7.14.1.2 登录集群
7.14.1.3 使用集群
- 两种方式使用集群:
- 交互式:使用专用登录节点pvm057,可用于程序调试
- 提交作业:使用Slurm集群作业提交命令sbatch,在后台运行已调试好的程序
- 作业可提交到专用分区pwfadebug,也可以提交到共享分区spub
- 更详细的集群使用方法请参考Slurm集群用户手册
7.14.2 可使用的计算资源
- PWFA实验租用公共计算平台服务,目前可使用的计算资源均在Slurm集群中,可分为三类
Partition |
节点 |
功能 |
说明 |
login |
pvm057 |
专用登录节点 |
可使用ssh 命令登录,用于前台命令行交互 |
pwfadebug |
pvm058 |
专用计算节点 |
sbatch作业提交方式、后台计算 |
spub |
spub[001-016],accap[057-059],gpu036 |
共享计算节点 |
sbatch作业提交方式、后台计算 |
7.14.3 可使用的存储目录
- PWFA实验使用公共计算平台配套的存储目录/ihepfs,可作为数据及home目录使用,具体路径如下表所示,其中
<user_name>
代表集群帐号
目录 |
功能 |
quota限制 |
/ihepfs/pwfa/user/<user_name> |
home目录 |
100GB,20万文件 |
/ihepfs/pwfa/data/<user_name> |
数据目录 |
1TB,20万文件 |
7.14.4 已安装的软件
软件名称 |
集群安装路径 |
软件官网 |
fbpic |
/cvmfs/slurm.ihep.ac.cn/centos7.9/anaconda3/envs/fbpic |
github fbpic |
QuickPIC |
/cvmfs/pwfa.ihep.ac.cn/software/QuickPIC-OpenSource-dev/source/qpic.e |
github QuickPIC |
7.14.5 Slurm作业脚本样例
- PWFA用户向partition pwfadebug 及spub提交作业时,需在作业脚本中指定partition、account以及qos参数,参数具体值为:
partition |
account |
qos |
pwfadebug |
pwfa |
spubpwfa |
spub |
pwfa |
spubpwfa |
7.14.5.1 QuickPIC
- 以向partition spub提交作业、运行QuickPIC为例,可提交的作业脚本样例
qpic_sample_job.sh
如下所示:
$ cat qpic_sample_job.sh
source /cvmfs/pwfa.ihep.ac.cn/software/env/QuickPIC_env.sh
mpirun -np 64 /cvmfs/pwfa.ihep.ac.cn/software/QuickPIC-OpenSource-dev/source/qpic.e
脚本说明:
source /cvmfs/pwfa.ihep.ac.cn/software/env/QuickPIC_env.sh
用于设置运行QuickPIC的环境变量
qpic.e
是QuickPIC的可执行文件,默认的输入文件为qpinput.json
,需要存放在作业提交的当前目录下,具体格式和内容可参考Input File for QuickPIC
$ sbatch qpic_sample_job.sh
7.14.5.2 fbpic
- 以向partition spub提交作业、运行fbpic为例,可提交的作业脚本样例
fbpic_sample_job.sh
如下所示:
$ cat fbpic_sample_job.sh
export PATH=/cvmfs/slurm.ihep.ac.cn/centos7.9/anaconda3/bin:$PATH
source activate fbpic
mpirun -np 32 python lwfa_script.py
脚本说明:
- fbpic安装在anaconda env中,
source activate fbpic
可加载相关环境变量
- lwfa_script.py 用来运行模拟计算,具体内容请参考fbpic提供的样例python脚本lwfa_script.py
$ sbatch fbpic_sample_job.sh