slurm-job-submission-and-execution.md

$ sinfo -s
PARTITION    AVAIL  TIMELIMIT   NODES(A/I/O/T) NODELIST
qcpu*           up 2-00:00:00      1/191/0/192 cn[1-192]
qcpu_biz        up 2-00:00:00      1/191/0/192 cn[1-192]
qcpu_exp        up    1:00:00      1/191/0/192 cn[1-192]
qcpu_free       up   18:00:00      1/191/0/192 cn[1-192]
qcpu_long       up 6-00:00:00      1/191/0/192 cn[1-192]
qcpu_preempt    up   12:00:00      1/191/0/192 cn[1-192]
qgpu            up 2-00:00:00          0/8/0/8 cn[193-200]
qgpu_biz        up 2-00:00:00          0/8/0/8 cn[193-200]
qgpu_exp        up    1:00:00          0/8/0/8 cn[193-200]
qgpu_free       up   18:00:00          0/8/0/8 cn[193-200]
qgpu_preempt    up   12:00:00          0/8/0/8 cn[193-200]
qfat            up 2-00:00:00          0/1/0/1 cn201
qdgx            up 2-00:00:00          0/1/0/1 cn202
qviz            up    8:00:00          0/2/0/2 vizserv[1-2]
$ squeue
$ squeue --me
             JOBID PARTITION     NAME     USER ST       TIME  NODES NODELIST(REASON)
               104   qcpu    interact    user   R       1:48      2 cn[101-102]
$ scontrol show job JOBID
$ scontrol show job $SLURM_JOBID
$ squeue --me -l
$ squeue --me -t running
$ squeue --me -t pending
$ squeue -A PROJECT-ID
$ salloc -A PROJECT-ID -p qcpu_exp
$ salloc -A PROJECT-ID -p qcpu -N 4 --ntasks-per-node 36 -t 2:00:00
$ salloc -A PROJECT-ID -p qcpu_exp --x11
#!/usr/bin/bash
#SBATCH --job-name MyJobName
#SBATCH --account PROJECT-ID
#SBATCH --partition qcpu
#SBATCH --nodes 4
#SBATCH --ntasks-per-node 36
#SBATCH --time 12:00:00

ml OpenMPI/4.1.4-GCC-11.3.0

srun hostname | sort | uniq -c
### submit directory my_work_dir will be also used as working directory for submitted job
$ cd my_work_dir
$ sbatch script.sh
     36 cn17.barbora.it4i.cz
     36 cn18.barbora.it4i.cz
     36 cn19.barbora.it4i.cz
     36 cn20.barbora.it4i.cz
$ set | grep ^SLURM
$ echo $SLURM_JOB_NODELIST
cn[101-102]
$ scontrol show hostnames
cn101
cn102
$ scontrol update JobId=JOBID ATTR=VALUE
$ scontrol update JobId=JOBID timelimit=4:00:00
$ scontrol update JobId=JOBID Comment='The best job ever'
$ scancel JOBID
$ scancel --me
$ scancel --me -i
$ scancel --me -t running
$ scancel --me -t pending
$ scancel --me -t pending -A PROJECT-ID