本文旨在为用户介绍如何使用智算平台直接提交训练任务运行 LAMMPS 计算。

前提条件

  • 已经获取控制台账户和密码。

  • 已完成实名认证且账户余额大于 0 元。

  • 平台已创建有可用的用户目录

操作步骤

  1. 登录控制台,默认进入 AI 计算平台。

  2. 在左侧导航栏中,点击存储与数据服务,将 in.lj 文件上传到平台上已有的文件存储 EPFS中。

    in.lj 文件内容如下,用户可自行创建后上传至存储服务,或点击此处下载完整文件。

    # 3d Lennard-Jones melt
    
    units		lj
    atom_style	atomic
    
    lattice		fcc 0.8442
    region		box block 0 80 0 160 0 160
    create_box	1 box
    create_atoms	1 box
    mass		1 1.0
    
    velocity	all create 1.44 87287 loop geom
    
    pair_style	lj/cut 2.5
    pair_coeff	1 1 1.0 1.0 2.5
    
    neighbor	0.3 bin
    neigh_modify    delay 5 every 1
    
    fix		1 all nve
    
    run		100
  3. 在左侧导航栏,点击镜像仓库,选择应用镜像页签。

  4. 在 LAMMPS 镜像卡片页内,点击提交训练任务

    hpc bp lammps 1
  5. 创建训练任务页面中,根据如下要求配置各项参数,点击确定

    • 框架:选择 Mpi

    • 镜像:已选择上一步选定的应用镜像。

    • 存储与数据:选择上传有 in.lj 文件的用户目录即可。

    • 启动命令:本实践中的启动命令为:mpirun lmp_mpi -in /root/epfs/in.lj

      注意

      本实践中直接将 in.lj 文件上传至文件存储的根目录中,故此处文件所在路径为 /root/epfs/in.lj。若用户上传至了其他文件夹中,则需根据实际情况进行修改。

    • 计算资源:若选择 CPU 计算,则需 2 个节点,其他资源类型一个节点即可。本实践中选择 CPU 计算,节点数量2

    • 其他参数,根据实际情况进行设定或保持默认即可。

  6. 等待训练任务创建完成,且状态为运行中,点击任务名称/ID,进入训练任务详情页面。

    hpc bp lammps 2
  7. 在训练任务详情页面,选择容器组页签,可查看到一个 launcher 节点和若干个 worker 节点。

    说明

    创建训练任务时选定的节点数量,即为当前 worker 的节点数。

    hpc bp lammps 3
  8. 等待任务状态为已完成,在其详情页面选择日志页签,即可查看运行结果。

    hpc bp lammps 4