当前位置: 首页 > news >正文

新增多项功能,龙讯旷腾开源机器学习力场PWMLFF 2024.3版本上线

人工智能与传统计算机模拟结合是当今科学计算的一大趋势,机器学习力场作为其中的一个重要方向,能够显著提升分子动力学模拟的精度和效率。PWMLFF是一套由龙讯旷腾团队开发,在 GNU 许可下的开源软件包,用于快速生成媲美从头算分子动力学(AIMD)精度的机器学习力场。本次发布的PWMLFF 2024.3版本,包含Lammps的libtorch接口方案、主动学习平台、数据处理平台等一系列更新。现PWMLFF包括模型训练平台、Lammps分子动力学接口、主动学习平台、数据格式转换工具、数据和模型仓库以及用户手册。

PWMLFF用户手册

PWMLFF用户手册提供了详细的PWMLFF工具集安装、使用以及案例说明文档。通过阅读PWMLFF手册,用户可以快速了解和上手整套PWMLFF工具包。

PWMLFF机器学习平台

PWMLFF 机器学习平台用于快速生成媲美从头算分子动力学(AIMD)的机器学习力场。支持8种常见描述符、4种机器学习模型以及两种训练优化器。

特点

集成不同特征与模型,可自由组合

对于扩展系统,PWMLFF假设系统的总能量是系统中每个原子能量的总和。PWMLFF用不同的局域原子描述符(即所谓“特征”)来描述局部原子结构,以这些特征作为回归模型的输入,拟合原子能量。PWMLFF支持的回归模型包括线性模型、神经网络(NN)模型和深度势能(Deep Potential)模型。PWMLFF包含了8种常用特征,用户可以将它们与几种模型任意组合使用。

Energy Decomposition

PWMLFF另一个独特功能是可以结合PWmat分子动力学计算中的能量分解功能,将局域的原子能量作为输入。由于局域原子能量可以直接作为数据输入回归模型,这可以显著减少训练所需的分子动力学步数,因此可以克服机器学习力场需要长时间预运算来产生训练数据这一困难。在PWMLFF中,总能量、局域原子能量和原子受力均可以作为训练标签输入。

Kalman Filter优化器加速训练

PWMLFF 支持常用优化器Adam以及扩展Kalman滤波优化器(EKF),这是一种训练收敛速度比Adam等优化器更快的一阶梯度优化器,然而往往需要占用更多的内存/显存。龙讯旷腾团队创造性得采用了分层计算的方式(RLEKF,https://ojs.aaai.org/index.php/AAAI/article/view/25957),使用块对角矩阵来近似稠密加权误差协方差矩阵,解决了此类优化器在计算中显存占用太多的问题。实验证明,RLEKF训练方式相比于Adam优化器精度更高,速度更快。

简单易上手的操作界面

PWMLFF 提供了从源码安装、离线安装两种方式供用户选择。此外,对于Mcloud用户,我们在Mcloud集成了PWMLFF的所有软件包,实现了“一条命令”即可加载。针对复杂的训练输入,PWMLFF采用了常见的JSON文件配置方式,并尽可能精简用户输入参数。用户只需类似如下例所示的简单配置,即可实现大多数模型训练。

PWMLFF 输入示例

{

"model_type": "DP",

"atom_type": [14],

"datasets_path": ["./PWdata"]

}

PWMLFF分子动力学接口

PWMLFF提供了与分子动力学计算软件lammps的无缝集成接口,支持常见的NVE、NVT、NPT等多种系综设置。该接口不仅支持常规的CPU计算,还实现了GPU多卡加速能力,能高效利用多块GPU卡进行大规模并行加速。此外,调用PWMLFF模型的操作方式也更通用(如下lammps输入文件所示)。

PWact主动学习平台(支持 pip install pwact)

由于机器学习方法的插值特性,对于训练集之外的相空间,MLFF 很难做出准确预测。训练数据通常是使用昂贵的第一性原理计算生成的,现实中很难获取到大量的从头算数据集,生成具有足够代表性的训练数据但不依赖大量从头算数据,对于提升模型的外推能力至关重要。

主动学习的一般性流程包括训练、构型探索以及标注。首先,训练模块做力场训练;之后探索模块调用力场模型做分子动力学模拟,模拟结束后把得到的分子运动轨迹送入查询器做不确定性度量;查询完成后,把待标注构型点送入标注模块;最后标注模块做自洽计算,得到能量和力作为标签,加入已标注数据库中;重复上述步骤,直到收敛。

PWact是开源的基于 PWMLFF 的一套自动化主动学习平台,用于高效的自动化主动学习采样,快速制备PWMLFF力场训练数据。PWact安装和操作简单易学,支持源码安装和更加便捷的pip 命令(pip install pwact)安装两种方式,使用JSON文件作为输入控制。PWact包括初始训练数据制备以及主动学习两大功能。通过简单的JSON文件配置,即可实现初始训练数据制备和主动学习过程中的计算任务生成、调度、监控、故障恢复以及结果收集自动化。支持PWmat、VASP、CP2K、DFTB(PWmat集成,🔗)等常用第一性原理程序。

结构转换工具PWdata(支持 pip install pwdata)

PWdata是一款数据转换工具,能够快捷地实现PWmat、VASP、CP2K之间的结构格式互转,支持各类结构到PWMLFF力场数据格式转换。PWdata支持源码安装和pip命令安装(pip install pwdata)两种方式,简便易用。

训练数据集仓库

AIMD数据的高昂制备成本一直是限制机器学习力场的瓶颈之一,我们在该数据仓库中上传了常见体系的AIMD 数据集、一些已训练的PWMLFF 模型、常用的不同版本模型转换脚本。便于用户快速复用已有数据集和模型或进行不同模型之间的横向比较,帮助用户节省数据制备和模型训练成本。

相关下载请前往:https://www.pwmat.com/mlff

http://www.lryc.cn/news/322227.html

相关文章:

  • Docker常用命令练习
  • Kafka(十)安全
  • 流畅的 Python 第二版(GPT 重译)(四)
  • windows docker
  • 中国1km分辨率逐月地表太阳辐射均值数据集(1960-2022)
  • Android中内存泄漏的检测,解决方案以及示例
  • Android静默安装一(Root版)
  • 【漏洞复现】2.Apache Log4j2远程代码执行漏洞(CVE-2021-44228)复现及分析
  • Simulink|局部遮荫下光伏组件多峰值PSO-MPPT控制
  • 今日早报 每日精选15条新闻简报 每天一分钟 知晓天下事 3月21日,星期四
  • 蓝桥杯Python B组练习——完美的代价
  • 分布式游戏服务器
  • idea中常见快捷键及插件操作
  • 理解树的结构-算法通关村
  • 金融知识分享系列之:支撑阻力
  • 如何使用Excel创建一个物品采购表
  • 容器中的大模型(三)| 利用大语言模型:容器化高效地部署 PDF 解析器实践...
  • java采集小程序联合航空官方
  • 【力扣每日一题】lc1793. 好子数组的最大分数(单调栈)
  • ES的集群节点发现故障排除指南(1)
  • 使用html+css制作一个发光立方体特效
  • 贵州省二级分类土地利用数据(矢量)
  • 通过nginx+xray服务搭建及本地配置
  • 第一节 Axure RP产品经理原型进阶学习
  • Linux实战笔记(三) 文件压缩
  • 树形递归模板
  • Python实战:Pandas数据合并与重塑
  • 如何理解 Linux 命令行参数与环境变量7
  • 奥特曼回应GPT5
  • QT----给程序添加上任务栏托盘图标和退出