关键词:机器学习力场,SNAP,NNP,ACE,玻璃陶瓷
1、案例背景
基于密度泛函理论求解求解薛定谔方程的第一性原理方法在材料模拟,材料性质预测方法取得了不错的进展。然而,求解体系只局限于数百个原子,为人们所诟病。在过去几年中,在人工智能和机器学习的发展推动下,机器学习力场方法出现了。所谓的机器学习力场试图通过一种形式来描述化合物的势能面,这种形式根据每个原子的局部环境预测第一性原理计算的能量和力。因此,这些力场能提供与第一性原理准确性相当于能量与力,其计算工作量仅比经典力场略大。目前已经有许多机器学习力场相关的工作,但基于工业领域的适用性,目前仍然缺少这些力场准确性的系统比较。另外,文献中大多数机器学习力场应用都只涉及具有一到三个元素的体系。在许多具有工业重要性的领域(如催化、陶瓷或电池),甚至需要同时使用四个元素以上的力场。
本案例的研究对象是α,β锂霞石(Eucryptite),低热膨胀系数的锂霞石可用于玻璃陶瓷或固体电解质等领域。基于锂霞石体系,本案例中德国肖特集团联合Materials Design公司对谱近邻分析力场(SNAP),神经网络力场 (NNP)和原子簇扩展力场 (ACE)的准确性进行系统性的比较,突破了已有的1~3元的机器学习力场体系,确定了力场的实际适用性。
2、建模与计算方法
作者通过InfoMaticA中搜索得到α,β锂霞石结构,并采用MedeA VASP在300K,NVE系综下进行第一性原理分子动力学(AIMD)计算生成的轨迹放入数据集中,另外在600K,NPT系综下进行AIMD计算生成的轨迹也放入数据集中,时间步长为4 fs。另外,为了保证机器学习力场稳定,还加入了手动创建的8个结构及其优化过程中的轨迹,总共1024个结构在数据集中,并采用MedeA HT管理数据集。在MedeA VASP计算中,截断能采用510 eV,k点间隔为0.178 Å,能量收敛精度为10-5 eV,采用Grimme-D3考虑VDW作用。在机器学习力场训练中,采用MedeA MLPG调整优化SNAP,NNP,ACE的参数。训练好机器学习力场,采用MedeA LAMMPS对体系进行优化,计算体系的膨胀系数,并结合MedeA Diffusion计算Li的均方根位移(MSD)与扩散系数。
3、结果与讨论
表 1为采用MedeA MLPG拟合的机器学习力场的质量,分别为训练集与验证集的能量/原子受力的均方根误差(RMSE)。对于SNAP,NNP,ACE三个类型的机器学习力场,能量的RMSE均低于10 meV,说明这些模型都具有可转移性,能用于分子动力学模拟;然而SNAP力场的RMSE远高于NNP,ACE,并且SNAP这类力场本身的适用性就低于后两者。
表2是采用三种机器学习力场计算锂霞石的膨胀系数。三类机器学习力场都成功预测了β锂霞石晶格c方向的膨胀系数为负值,但是只有ACE力场预测了负的体积膨胀系数,并与实验值一致。
在300K,400K时,采用三个机器学习力场计算都只观察Li离子在平衡位置振动,并未观察到Li离子的扩散,与实验一致,实验表明只有在500K时才能观察到Li离子扩散。图2为700K时,采用NNP计算的Li离子扩散的均方根位移,计算结果表明,Li只沿c轴方向扩散,其它两个力场与NNP计算结果相似。
图2 700K下,采用NNP力场计算Li沿xyz方向的均方根位移(MSD)。
此处需要注意一点,在实际训练过程中,发现700K的模拟并不稳定,查看计算轨迹后发现,是有部分锂靠得过近导致,因为在数据集中并未出现这些“锂靠得过近”结构,因而在训练集中又手动增加了部分锂靠得近的结构及其优化轨迹,保证机器学习力场识别这些结构。基于Einstein方程,采用均方根位移数据得到离子电导率,如表 3所示。在400K时,NNP与ACE力场得到的离子电导率与实验结构一致,SNAP得到的结果略高。
表 3 模拟计算时间50ps到1ns时间,Li沿c轴方向的离子电导率,与实验值
另外,实验发现不同温度下由于扩散激活能不同,材料中锂的扩散有三个扩散阶段。在模拟中,由于高温时计算体系的不稳定性,可以通过Li/Li径向分布函数(RDF)来判断。在300K时,Li/Li的RDF峰值在370 pm,接近其晶体结构中的平衡位置距离(366 pm)。当温度升高到500k时,在230 pm处出现新的峰值,表明结构已经变形,Li相互靠近。当温度进一步升高到700K时,230 pm处的峰值进一步增加。
图 3 SNAP力场模拟计算不同温度下Li/Li的径向分布函数
最后,本案例评估了SNAP,NNP,ACE力场计算所需要的资源。在相同的结构、计算时长、计算资源的条件下,ACE力场计算时间最短,计算最快,SNAP与NNP力场计算时间接近。
4、总结与展望
本案例依据工业应用场景,基于α,β锂霞石的结构,训练了SNAP,NNP与ACE三种机器学习力场。训练结果显示,三种力场的能量与力的均方根误差都满足精度要求,除了SNAP的能量均方根误差略大外。采用三种机器学习力场计算体系的体积膨胀系数,只有ACE力场预测得到负的体积膨胀系数,基于Li扩散的均方根位移计算得到的400K下锂的离子电导率与实验一致。本案例系统性的比较了三种机器学习在相同数据集上训练与预测表现,为实际的工程应用场景提供基本参考。
参考文献:
Hill, Jörg-Rüdiger. Mannstadt, Wolfgang. Machine-Learned Potentials for Eucryptite: A Systematic Comparison. Mater.Res[J]. 2023, 38 (24), 5188–5197.
使用MedeA模块:
MedeA Environment
MedeA VASP
MedeA LAMMPS
MedeA Diffusion
MedeA HT
MedeA MLP&MLPG