分子势能基于DPA-1模型的全面升级，具有以下优势

2024-04-04 20:19:11教育资讯42

DPA-1型号是在DP系列型号基础上的全面升级，具有以下优点。VNM物理好资源网(原物理ok网)

首先，该模型使用类似于自然语言处理领域中的注意力机制的门控注意力机制来完全建模原子之间的相互作用，这使得模型可以在现有数据条件下学习更多。隐含的原子交互信息可以有效提高模型在不同数据集之间的迁移能力以及数据生成过程中的采样效率。VNM物理好资源网(原物理ok网)

其次，模型包含编码元素分子势能，不同元素使用相同的网络参数，有利于扩展模型的元素容量。VNM物理好资源网(原物理ok网)

同时，由于该模型是在56个元素的大数据集上进行预训练，并完成多个下游任务的迁移学习，因此在保证预测精度的同时，可以大大降低训练成本和训练数据量。VNM物理好资源网(原物理ok网)

此外，该模型具有超高的推理效率，可以进行大规模的分子动力学模拟。VNM物理好资源网(原物理ok网)

分子势能 VNM物理好资源网(原物理ok网)

▲图| DPA-1模型示意图（来源：arXiv）VNM物理好资源网(原物理ok网)

为了有效避免传统模型的局限性，开发人员进行了多次有针对性的实验。VNM物理好资源网(原物理ok网)

开发人员首先将不同的训练集划分为多个子集，然后训练一些子集，同时测试其他子集。需要注意的是，这里每个子集的构象和组成都是不同的。例如，数据集中，子集中只有单元素数据，子集中只有二进制数据，子集中只有三元数据。VNM物理好资源网(原物理ok网)

分子势能 VNM物理好资源网(原物理ok网)

最后，开发人员在三种类型的数据集上测试了 DPA-1 和 -SE 这两个模型的性能：合金、固态电解质（SSE，固态）和高熵合金（HEA，High-）。结果表明，与-SE相比，DPA-1的测试精度可提高一到两个数量级，充分说明了后者强大的迁移能力。VNM物理好资源网(原物理ok网)

分子势能 VNM物理好资源网(原物理ok网)

▲图| 在不同训练集上测试时获得的结果（来源：arXiv）VNM物理好资源网(原物理ok网)

在“预训练+少量数据微调”的模型制作范式下，开发人员为DPA-1规划了迁移学习解决方案。首先对大规模数据进行模型预训练，然后利用新数据集的统计结果修正最后一层的能量偏差，并将其作为训练新任务的起点。VNM物理好资源网(原物理ok网)

例如，对数据集中的一元和二元数据进行预训练，对三元数据完成测试。接下来，在OC2M数据集上进行预训练工作，然后分别迁移到HEA和AlCu数据集。结果表明分子势能，DPA-1不仅可以在只有三元数据的场景下获得更高的准确率，而且可以有效减少对下游训练数据的依赖。VNM物理好资源网(原物理ok网)

分子势能 VNM物理好资源网(原物理ok网)