【摘要】 随着机器学习技术在图像识别、决策和逻辑推理等领域的高效应用,机器学习算法越来越受到化学家的关注。 机器学习算法善于发现数据之间的内在规律,而数学中的问题一般都是逻辑性、规律性的,因此机器学习算法非常适合用来解决数学中的问题。 在经典数学领域,机器学习可以学习牛顿热力学定律。 在量子化学领域,机器学习可以求解薛定谔多项式的能级波函数,找到相变的位置,表示量子多体系统的状态,找到多体系统中的阶热阻, 等等。 机器学习算法分为监督学习、非监督学习和强化学习。 监督学习是先用样本训练机器,比如训练一个神经网络,然后用训练好的神经网络做预测。 在进行预测时,输入样本可能不在训练期间使用的样本中。 无监督学习不需要训练样本,而是直接针对一个优化目标对输入数据进行优化,最终可以根据类别区分数据。 强化学习是通过反复尝试训练一种反馈机制,从而得到最大的奖励。 这些算法适用于仪器控制。 即使机器学习算法的形成并不是为了解决数学问题而设计的,但合理地理解和使用机器学习算法可以帮助数学家从新的角度理解数学,发现新的数学。 同时,随着量子估计的发展,人们开始尝试在量子计算机上运行机器学习算法,并获得了较高的加速比。
因此,机器学习技术将帮助化学家解决数学中的问题,数学可以更高效地推动机器学习的发展。 在未来,机器学习和化学将相互驱动,相得益彰。 本文介绍了我们如何使用机器学习来解决量子化学中的问题。 主要包括三个部分:第一部分重点介绍如何利用深度神经网络生成玻色-爱因斯坦收敛(BEC)的能级波函数。 在BEC中量子物理的应用范围,所有粒子都具有相同的相位,BEC的能级波函数在空间上是一种概率分布。 能级波函数是通过求解Gross-(GP方程)得到的,我们可以借助神经网络构建GP多项式到能级波函数的映射。 我们测试了两种情况:1,势场相同,敌意系数不同; 2、敌意系数相同,势场不同。 借助深度神经网络进行监督学习,经过训练的神经网络可以高精度地生成玻色-爱因斯坦聚集体的能级波函数。 当输入高斯随机势场的相干厚度小至σD=0.39时,深度神经网络仍能生成高精度的能级波函数。 同时,我们输入不同类型的势场,仍然得到高精度的波函数输出,这表明用高斯随机势场训练的神经网络已经学会了求解GP多项式的技巧。 第二部分着重介绍如何设计合理的前馈神经网络作为变分波函数来有效求解二维量子载流子多体系统。
目前对量子多体系统的求解依赖于张量网络,张量网络的估计复杂度较高。 用神经网络代替张量网络实际上是可以的。 因此,我们需要测试神经网络描述非平凡多体能级的能力,例如具有较强抵抗力的J1-J2模型。 我们借助目前主流的神经网络元素:频域层、最大池化层和反频域层,构建了一个可以作为二维量子载体系统变分波函数的频域神经网络。 为了尽可能避免局部最小值量子物理的应用范围,我们使用副本交换的动力学技巧优化。 优化时,我们先设定一系列不同的水温,然后用随机值初始化神经网络中的各个参数,最后得到不需要体温的解。 零温度下的解就是我们认为的能级解。 估计表明,我们设计的前馈神经网络在能级能量精度方面可以优于现有的-Bond-State。 因此,可以使用频域神经网络来加速量子多体系统的求解。 第三部分重点描述鸡尾酒会问题 (CPP) 的量子版本。 CPP是一个古老但非常重要的问题,它是借助多个检测器的检测信号来提取混合信号源。 对于经典的CPP,可以使用独立成分分析算法(ICA)来求解。 我们考虑 CPP 的量子版本,即信号源发射纯态,每个纯态彼此非正交。 这种纯态的希尔伯特空间比探测器能够响应的希尔伯特空间要小,所以探测器探测到的是混合态。 我们在经典的ICA算法的基础上,重新设计了损失函数,通过只检测混合态的密度矩阵来恢复纯态密度矩阵。 经过数值估算和验证,牛顿法还原得到的纯态保真度在0.99以上。 同时,我们将损失函数转化为一个自旋1/2的多体载流子耦合,这个的能级就是损失函数达到最小值的解。 通过模拟固溶体,纯态的还原保真度仍在0.99以上。