奥飞寺十三鱼羊
量子比特报道 | 官方账号
8 月的一个早晨,数学天才、菲尔兹奖获得者陶哲轩打开了一封来自三位陌生物理学家的电子邮件。
三人在邮件中解释道:
我们偶然发现了一个公式,如果正确的话,它将在线性代数中一些最基本、最重要的对象之间建立起一种意想不到的关系。
然而陶哲轩的第一反应是:
这么短这么简单的事情早就应该出现在教科书中了。这不可能。
事实上,陶哲轩从来就不喜欢别人以这种方式征求他的意见,甚至在自己的主页上写下了警告:“别拿你的稿件来打扰我”。
但令三位物理学家惊讶的是,仅仅两个小时后他们就收到了陶哲轩的回复。
更让人想不到的是,一周半之后,两人就联合发表了一篇论文,阐述了这个公式的证明过程。
什么样的配方让陶哲轩如此青睐?
求解特征向量。
是的,这就是这个非常常见的基本数学公式。
按照传统的解决方案:
计算特征多项式→求特征值→解齐次线性方程组,得到特征向量。
然而这三位物理学家在研究“中微子”的过程中,却意外发现了另一个绝妙的解决办法:
知道特征值后,我们可以通过写一个简单的方程轻松找到特征向量。
△ 三位物理学家。从左到右依次为:张希宁、Peter、Parke。
正如陶哲轩所说:
这个公式看起来好得令人难以置信。
我从来没有想到子矩阵的特征值会编码有关原始矩阵的特征向量的隐藏信息。
耶鲁大学数学家 Van Vu 用“惊人”和“有趣”这两个词来形容这一发现。
有新闻网友甚至认为,该公式的理论值比克莱姆定律还要高。
注:克莱姆规则是线性代数中的一个基本定理,它利用行列式计算具有 n 个变量的线性方程组的解。
这个新方法是如何产生的?
我们先来回顾一下我们熟悉的特征向量和特征值。
矩阵与向量相乘相当于线性变换,但是向量的方向经常会改变。
但如果存在一个矩阵A,使得向量v经过线性变换后,方向保持不变,但是被拉伸或者压缩一定倍数,即:Av=λv。
那么,这个向量v就是特征向量物理学家不是天才,λ就是特征值。
在目前的教科书中,当已知特征向量时,寻找特征值是比较容易的,但是寻找一个矩阵的特征值比寻找特征向量更加方便。
但当三位物理学家计算中微子振荡的概率时发现:
特征向量和特征值的几何本质其实就是空间向量的旋转和缩放。而中微子的三种味道(电子、μ子、τ子)不就等价于空间中三个向量之间的变换吗?
中微子振荡是一种量子力学现象,实验发现电子中微子、μ子中微子和τ子中微子三类中微子可以相互转化,这就是中微子振荡现象。
△图片来源:
物理学家们意识到特征向量和特征值之间可能存在更普遍的规律,从而揭开了新公式的面纱。
通过从原始矩阵中删除行和列来创建子矩阵。
将子矩阵和原矩阵的特征值结合起来,计算原矩阵的特征向量。
简而言之,如果已知特征值,就可以利用方程来寻找特征向量。
△图片来源:
这个新配方到底有多棒呢?
数学天才、菲尔兹奖获得者陶哲轩评论道:
新公式的奇妙之处在于,无论如何,您不需要知道矩阵的任何元素就可以计算您想要的任何内容。
证明过程
在陶哲轩的回信中,他还附上了新公式的三个证明,后来又与彼得、帕克、张悉宁三位物理学家共同发表了论文。
首先将 A 定义为一个 nxn 埃尔米特矩阵,其特征向量为 λi(A),范数特征向量为 vi。
埃尔米特矩阵()可以将特征向量转化为实数,更适合解决现实问题。
特征向量中的每个元素都标记为 vi,j。
通过删除第j行和第j列,我们可以得到A的一个子矩阵Mj,其大小为(n-1)x(n-1),其特征值为λk(Mj)。
首先通过证明可以得到一个柯西-比奈型公式。
引理1. 令A的一个特征值为0. 不失一般性, 我们可以令λn(A)=0. 那么对于任意大小为nx(n-1)的矩阵B, 我们可以得到:
接下来我们就可以进行新公式的推导了。
引理2.特征向量每个元素的平方范数与其特征值以及其子矩阵的特征值相关。
因此我们可以证明:设j = 1,i = n。将A平移λn(A)In,使得λn(A) = 0;这也会将A和Mj中所有剩余的特征值也平移,因此公式2变成:
注意公式3的右边是det(M1)。
接下来,在 B = (0, In-1) 中应用引理 1。我们发现公式 1 的左边是
,公式1的右边为det(M1)。
证明:对于任何不是 A 特征值的 λ,
对于,j∈[1,n],
进一步简化,取极限λ→λi(A),
等式 7 右边的对角线元素构成了等式 2 的左半部分。根据共轭定义,等式 7 左边的对角线元素确定了 λi(A)In-A 的子矩阵。
应用引理2,必然的结论是,若特征向量中某个元素消失,即vi,j=0,则矩阵A的特征向量方程将变形为其子矩阵Mj的特征向量方程。
这一发现的影响
简而言之,物理学家的这一最新成果将使得仅使用特征值信息来计算特征向量成为可能。
在目前的教科书中,使用特征向量来寻找特征值更加容易物理学家不是天才,但是寻找矩阵的特征值比寻找特征向量更加方便。
换句话说,这个结果揭示了有关基础数学的新事实。
更重要的是,在现实世界中,无论数学,物理还是工程学,很多问题都涉及到特征向量和特征值的计算。
例如计算中微子振荡的概率。
例如在机器学习领域,数据降维、人脸识别等都涉及到矩阵特征值/特征向量理论的实际应用。
俄亥俄州立大学粒子物理学家约翰指出,这一理论有着广阔的应用前景,甚至可能打开新世界的大门。
物理学家和数学天才的合作
而受三位物理学家邀请,证明新公式的数学家,正是公认的数学天才陶哲轩。
△ 陶哲轩
他7岁上高中,9岁考上大学网校头条,13岁荣获国际数学奥林匹克金牌,是国际数学奥林匹克最年轻的金、银、铜牌获得者。
24岁成为加州大学洛杉矶分校数学系终身教授,31岁荣获有“数学界的诺贝尔奖”之称的菲尔兹奖,成为第二位获此殊荣的华人数学家。
三位物理学家中,一位是美国布鲁克海文国家实验室的助理物理学家彼得·B,他于2016年获得范德堡大学物理系博士学位。
另一位是新西兰物理学家斯蒂芬·帕克(J.Parke),杰出科学家,美国费米国家加速器实验室理论物理系主任,专注于中微子物理和顶夸克物理的研究。
最后一位作者张希宁同样有着一张中国面孔,他曾就读于芝加哥大学,从事理论粒子物理研究,是史蒂芬·帕克的弟子。
门户网站
论文地址:
博客地址:
- 超过-
大咖云集!首批嘉宾揭晓
MEET 2020智能未来大会开启,李开复、倪光南、井昆、周博文、吴明辉、曹旭东、叶杰平、黄刚等AI大咖带你读懂人工智能,门票即将售罄,扫码报名抢占座位~
量子比特·今日头条签约作者
追踪人工智能技术和产品的新趋势
如果喜欢的话就点“关注”吧!