近来,一组来自CMU和UC等研究机构的研究人员率先推出了全球首个AI宇宙三维模拟器。这个模拟器除了速率快但是精度高,调参后无需训练仍能确切模拟,甚至连它的创造者都不晓得它是怎么做到的。
宇宙中暗物质的数目都能估算
几六年来,科学家们仍然使用计算机模拟来尝试并用数字技术对我们宇宙的起源和演变进行逆向工程。使用现代技术的最佳的传统方式须要几分钟时间来形成良好的结果。如今,这个全球首个AI宇宙模拟器在几微秒内,才能形成更高精度的结果。
论文中谈到:“在这儿,我们构建了一个深层的神经网路来预测宇宙的结构产生。它优于传统的快速剖析近似法,而且可以在训练数据之外精确地进行外推。”
也就是说,它除了做了开发人员建造它做的事情——模拟不同引力条件下宇宙的演变——它还为它没有训练过的变量形成了精确的结果。比如,它报告的一个让科学家们震惊的特殊参数是,宇宙中暗物质的数目。
研究小组没有按照暗物质浓度不同的数据来训练这个名为“深密度位移模型”(D3M)的系统,但是AI(依据研究,精确地)按照它所训练的数据的结论改变了这种值。
正如论文的专著者Ho所言:“这如同用大量的猫狗图片教图象辨识软件一样,但此后软件才能辨识小象。没有人晓得它是怎样做到的,这是一个很吃惊的谜。”
8000种不同模拟训练模型
像D3M那样的计算机模拟已成为理论天体化学学的必要条件。科学家们想晓得宇宙在不同的情况下是怎样演变的,比如,例如暗能量将宇宙拉离的时间是不同的。这种研究须要进行数千次模拟,做一个闪电般快速且高度精确的计算机模型成为现代天体化学学的主要目标之一。
D3M模拟引力怎样打造宇宙。研究人员选择仅关注引力,由于它是迄今为止宇宙大规模演变中最重要的力量。
最精确的宇宙模拟估算了引力怎样在宇宙的整个生命中联通数十亿个单个粒子。这些精度须要时间,一次模拟须要大概300个估算小时。更快的方式可以在两分钟内完成相同的模拟天体物理模拟器,但代价就是精度会增加。
研究人员通过从可用的最高精度模型中提供了8,000种不同的模拟,来训练D3M使用的深度神经网路。神经网路获取训练数据并对数据进行估算;之后研究人员将结果与预期结果进行比较。通过进一步训练,神经网路会随着时间的推移而适应,因而形成更快、更确切的结果。
在训练D3M以后,研究人员对6亿光年的箱形宇宙进行了模拟,并将结果与慢速和快速模型的结果进行了比较。慢速但确切的方式每次模拟须要数百小时的估算时间,而现有的快速技巧须要几分钟,但D3M可以在30微秒内完成模拟。
D3M也能形成确切的结果。与高精度模型相比,D3M的相对偏差为2.8%。使用相同的比较,现有的快速模型的相对偏差为9.3%。
研究人员表示,D3M在处理训练数据中未发觉的参数变化方面具有非凡的能力,这促使它成为一个非常有用和灵活的工具。不仅模拟其他力,如流体动力学,研究团队希望了解更多关于模型是怎样运作的。
图1:由D3M形成的位移矢量场(左)和由此形成的密度场(右)。
图2:各列通过各类模型显示了完整粒子分布(上)和位移矢量(下)的2D切块:,目标truth,基于PM解算器(A)的近似N体模拟方案;ZA天体物理模拟器,沿初始速率矢量(B)演变粒子的简单线性模型;2LPT,常用的剖析近似(C)和本文的深度学习模型D3M(D)。其实(A)是研究团队的truth,B-D包括点或向量的颜色。颜色表示目标位置(A)或位移矢量与各类方式(B-D)预测分布之间的相对差别()/。偏差条表明,密度较大的区域所有方式都有较大的偏差,这表明对于所有模型(D3M,2LPT和ZA),很难正确预测高度非线性区域。她们的D3M模型在上述B-D模型中预测和truth之间的差别最小。
图3:(蓝色),2LPT(红色)和c(红色)(底部)的位移和密度功率谱;传递函数-即预测的功率谱与truth(中部)之比的平方根;以及1–r2,其中r是预测场与真场(顶部)之间的相关系数。结果是1,000个测试模拟的平均值。从大到中,D3M预测的传递函数和相关系数接近完美,显著优于基准2LPT。(B)对于几个三角形配置,两个3PCF的多极系数(ζ1(r1,r2))(与目标)的百分比。结果在10次测试模拟中取平均值。偏差条(填充区域)是从10次测试模拟得出的SD。该百分比表明D3M的3PCF比她们的目标更接近2LPT,残差更小。
图4:上图显示当她们改变宇宙参数As和m时,粒子分布和位移场的差别。(A)偏差条显示As=A0与As=0.2A0(中心)和As=1.8A0(右)之间的两个极值之间的粒子分布(上)和位移场(下)之间的差别。(B)类似的比较,显示m∈{0.1,0.5}的较小和较大值的粒子分布(上)和位移场(下)的差别,用于训练的m=0.3089。其实较小的As(m)值的差别较大,但较大的As(m)的位移愈发非线性。这些非线性是由质量集中造成的,并使预测愈发困难。
图5:与图3A类似,不仅在不改变训练集(具有不同的宇宙参数)或训练模型的情况下,改变宇宙参数时,测试两点统计量。当在不同的As(A)和Ωm(B)上测试时,显示了来自D3M和2LPT的预测。她们展示了传递函数-即预测功率谱与truth(上)之比的平方根-和1-r2,其中r是预测场与真实场(下)之间的相关系数。不仅最大尺度,D3M预测在所有尺度上都优于2LPT预测,由于扰动理论在线性区域(大尺度)中工作良好。
AI将帮助人类更好的认识宇宙
不仅进一步展示黑匣子AI和深度学习的反复无常和不可预测的本质外,AI宇宙模拟器本身还有潜力帮助天体化学学家和研究人员弥补我们宇宙背后的一些空白。
我们的宇宙是一个奇怪的,几乎是未知的地方。人类刚才开始将我们的视线投向可观测空间之外,以确定宇宙之外是哪些,以及它是怎样产生现今的样子的。人工智能可以帮助我们确切地理解影响我们宇宙进化的数十亿个变量是怎样作用于星体、行星甚至生命本身的出现的。
该研究的源代码:
形成训练数据的代码:
论文地址:
参考链接