你晓得一亿有多大吗?科学家开发了一种名为的强大新计算机程序,即人工智能AI算法,该程序可以挨个象素地剖析天文图象数据,以辨识和分类来自天文观测大量数据集中的所有星体和星体。是一个深度学习框架,融合了为图象和语音辨识等应用开发的各类人工智能技术。加洲学院圣克鲁斯学校估算天体化学研究小组负责人、天文学和天体化学学院士布兰特·罗伯逊(Brant)表示:
天文学数据集的快速下降,致使手动化一些传统上由天文学家完成的任务显得至关重要。有些事情我们人类根本做不到,所以必须想办法借助计算机来处理未来几年将从小型天文观测项目中获得的海量数据。罗伯逊与瑞安·豪森(Ryan)合作,前者是加洲学院巴斯金工程大学的计算机科学研究生,在过去五年里开发并测试了。其研究结果现已发表在《天体化学学》期刊上,豪森和罗伯逊也公开发布了代码。
星体的形态,从像我们银河系这样的旋转盘状星体,到无定形的椭圆形星体,都可以告诉天文学家星体是怎样随着时间推移而产生和演变的。大规模的观测天体物理专业代码,比如将在澳大利亚正在建设的维拉·鲁宾天文台进行的遗产时空观测(LSST),将形成大量的图象数据,罗伯逊早已参与了怎样借助那些数据来理解星体产生和演变的规划。LSST将使用32亿象素的单反,每天拍摄800多张全景图象,每周两次记录整个可见天空。
想像一下天体物理专业代码,假如你去找几个天文学家,要求她们对数十亿个天体进行分类,她们如何可能做到这一点?现今新研究将才能手动对这种天体进行分类,并借助这种信息来了解星体的演进。其他天文学家早已使用深度学习技术对星体进行分类,但之前的努力一般涉及更改现有图象辨识算法,研究人员向算法提供要分类星体的精选图象,所以研究人员专门为天文图象数据从头开始建造了,该模型使用天文学家使用的标准数字文件格式的原始图象数据作为输入。
象素级分类是的另一个重要优势,对于其他模型,你必须晓得哪里有哪些东西,并向模型提供一张图象,它会立刻对整个数据集的星体进行分类。会为你发觉星体,并挨个象素地处理,所以它可以处理十分复杂的图象,你可能会在圆盘后面听到一个圆球。对于有中心隆起的圆盘,它会单独对隆起进行分类,所以它的功能十分强悍。为了训练深度学习算法,研究人员使用了2015年一项研究中的信息,在那项研究中,数十名天文学家对来自项目哈勃太空望远镜图象中大概1万个星体进行了分类。
之后,将应用于来自哈勃遗留领域的图象数据,这种数据结合了几次哈勃深场观测所获得的观测结果。当处理一张天空区域的图象时,它会生成一组新的天空部份图象,其中所有对象都按照它们的形态进行颜色编码,将天文对象与背景分开,并辨识点源(星体)和不同类型的星体。输出包括每位分类的置信度级别。该程序在加洲学院纽约校区的lux超级计算机上运行,可以快速生成对整个数据集的挨个象素剖析。
博科园|研究/来自:加利福尼亚学院圣塔克鲁兹中学
研究发表刊物《天体化学学》
博科园|科学、科技、科研、科普