当前位置首页 > 初中物理 > 综合其它

arXiv:人工自我复制是一个不寻常的两行quine

更新时间:2023-05-24 文章作者:佚名 信息来源:网络整理 阅读次数:

选自 arXivyWg物理好资源网(原物理ok网)

作者:Oscar Chang, HodyWg物理好资源网(原物理ok网)

机器之心合辑yWg物理好资源网(原物理ok网)

参与:程耀彤、卢yWg物理好资源网(原物理ok网)

日前,罗马尼亚科学院的研究人员发表了一篇论文,从生命的角度看待人工智能的发展。 论文提出了一种不寻常的自我复制神经网络,可以实现自我复制,也可以解决辅助任务。 本文使用 MNIST 图像分类作为辅助任务。yWg物理好资源网(原物理ok网)

生物生命始于第一次自我复制(, 2011),自然选择倾向于有利于繁殖的生物,从而产生自我构建的机制。 同样,如果人工智能主体能够在不增加机器的情况下复制和构建自己,我们就可以通过自然选择建立人工智能的自我构建机制。yWg物理好资源网(原物理ok网)

前言yWg物理好资源网(原物理ok网)

在发现 DNA 作为生物复制的化学机制之前,人工自我复制机的概念最早由 John von 在 1940 年代提出。 具体来说,Von 展示了元胞自动机的初始状态和转换规则的配置,元胞自动机在运行固定步数后形成了初始元胞状态的复制品 (Von & Burks, 1966)。 后来(1980)在哥德尔,巴赫:一条辫子中,“quine”这个词是在哲学家Van Orman Quine之后创造的,用来描述自我复制的表达,例如:“is a ”是一个句子片段(“isa”isa ).yWg物理好资源网(原物理ok网)

也有很多关于制作数学自我复制器的研究。 值得注意的例子是瓷砖 (, 1959)、分子 (Wang 等人, 2011)、聚合物 (, 2001) 和机器人 (Zykov 等人, 2005)。yWg物理好资源网(原物理ok网)

在编程语言理论的背景下,quine 是一种复制其自身源代码的计算机程序。 quine 的一个简单示例是空字符串,在大多数语言中,编译器都会将其翻译成空字符串。 下面的代码片段是一个不寻常的两行 quine 的示例。yWg物理好资源网(原物理ok网)

s = ’s = %rnprint(s%%s)’ 
print(s%s)
yWg物理好资源网(原物理ok网)

尽管自我复制早已在许多自动机中得到研究,但在神经网络的研究中显然有所欠缺,尽管神经网络是迄今为止已知的最强大的人工智能方法。yWg物理好资源网(原物理ok网)

本文确定并尝试解决构建和训练自我复制神经网络的挑战。 具体来说,研究人员建议将神经网络视为由张量运算序列组成的可微分计算机程序。 研究目标是建立一个输出自己权重的神经网络quine。yWg物理好资源网(原物理ok网)

研究人员使用三种不同的方法测试了论文中提出的方案:基于梯度的优化、非基于梯度的优化和一种称为 () 的新方法。 研究人员更进一步,设计了一种神经网络 quine,它不仅可以进行自我复制,而且还有一个辅助目标。 本文选择的辅助任务是 MNIST 图像分类 (LeCun &, 1998),它涉及对 0 到 9 的数字图像进行分类,通常用作机器学习的“”示例。yWg物理好资源网(原物理ok网)

研究人员观察到网络自我复制能力与其解决辅助任务能力之间的权衡。 这类似于在自然界中观察到的畜牧业和其他辅助生存任务之间的平衡。 这两个目标通常是一致的,并且性激素,例如当昆虫饥饿时,通常会上调以牺牲进食为代价来优化生存。 反之亦然:例如,雌性棕色捕鱼蛛的交配行为会导致血糖突然发生不可逆转的变化,使其难以交流并容易被雄性蜘蛛吞噬(Drake,2013 年)。yWg物理好资源网(原物理ok网)

创建网络yWg物理好资源网(原物理ok网)

神经网络如何引用自身?yWg物理好资源网(原物理ok网)

直接引用()问题:神经网络由一组参数 Θ 参数化复制物理网络连接状态,研究人员的目标是构建一个输出为 Θ 本身的网络,这很难直接做到。 假设卷积网络的最后一层有 A 输入和 B 输出。 线性变换中权重矩阵的大小是AB的乘积,当A>1时AB小于B。yWg物理好资源网(原物理ok网)

研究人员还研究了两种流行图像生成模型的开源实现:DCGAN(等人,2016 年)和 DRAW(等人,2015 年)。 两者分别使用 1200 万 Knorr 和 100 万参数生成 784 像素的 MNIST 图像。yWg物理好资源网(原物理ok网)

一般来说,参数集 Θ 远大于输出的大小。 为了避免这种情况,我们需要一种间接的方式来引用 Θ。yWg物理好资源网(原物理ok网)

(): (etal., 2009) 是一种神经进化方法,通过用坐标和权重识别每个拓扑连接来描述神经网络。 研究人员在构建 quine 时采用了相同的策略。 研究人员并没有让quine直接输出自己的权重,而是让它输入一个坐标(采用one-hot编码方式),输出坐标的权重。yWg物理好资源网(原物理ok网)

这克服了 Θ 小于输出的问题,因为我们只为每个坐标 c 输出标量 Θ_c。yWg物理好资源网(原物理ok网)

奎因yWg物理好资源网(原物理ok网)

研究人员将 quine 定义为一种卷积神经网络,其唯一的工作就是输出自己的权重。yWg物理好资源网(原物理ok网)

图 1:quine 的结构yWg物理好资源网(原物理ok网)

假设权重个数为A,第一个隐藏层的单元个数为B,则投影矩阵的大小为AB的乘积,当B>1时小于A。 出于这个原因,由于单热表示,我们不能使投影本身成为网络的参数。 因此,研究人员决定使用固定的随机投影将坐标的 one-hot 编码与隐藏层连接起来。 所有其他连接,即隐藏层之间的连接和最后一个隐藏层与输出层之间的连接,都是神经网络的可变参数。yWg物理好资源网(原物理ok网)

Von 认为一个非平凡的自我复制器必须包含三个组件,它们本身不足以成为一个自我复制器:(1)复制器的描述,(2)可以克隆描述的复制机制,( 3) 一个复制器复制物理网络连接状态,它可以复制嵌入复制器本身的机制 (Von & Burks, 1966)。 在这些情况下,将每个比特权重分配给one-hot空间中的一个点的坐标系对应于(1); 神经网络估计的函数对应于(2); 固定随机投影对应于(3)。 研究人员选择 (1)、(2) 和 (3) 的原因解释如下,请记住,选择这些选项的替代方案将是未来研究的有趣方向。yWg物理好资源网(原物理ok网)

kad 网络 状态 连接断开_复制物理网络连接状态_最复杂的物理公式复制yWg物理好资源网(原物理ok网)

图 2:没有 one-hot 编码的 quine 的权重和权重预测对数归一化图示yWg物理好资源网(原物理ok网)

辅助奎因yWg物理好资源网(原物理ok网)

研究人员将辅助奎因(quine)定义为一种不仅能自我繁殖,还能解决一些辅助任务的奎因。 它负责接收辅助输入和返回辅助输出。yWg物理好资源网(原物理ok网)

图3:辅助quine的结构yWg物理好资源网(原物理ok网)

在本文中,选择图像分类作为辅助任务。 MNIST 数据集 (LeCun &, 1998) 包含从 0 到 9 的手写数字的完美圆形图像(28×28 像素)。该图像将用作辅助输入。 可以包括从辅助输入到网络的链接作为参数而不是随机投影,但本文仅报告前者的结果。yWg物理好资源网(原物理ok网)

辅助输出是十个类别的概率分布,其中概率最大的类别将被选为预测类别。 使用 60,000 张图像进行训练,使用 10,000 张图像进行测试; 不需要验证集,因为本研究不尝试严格优化分类器的性能。 本研究的主要目的是演示神经网络 quine 的概念,因此 MNIST 是一个合适的辅助任务(这被认为是现代机器学习算法中的一个简单问题)。yWg物理好资源网(原物理ok网)

论文:蒯因yWg物理好资源网(原物理ok网)

论文链接:yWg物理好资源网(原物理ok网)

摘要:自我复制是生物生命的一个重要方面,但在人工智能系统中却被很大程度上忽略了。 本文介绍了如何改进和训练自我复制神经网络。 网络通过学习输出自己的权重来复制自己。 该网络使用可以以基于梯度或非梯度的方式进行优化的损失函数。 我们还描述了一种称为 () 的方法,它通过向网络注入对其自身参数的预测来训练网络,而无需进行显式优化。 通过在再生和优化步骤之间交替发现自我复制网络的最佳解决方案。 最后,我们介绍了一种自我复制的神经网络设计,可以解决 MNIST 图像分类等辅助任务。 我们观察到网络的图像分类能力与其复制能力之间的权衡,但训练往往会以复制为代价降低其在图像分类方面的专业知识。 这类似于在自然界中观察到的畜牧业和其他任务之间的平衡。 我们觉得人工智能的自我复制机制是有用的,因为它带来了通过自然选择不断改进的可能性。yWg物理好资源网(原物理ok网)

发表评论

统计代码放这里