日前,西南学院毫米波国家重点实验室、东南学院电磁空间研究院、琶洲实验室智能超材料研究中心崔铁军教授团队联合成都学院李廉林院士,使用多层透射式数字编码超表面重构了可实时调节的全衍射式神经网路(可编程人工智能机,PAIM),成功实现了网路参数的实时编程和光速估算特点,并展示了多种应用案例,包括图象辨识、强化学习和通讯多通道编解码等,在国际上首次实现和展示了微波空间全衍射式可调神经网路。相关工作以Adeepbasedona-array为题发表在上[1]。西南学院博士生刘彻和马骞(现为至善博后)为共同第一作者,崔铁军教授为通信作者。
研究背景
目前,人工智能的实现主要依赖两种技术,一是基于计算机的机器学习算法(比如深度学习[2]、极限学习[3]和加强学习[4]等),二是专用集成电路和特制的光估算芯片[5]。一个典型的人工智能神经网路(,ANN)的实现,通常使用层级联接的人工神经元来模拟人脑神经元之间的联接和行为。通过大量数据的训练,ANN已能完成诸多的智能任务,且在人脸辨识、自动驾驶、语音处理和医疗确诊等方面获得了大量应用。不仅基于计算机和芯片实现的ANN网路,全光实现的ANN近来也被多个团队所提出[6,7]。这种光学衍射神经网路借助光的矢量叠加性和空间自由传播特点可实现并行的矩阵运算操作,借此来模拟人工神经元之间的交互和联接。同时,使用光学透镜或反射介质模拟人工神经元对讯号的调制作用,最终构造出具有光速并行估算和低帧率特点的ANN硬件。
目前,即使光学衍射神经网路得以实现,但大都具有功能固化、不可调节、不支持参数更改、使用成本高等缺点,严重阻碍了其功能扩充。在未来的实际应用中,为了提升集成度和通用性,衍射神经网路必然会朝着多功能集成和可编程方向发展,因而可编程的衍射神经网路渐渐成为该领域的研究热点。近些年来,现场可编程信息超表面的盛行[8]为实现可编程的衍射神经网路提供了良好抓手。崔铁军教授和李廉林院士团队借助常年以来在现场可编程信息超表面的理论和技术底蕴量子通讯阵列,率先使用多层透射式数字编码超表面实现了现场可编程的微波驱动的衍射神经网路硬件,称之为可编程人工智能机(PAIM)。
创新研究
研究团队使用五层透射式的可编程超表面阵列来层级调控电磁波的空间传播和交互特点(如图1所示),其中每层超表面阵列都有8×8个单元,每位单元都可以看成人工神经网路(ANN)中的一个神经元节点,整个PAIM可看成是一个ANN的数学实现。每位超表面单元能在-22dB到13dB的范围内调控透射电磁波的幅度,同时改变和幅度耦合的相位。
图1可编程人工智能机的工作原理
当入射电磁波照射到一个可编码超表面单元时量子通讯阵列,电磁波的幅度和相位会被该超表面单元调控,调控的系数由FPGA预先加载到单元上(图1c)。这个被调控后的电磁波在穿过此单元后,会变为一个新的电磁波幅射源向各个方向幅射电磁波。这样,第一层超表面的每位单元就会向第二层超表面幅射电磁波并进行矢量叠加(图1b)。叠加后的电磁波就作为第二层每位超表面单元的入射电磁波,经过调制后继续以同样的方法向第三层超表面传播,最终传输至第五层超表面。最后将第五层超表面的输出作为整个PAIM最终的输出。整个前向过程可以看成是借助透射超表面阵列逐层调控电磁波在自由空间传播过程中的能量分布的过程。
研究团队为PAIM订制了相关的驱动模块、FPGA控制电路模块和用户交互界面,同时开发了针对PAIM参数训练的离散优化算法、强化学习算法和偏差校正算法,增强了PAIM的估算精度和可用性。基于PAIM的硬件系统构架,研究团队展示了多种应用案例,包括图象辨识、强化学习和通讯中多路用户的同时编解码。
在图象辨识案例中,PAIM的第一层超表面作为图象输入层,按照输入图象的象素分布调制每位单元的增益系数,当平面电磁波穿过第一层超表面后才会携带输入图象的信息传输到后续的四层超表面。PAIM的后四层被训练为图象辨识器,最终输出的电磁场能量分布会反映出图象被预测为哪一类的机率,并被接收天线所接收、识别。基于10类手写数字图象辨识的仿真验证案例显示了PAIM可以达到90%以上的辨识正确率,同时PAIM在简单纹样辨识的实测案例中取得了100%的辨识正确率(图2)。
图2基于PAIM的简单纹样辨识实测结果
在加强学习实测案例中,通过与电磁环境的不断交互和自我学习,PAIM将随机分布的入射电磁波能量聚焦到预定的一个(图3b)或两个(图3c)目标点上。加强学习是一种结果导向的算法,可直接基于实测结果进行优化,由此可以甩掉仿真精度和其他偏差对优化结果的影响,这是加强学习的优势。此加强学习案例展示了PAIM奇特的现场可编程和电磁环境实时感知特点,这是之前固化衍射神经网路所不具备的。
图3基于PAIM的加强学习案例示意图
在通讯编解码案例中,研究团队演示了基于PAIM的实时编解码和去噪功能,可在同一信道中同时传输东路用户讯号。研究团队使用PAIM传输了西南学院毫米波国家重点实验室的标志纹样(图4a),为了推动传输速度使用不同用户通道传输图象的不同部份,由此致使传输速率提升为原先的四倍。在噪音环境中的实验测试结果表明,PAIM同时实现了去噪和编解码功能。和传统的CDMA通讯构架相比,PAIM直接在电磁波的模拟域进行讯号的编解码和去噪操作,因而可极大地降低通讯串扰。同时得益于PAIM强悍的空间电磁波处理能力,能挺好地处理和分解空分讯号,致使在同一信道中可同时传输多路讯号,极大地增强了信道容量。
图4基于PAIM的通讯编解码和去噪实测案例
事实上,因为频谱资源的日渐枯竭,空分多址技术得到了越来越多的关注并早已成为第五代和第六代无线通讯的关键技术之一。PAIM可单独作为解码器放在通讯的接收端,同时接收多个通讯基站和其他发射端所发射的讯号,并对其进行实时预处理。据悉,PAIM除了可接收传统发射天线所发射的讯号,能够接收由反射式超表面所发射的具有丰富空间能量分布的电磁波讯号。通过加载预先设置的单元参数,PAIM可解码不同发射端发射的讯号,并将其能量传递到对应的接收天线口面上。
研究团队介绍