韩 达 课 题 组

韩 达 课 题 组

Nature Machine Intelligence丨基于DNA调控电路的分子卷积神经网络

大家好,今天分享一篇2022年7月发表在Nature Machine Intelligence上的一篇题为《Molecular convolutional neural networks with DNA regulatory circuits》的文章。本文的通讯作者是华东师范大学化学与分子工程学院裴昊教授。

卷积神经网络是当前计算机视觉识别领域的主流算法,擅长处理图像尤其是大图像的相关分类问题。卷积神经网络是指将图像交给人工神经网络之前对其进行卷积操作,而卷积操作的本质就是处理一个像素点及其周围像素点之间的关系。这个过程我们可以理解为我们使用一个过滤器(卷积核)来过滤图像的各个小区域,从而得到这些小区域的特征值。在具体应用中,往往有多个卷积核,可以认为,每个卷积核代表了一种图像模式,如果某个图像块与此卷积核卷积出的值大,则认为此图像块十分接近于此卷积核。典型的卷积网络由输入层、卷积层、ReLU层、输出层组成。在输入层中,二维图像由一组单链DNA分子编码。卷积运算中则利用了一组以茎环结构为基础的DNA开关门,加权和和ReLU函数的运算则分别采用了DNA加法门和DNA减法门。

DNA调控电路系统实现分子卷积神经网络

在卷积运算中,权重的大小可以通过调节DNA开关门(NWt,Ii,j )的浓度来实现。DNA开关门在关闭状态时输入链(Xi )无法它发生链置换反应,而当加入权重调节分子(MWt )后,DNA开关门被打开, Xi 得以与NWt,Ii,j发生链置换反应。由于体系中XiMWt的浓度是过量的,因此输出信号的浓度由DNA开关门(NWt,Ii,j )的浓度来决定。所有正权重的输出链会与加法门反应生成Ssj,k Ssj,k Ddk,Yi 反应后生成Dsk,Yi ,而所有负权重的输出链通过与加法门发生链置换反应生成Ssi,n Ssi,nSubn,Yi反应后生成Subi,Yi*。生成的Dsk,YiSubi,Yi*进一步发生链置换反应后,多余的Dsk,Yi则会保留下来成为下一层的输入,通过以上反应步骤可以实现加权求和以及ReLU函数的运算。

用DNA调控电路系统实现乘法、加法、减法的运算

作者接下来用一个2x1的卷积核对一个2x2的输入图像进行卷积运算。当卷积核在图像上每移动一次就会做一次卷积运算,产生一个输出结果。对于一个2x2的输入图像而言,2x1的卷积核会产生2个输出(y1 y2),实验结果表明该2x1的卷积核的卷积运算的结果和理论值基本吻合。

2x1的卷积核在2x2的输入图像上的分子卷积运算

作者接下来尝试构建一个能识别两个手写甲骨文符号(“土”和“火”)的分子卷积神经网络。初始训练集包含了来自Sinica oracle 数据库的48000个手写字符图案,作者对这些图像进行预处理后都转换为了12x12的二进制图案,以此训练集蓄念出来的训练出来的卷积神经网络准确率高达97%。该模型包含一个6x6的卷积核,当以6的步长图像上进行卷积运算则会产生一个2x2的特征图,根据该特征图池化后的输出结果即可以判断输入图像是“土”还是“火”。结果显示该分子卷积神经网络可以准确识别输入图像的类型,当图像进行一点程度的旋转后该网络依然有较好的准确性。

分子卷积神经网络用于两个甲骨文符号识别

作者接下来尝试利用分子卷积神经网络用于32种手写字符(8个阿拉伯数字,8个英文字母,8个希腊字符,8个甲骨文汉字)的分类问题。每个图案会进行两次运算,第一层运算用于粗略分类,注明了该图案所属类型,而用于精细分层的第二层则用于识别具体是哪一种图案。结果表明,该分子卷积神经网络可以同时并行进行8个卷积核的卷积运算,能够准确分类这36种手写字符图案。

层级分子卷积神经网络用于32种图案的识别

鉴于分子神经网络运算速度极慢的问题,作者接下来尝试利用反复冻融的过程来提高分子卷积神经网络的运算速度。反复冻融可以使得反应体系更利于达到热力学平衡从而加快反应速度,实验结果表明,原本需要36个小时的分类任务在5次冻融循环中就可以快速地达到到理想的分类效果(半小时以内)。

反复冻融用于加速分子卷积神经网络的运算

总结:作者利用DNA分子计算体系成功开发了一种性能强大的分子卷积神经网络,该体系能够并行进行分子卷积预算,能够识别8个类型中的32种手写字符图案,并且DNA分子计算体系的运算速度通过反复冻融的方式得到了大幅度提高,通过5个冻融循环就可以在半小时内实现快速准确的图像分类。

2022年8月22日 21:21
浏览量:0
收藏