韩 达 课 题 组

韩 达 课 题 组

NAT COMMUN丨可快速永久擦除的基于亚稳态杂交DNA信息存储技术

作者:张铭芷

数字技术的日益使用对现有存储功能提出了挑战,由于当前所使用的磁或光存储技术可能仅支持一个世纪或更短的时间,对信息存储的可靠性和长期解决方案的需求得到进一步提高。

由于DNA合成和测序技术的进步,DNA作为信息存储介质的潜力正在迅速增长。一种广泛的共识认为,DNA是一种紧凑,长期有效的信息存储介质,其理想特性包括其长期信息存储和恢复的能力,具有以小型化方式隐藏数据的能力,以及在需要时可通过自我传播进行转移的能力。将基于DNA的信息存储用于重要信息(例如法院记录)时,经常被提及的优势便是其较长的半衰期。

然而,对于高度重要且高度机密的信息(例如个人基因组信息或军事武器设计等)方面,DNA的高耐久性在存在需要擦除的情况上有重大挑战。此前,破坏DNA的常规方法包括用紫外线照射,使用酶如DNA水解酶I,施加超过200℃的高温或使用漂白剂。这些DNA的破坏方法做法不尽相同,但均耗时长且需要专门的装置设备。

近日发表在Nature Communication上的Metastable hybridization-based DNA information storage to allow rapid and permanent erasure报道了一种可便捷快速永久擦除信息的技术。作者将信息编码为真实信息和噪声信息的寡核苷酸混合物,真实信息和噪声信息分别通过与“真实标记”和“噪声标记”的寡核苷酸的杂交区分。在正常情况下,真实信息可被扩增读取;但在短暂的高温(95℃,5min)下,真实标记和噪声标记与真实信息和噪声信息的结合有效地随机化,使得原始储存数据无法被有效读出,即永久擦除了该消息。

 

图1 快速永久擦除信息技术示意图

对于信息储存载体来说,最重要的是写入和读取的高保真以及存储的稳定性。该工作中作者选择的信息为8幅经典艺术作品的低分辨率图片,采用像素点的方式对图像进行编码:首先将计算机存储的一个字节的八进制ASCII码对应碱基映射转码表进行转码,从而得到一个字节对应五个不同的碱基序列。将每一条信息链映射为一个2×2像素的块,其中含有真实/噪声标记的区域(B),像素块的位置信息(A),每一个像素的红色、绿色、蓝色的灰度信息(M)和引物结合区段(L)全长共120碱基的核苷酸序列。由此完成对8幅艺术作品图像的碱基编码。

 

图2 图像编码方式示意图

作者通过分别制备真实信息和真实标记的杂交链、噪声信息和噪声标记的杂交链并将它们混合制备成最终的信息储存池。在低温情况下,由于噪声标记3’端存在硫代修饰而不能被延伸;真实标记在37℃温度下延伸,而后通过外加特异的引物施行信号放大可以通过测序(NGS)的方法快速读取储存的信息。

 

图3 储存池制备及读取方式示意图

对于储存稳定,作者展示了8个独立的位图图像在25°C下存放65天后稳定编码并读取,平均正确召回率超过99%,在25°C下可推断出超过15年的半衰期。由此可见,该技术展示了信息储存的高保真和较好的储存稳定性。

在该工作最终着眼于解决快速永久擦除技术,作者亦给出了有效擦除的有力证据。噪声信息的核苷酸链为由真实信息随机突变后的假信息,对于同一像素块位置存在一种真实信息以及多种噪声信息。因噪声消息并不保持一致可被计算机或人为区分剔除,而读出为50%以上才被接收为真实信息,故在不含有真实标记或噪声标记的情况下无法通过统计学数据区分真实信息和噪声信息。即信息将被永久擦除,无论通过何种方法都无法被读取。

 

图4 不同擦除条件及每个删除图像的最佳匹配像素分布

若保持延伸和信号放大所施行的PCR都在较低温度(如37℃)下执行,理论上可通过不断加入真实标记来反复读取所储存的信息,但对信号放大部分的PCR效率会明显降低。原文所执行的方法为标准PCR规程,此间执行的95℃变性可能会导致部分的噪声标记与真实信息杂交,影响再次加入真实标记与真实信息杂交,从而不能有效读取信息。依照原文所述,对储存池进行95℃,5min的变性可使标记随机杂交,从而无法读取原有信息。在此描述下意味着不存在第一次信息的读取,即这种方式是一次性选择读取信息或擦除信息。此外,这种技术难以实现信息擦除后的再次写入,这对于通用性的存储而言也存在一定的局限性。

总而言之,该工作展示的快速永久擦除信息的技术提供了一种安全性更高、更便捷的擦除思路;同时这种通过标记进行真实信息、噪声读取的方式对可重复利用的储存系统有一定的借鉴意义。

Kim, J., Bae, J.H., Baym, M. et al. Metastable hybridization-based DNA information storage to allow rapid and permanent erasure. Nat Commun 11, 5008 (2020). https://doi.org/10.1038/s41467-020-18842-6

2020年11月13日 20:23
浏览量:0
收藏