NAT NANOTECHNOL丨将DNA存储在热响应微胶囊中用于重复随机多路复用数据访问
大家好,今天分享的是2023年发表在Nature nanotechnology上的题为“DNA storage in thermoresponsive microcapsules for repeated random multiplexed data access”的文献,通讯作者是来自Eindhoven University of Technology的Tom F.A. de Greef教授,课题组的工作方向是从特征明确的生物成分中自下而上地构建基本细胞功能,并开发新型生物计算元件以增强自然细胞和合成细胞的信号处理能力。
研究背景:
DNA已经成为有吸引力的数据储存介质,基于聚合酶链反应(PCR)的随机存取策略已经被开发用于选择性地从复杂的DNA文件池中检索编码数据。然而,PCR有两个缺点:①在数据扩增和DNA扭曲序列表示的重复复制过程中,不可挽回地消耗了一小部分数据库;②利用PCR对DNA编码文件进行多路检索受到PCR偏差和分子串扰形成伪影的阻碍。
尽管乳液PCR可以在单个微反应器中实现并行扩增并防止伪影形成,但复杂的流程、不可重复性、大量有机溶剂的使用等限制了该技术的大规模应用。基于以上背景,作者开发了一种“热限制PCR”的方法,利用具有温度依赖渗透性膜的蛋白体作为微反应器,来增强PCR扩增的保真度,从而利用多重、重复的PCR访问复杂DNA库中多个DNA文件。
具体方案如下:
制备了基于PNIPAm(牛血清白蛋白/聚(N-异丙基丙烯酰胺)缀合物)的具有热敏膜的蛋白体,用于封装Tamavidin2-HOT(耐高温亲和素)和磁性颗粒。将DNA文件用生物素标记,生物素与Tamavidin2-HOT相互作用,使DNA文件稳定地定位在蛋白体内。利用这种策略,可以将不同的DNA编码文件定位在不同的蛋白体内,以创建多个不同的本地化文件。由于蛋白体之间不交换文件,因此,多个文件可以合并到一个库中,该文库可以使用多重PCR进行扩增,不会发生分子串扰。在PCR后,可以使用磁力分离进行回收。此外,结合荧光分选,能够将带有不同荧光条形码的文库分选为单独的群体。
图1 蛋白体作为DNA数据存储平台
热稳定性和温度响应性DNA本地化
首先,将制备的含有热稳定的Tamavidin2-HOT蛋白体与dsDNA一起孵育,使Cy5标记且生物素化的dsDNA定位在蛋白体内。共聚焦图像显示,加热至95°C后,只有用Tamavidin2-HOT制备的蛋白体保留了内化的dsDNA(图2a)。由于PNIPAm在其较低临界溶液温度(LCST,~32 °C)之上会变得部分不混溶,作者推断,将膜渗透性降低至LCST以上,捕获的DNA文件在PCR的处理过程中产生的DNA分子可以被保留(图2b)。因此,作者研究了含有Tamavidin2-HOT蛋白体在室温下对未生物素化且Alexa546标记的ssDNA的渗透性,结果表明ssDNA很容易跨膜扩散,清洗捕获ssDNA的蛋白体会导致荧光快速消失,证实了蛋白体膜在室温下对ssDNA具有高渗透性(图2c)。此外,利用含有生物素化的ssDNA(与另一Alexa546标记的ssDNA部分互补)和Tamavidin2-HOT的蛋白体,将蛋白体加热至95 °C,共焦成像实验表明局部荧光随着时间的推移仅缓慢减少(图2d)。
图2 温度依赖性的DNA定位
蛋白体本地化DNA的酶促扩增
为了验证含有Tamavidin2-HOT的蛋白体对于DNA数据检索的普适性,作者展示了使用PCR或SDA扩增的本地生物素化DNA(图3a)。使用含有Tamavidin2-HOT的蛋白体,分别与生物素化模板dsDNA,或未生物素化对照dsDNA孵育,随后清洗去除游离模板。然后,添加了含有聚合酶、脱氧核苷三磷酸(dNTP)、引物、dsDNA敏感荧光染料的PCR反应液。当使用生物素化的双链DNA而不是非生物素化的双链DNA时,平均需要减少4.4个循环才能达到荧光阈值(图3b)。实验结果证明当dsDNA被生物素化时,与背景水平相比,可用于扩增的dsDNA增加约21倍,这表明蛋白体定位的dsDNA可用于PCR扩增。
随后,作者使用SDA等温扩增本地化dsDNA。同样地,使用含有Tamavidin2-HOT的蛋白体,分别与生物素化模板dsDNA或未生物素化模板一起孵育,洗涤后添加PCR反应液。实验结果显示,实验组的SDA平均扩增率比与对照组高8.6倍(图3c)。PCR和SDA的结果均表明,由Tamavidin2-HOT本地化的生物素化dsDNA可以在蛋白体内扩增。
图3 位于蛋白体内的DNA的酶促扩增
热限制多重PCR改善分子串扰
为了探究蛋白体内模板的热限制多重PCR如何影响嵌合体的形成,作者设计了两套生物素化dsDNA模板,两者含有一段相同互补区域,在多重PCR期间产生串扰时会生成嵌合体C1C2(图4a)。对蛋白体群体进行混合并扩增,在室温下回收扩增产物,并在溶液中扩增作为对照。凝胶电泳结果显示(图4b)在溶液反应中形成了较多的嵌合产物。基于蛋白体的热限制多重PCR产生的嵌合体比对照组低得多(可能是由于本地化DNA的不完全去除或扩增子从蛋白体中的有限释放所致)。利用目标条带强度作为内参,计算每个反应的嵌合体与产物的比率(图4c)。结果表明,蛋白体中的热限制多重PCR通过将DNA扩增定位到各个区室,显著减少了嵌合体的形成。
图4 局部扩增减少PCR过程中的分子串扰
本地DNA文件的多重和重复PCR
将DNA文件定位于Tamavidin2-HOT蛋白体群体中,由25个种群汇集在一起创建了一个基于蛋白体的文库。然后,分别在溶液、油包水乳液滴、蛋白体群体组成的分隔介质中使用多重PCR扩增文件。多重PCR后,使用qPCR定量相对文件浓度,以确定每个文件的比例。数据显示,基于蛋白体的热限制PCR和乳液PCR比溶液扩增更有效地保存了文件的分布。随后,进行Illumina测序(图5a)来确定每个文件的平均覆盖率,将每个文件的平均覆盖率归一化为平均值,在对数尺度上绘制以显示几个数量级的覆盖率偏差(图5b)。与预期一致,在溶液条件下扩增的最多和最少代表性文件之间的覆盖率存在60倍的巨大差异,而基于蛋白体和乳液PCR的差异要小得多,分别为7倍和5倍。
由于生物素化DNA仍然位于Tamavidin2-HOT蛋白体内部,因此作者预计,在PCR后使用磁力分离来恢复蛋白体及其封装的DNA编码文件,能够可靠地重复获取DNA编码数据。为了验证这一猜想,将三个文件定位在含有Tamavidin2-HOT的蛋白体内。在合并之前清洗蛋白体以创建基于蛋白体的文库,文件在连续三轮批量、乳液或蛋白体PCR中进行扩增,每轮检索不同的文件。三轮之后,再次访问初始文件。使用Illumina测序来确定文件中的序列丢失(图5c)。结果显示,基于蛋白体的PCR产生的序列丢失最低(图5d)。
图5 多重PCR重复访问蛋白体内的DNA编码文件
基于荧光的蛋白体定位DNA文件检索
为了设计从DNA编码的蛋白体文库中选择性检索文件的方法,作者制定了一种对蛋白体群体进行荧光条形码编码的策略,该策略基于(1)用异硫氰酸荧光素(FITC)和DyLight405标记蛋白体膜,(2)初始数据编码DNA文件定位在蛋白体内部后,将短的生物素化的Cy3或Cy5标记的ssDNA加入(图6a)。将各个群体汇集,并使用荧光激活细胞分选通过三步选择程序从池中选择特定文件(图6b)。首先,FITC和DyLight405膜标记用作荧光门,由于荧光团的存在或不存在会在两个通道中产生明显的双峰分布,然后,建立Cy3和Cy5荧光门来区分局部亚群(图6c)。因此,根据其不同的荧光特征,合并的蛋白体被分为四个不同的群体:(1)高DyLight405/高Cy5;(2)高DyLight405/高Cy3;(3)高FITC/高Cy3;(4)高FITC/高Cy5。将数据池分类为单独的群体后,使用qPCR确定分离群体中每个文件的分数,以确认检索的正确性(图6d)。目标文件平均占已分类样本中所有DNA的75.0 %(非目标文件平均各占8.4 %),以上结果表明,蛋白体不仅能实现基于PCR的随机访问,基于荧光的蛋白体元数据检索也是可能的。
图6 用于选择性文件检索的蛋白体荧光辅助分选
总结
本文开发了一种基于热响应、半透性微区室的PCR方法,该方法能够实现基于多重PCR的随机DNA文件访问,其性能与乳液PCR相当。结合荧光条形码,成功实现了基于蛋白体的文件分类。本方法为重复、并行随机访问极其密集的DNA文件库提供了一种基于蛋白体的“热限制PCR”途径。