韩 达 课 题 组

韩 达 课 题 组

NAT NANOTECHNOL丨利用工程化纳米孔鉴定单磷酸核苷及其表观遗传修饰

今天分享的文献是7月发表在nature nanotechnology上的利用工程化纳米孔鉴定单磷酸核苷及其表观遗传修饰。

背景介绍:

纳米孔测序的概念最早出现于20世纪80年代,其核心组分主要包括纳米孔蛋白和相关马达蛋白。第一个用于纳米孔测序的纳米孔蛋白是α-溶血素,其内径为1.4 nm -2.4 nm,可区分寡核苷酸分子上的四个DNA碱基,是生物纳米孔单分子检测的标志。此后发展了另一种具有相似通道直径(~1.2 nm)的工程纳米孔耻垢分枝杆菌膜蛋白A(MspA),也获得了类似的结果且提高了DNA单碱基的检测灵敏度。2012年,有研究小组通过将马达蛋白(phi29 DNA聚合酶)和纳米孔(α-溶血素和MspA)相结合,通过电流变化,将单链DNA分子解析为来自单个核苷酸的信号。同时,马达蛋白的加入减缓了DNA在纳米孔中的迁移速度,提高了信噪比,可捕获更准确的序列信息。此后研究人员不断改进纳米孔和马达蛋白。

作者介绍:

通讯作者黄硕教授,其课题组组隶属于南京大学化学化工学院生命分析化学国家重点实验室、南京大学化学和生物医药创新研究院,主要研究方向为单分子生物传感器件和单分子生物物理,课题组具体研究方向为纳米孔测序、单分子化学、生物大分子结构解析和纳米孔成像,他们提出了一种新型且通用的纳米孔测序方法即错位测序方法(Nanopore-Induced Phase-Shift Sequencing,NIPSS)。实现了非天然核酸、miRNA和多肽的直接测序。并且以光替代电,通过检测荧光标记扩散驱动的过孔钙离子流,开创了首个无需电极的纳米孔单分子分析技术(DiffusiOptoPhysiology,DOP)。在单分子化学方向,首次通过改造内腔结构更加锥形的MspA纳米孔实现了纳米孔单分子化学检测性质的大幅优化,提出了采用MspA纳米孔单分子反应器的新方向,这也是本篇文章研究的方向。

结果介绍:

   1、使用PBA修饰的MspA识别NMP

本研究通过分别定制合成了两个基因同时插入共表达载体,构建了异八聚体MspA,只有一个单体在孔收缩处具有唯一的的半胱氨酸,通过3-(马来酰亚胺)苯基硼酸(MPBA)与八聚体中半胱氨酸反应使苯硼酸(PBA)结合上去。通过单通道记录,在单分子水平上对该反应进行了实时观察(图1c)。单磷酸核苷NMPs由核糖、磷酸基团和核基组成,是RNA的单体单位。由于核糖中存在顺式二醇结合,NMPs与PBA具有亲和力,可能直接被MspA-PBA结合检测。继续施加+200 mV的跨膜电位。以腺嘌呤单核苷酸(AMP)、鸟嘌呤单核苷酸(GMP)、胞嘧啶单核苷酸(CMP)和尿嘧啶单核苷酸(UMP)四种典型的NMP为分析物(图1d)。可以观察到由NMPs引起的连续电阻脉冲(图1d)。利用MspA-PBA对CMP、UMP、AMP和GMP进行了同时传感(图1f),根据不同的阻塞特性可以直接鉴定不同的NMP。

    2、区分表观遗传NMP

RNA中已经发现了超过170种表观遗传学修饰。这些表观遗传NMPs具有极其微小的结构差异,对直接鉴定提出了极大的挑战。这里测试了7种主要的表观遗传NMPs, 涵盖了甲基化、脱氨、异构化和还原等修饰类型。碱基组成所示。不同的表观遗传修饰的NMPs具有明显不同的阻断幅度。在小提琴图中显示了每个NMP的阻塞水平分布,说明几乎所有的NMP都已经完全可以通过分析其阻塞水平来区分,尽管UMP和m5C的事件分布仍然存在一定的重叠(图2b)。通过绘制包含11个不同分析物NMP的阻塞水平与噪声幅度的散点图,生成11个完全独立的事件群(图2c)。这证实了这种检测模式可以应用于表观遗传NMPs。以前从未报道过利用纳米孔同时直接区分如此多的核苷酸修饰。 

   3、通过机器学习识别NMP

如背景中介绍的测序仪记录DNA分子过孔过程中产生的电流信号,还需要算法软件再将这一特异性的电信号序列翻译为核苷酸序列。本研究建立了一种机器学习算法来自动识别NMPs。整个训练过程包括数据集输入、特征提取和模型建立(图3a)。利用MATLAB自动提取每个事件的阻塞水平(%Ib)和噪声幅度(SD),形成特征矩阵。对主流模型进行了评估,朴素贝叶斯模型和线性支持向量机(SVM)模型的最高准确率都为0.996。综合考虑测试集精度,线性SVM模型表现最优。基于线性SVM模型测试集的混淆矩阵结果如图3b所示,其中大部分NMP检测结果的准确率为99%或100%。图3c中展示了线性SVM模型生成的决策边界图。为了从混合物中显示事件标识,图3d展示了包含来自11个不同NMP的事件的代表性电流曲线。

   4、实际操作验证

进一步试图对miRNA中表观遗传NMP进行直接检测。通过S1核酸酶处理,RNA首先被酶分解成NMP,然后被MspA-PBA传感。使用先前训练的机器学习模型识别。应用了两种已知甲基化位点的microRNA,包括hsa-miR-21(位置9处含有m5C)和hsa-miR-17(位置13处含有m6C)。在纳米孔检测中,将hsa-miR-21酶切产物加入cis中,终浓度为100 ng μl-1。使用机器学习算法对事件进行识别,所获得的NMP组成与序列完全一致。为了检验其通用性,hsa-miR-17也has进行了相同的检验。分别对应CMP、UMP、AMP、GMP和m6A (图4e),与hsa-miR-17的序列组成一致。定量分析显示,m6A位点个数为1.08,表明hsa-miR-17中仅存在1个m6A位点,也与预期相符。

   

成熟的tRNA包含丰富的化学修饰。使用啤酒酵母苯丙氨酸特异性 tRNA(酵母tRNAPhe)被用作模型RNA以测试其可行性。据报道,成熟酵母tRNAPhe含有14个表观遗传修饰位点,来自11种修饰类型。MspA-PBA原则上可检测到m2G,m22G、T和Y的单磷酸酯。但是,由于缺乏相应的纯化合物来产生用于训练的事件,相应的纳米孔事件是可检测的但无法识别的。缺少顺式二元醇结构的Cm和Gm原则上是MspA-PBA无法检测的。D、ψ、m5C、m7G和m1A的事件参数已事先获取并用于模型训练,以便通过机器学习算法识别它们的事件。tRNAPhe首先在23°C下用S1核酸酶处理15 h,得到NMPs,并用于后续的纳米孔检测。酵母tRNAPhe的修饰图谱结果如图5c所示。成功检测出D、ψ、m5C、m7G和m1A,与前期训练结果和文献报道一致。定量分析表明,酵母tRNAPhe中NMP相对组成与实际值相符(图5d)。上述结果很好的验证了MspA-PBA从天然RNA中检测NMPs及其表观遗传修饰的能力。     

总结:

本研究通过含有一个PBA的异八聚体MspA(耻垢分枝杆菌膜蛋白A)实现传感十一种类型的NMP,效果远优于α-HL或固态纳米孔。并构建了机器学习算法,报告了0.996的准确性。与质谱相比,提供了更高的分辨率,特别是在区分RNA异构体方面。适用于混合和天然样品的RNA修饰检测,无需耦合任何色谱分离技术和复杂的数据解释。该传感策略也被应用于鉴定天然RNA样品中酶切的NMPs,表明利用酶偶联的MspA-PBA进行外切测序的可行性。虽然没有论证,但这种策略原则上适用于传感核苷二磷酸盐类、核苷三磷酸、其他核苷酸修饰、核苷酸糖和核苷类药物,只要核糖的顺式二醇仍然保留。唯一的限制是,当前的传感策略无法检测核糖修饰的NMPs,如Cm和Gm。

       

2022年8月13日 15:30
浏览量:0
收藏