韩 达 课 题 组

韩 达 课 题 组

Nucleic Acids Res.丨通过桥基方法在复杂 DNA 环境中定位、追踪和测序多个扩展遗传字母

今天介绍的文献是今年3月份发表在Nucleic Acids Research上的文章,题目为Locating, tracing and sequencing multiple expanded genetic letters in complex DNA context via a bridge-base approach

 

通讯作者李凌君教授于2009-2012在美国内华达大学医学院和美国Scripps研究所交流,研究领域涉及非天然核酸相关的核酸化学生物学、生物有机化学。

研究人员已开发出一系列非天然碱基对来扩展基因字母表。通过插入一个或多个非天然碱基对(UBP)可扩大标准DNA的容量、多样性和功能,因此通过简单、方便的方法对含有多个UBPDNA进行测序至关重要。在此,研究人员报告了一种桥碱基方法,可成功鉴定含UBPTPT3-NaM)的DNA。这种方法主要基于桥碱基isoTAT可以同时与NaMG配对,以及NaM在没有互补基的情况下与A配对。在该方法中,TPT3-NaM可以通过简单的PCR实验转移到C-GA-T上,具有高的通读率和低的序列依赖性。这种方法在体内复制过程中可精确追踪多个TPT3- NaM UPBs变化和保留率。此外,该方法还可用于鉴定多位点DNA病变,实现了TPT3-NaM的多个位点的准确定位。

天然的遗传信息存储在A/T/G/C序列中,研究人员已经研究出包括P-Z, Ds-PxTPT3-NaM在内的UBPs,它们具有作为生物正交遗传字母的能力,用于遗传信息的复制和存储。例如,通过SELEX系统筛选得到的含有多个UBPDNA适体亲和能力提高。通过携带含UBP的密码子和反密码子系统(A-NaM-C为密码子,G-TPT3-T为反密码子)成功表达了含非天然氨基酸的sfGFP蛋白。最近,研究人员也发现了使用三个新的非天然密码子AGXGXTAXC (X = NaM)可以同时正交解码,编码蛋白质。插入更多的UBP可以扩大DNA的容量、多样性和功能,然而,通过简单方便的方法监测含有多个UBPDNA仍具挑战性。此外,DNA序列中多个UBP的体内保留率在细胞复制过程中表现出更多的随机性,这也对监测多个UBP的保留提出了的新要求。

TPT3-NaM效果优异的UBP之一,目前为止其检测方法包括生物素移位法和测序检测。然而,生物素移位法无法检测排列紧密的多个UBPs,不能准确定位UBPs的位置,也无法监测UBPs附近的位点突变。测序法可分为Sanger测序法和纳米孔测序法。Sanger测序可以检测单个UBP,其中信号末端可以给出UBP的正确位置。但Sanger测序对DNA中多个UBP进行测序的主要障碍是信号在第一个UBP位点之后终止,使得后续信号难以获得。另外,纳米孔测序方法已经开发出来,可以根据不同的形状来区分每种UBP,但该方法受限于相关蛋白的制备和相关的仪器设备。因此,在相邻编码区或非固定位置检测两个或多个TPT3-NaM UBPsDNA方法,迄今为止仍具挑战。

该工作中,研究人员设计了一个桥碱基(isoTAT),可将TPT3-NaM碱基对特异性的转化为C-G碱基对,进而可读取DNA序列中的所有UBP信息。此外研究人员也证明了在没有互补碱基的情况下NaM会与A配对。他们的研究结果表明,TPT3-NaM可以通过两种具有高通读率和低序列依赖性的PCR方法向C-GA-T有效转化,从而实现对TPT3-NaM碱基对多个位点的检测。重要的是,研究人员进一步指出桥碱基可评估多个相邻TPT3-NaM UBPs的保留率,并且该方法还可以检测由TPT3-NaM标记的多种DNA损伤。

1. 通过桥碱基isoTATTPT3-NaM碱基对转换为C-G碱基对

 

为实现DNA序列中多个TPT3-NaM UBP的识别,作者希望借助桥碱基策略实现这一目标。TPT3-NaM中,TPT3表现出对结构变化的耐受性,以保持其配对能力。基于此,作者构建氮杂修饰类似物isoTAT,并推测由于空间位阻或氢键排斥作用力,isoTAT不会与A/T/C配对。因此,isoTAT既可以与NaM又可以与天然的G碱基配对,同时与A/T/C正交。

2. 桥碱基isoTAT掺入的动力学分析

 

为了研究isoTAT的配对能力,作者使用了45nt模板和23nt引物进行前稳态动力学分析(2A)。研究人员将模板、引物和disoTATs与大肠杆菌DNA聚合酶I (Kf (exo-))共孵育15 s,实验发现模板中NaM的对位约有90%isoTAT成功掺入,而G的对位约有94%isoTAT成功掺入(2BC)。此外,研究人员用相同的方法测量了isoTATATC碱基的配对能力,实验发现掺入率低于10%(2BC)。这些数据表明isoTAT碱基对NaMG的识别选择性很高,而对ATC的识别效率要低得多。

研究人员进一步用稳态动力学分析来表征掺入效率((二阶速率常数,Km/Vmax)(2A)。模板中存在dNaMdGisoTAT的插入效率分别为7.68 × 1072.14 × 108,与NaM-TPT3的插入效率3.36 × 109相当。此外,在相同条件下,A - isoTATT-isoTATC - isoTAT均未检测到可检测的插入效率(1)。通常,Km/Vmax值超过两个数量级将产生特异性配对的UBP。在dNaMdG对面高效率的插入disoTAT证明iso- TAT可以与NaM和天然碱基G配对。由于UBP的高延伸率是复制得到全长产物的关键,因此作者还研究了isoTAT加入后引物的延伸能力。将分别含有NaM-isoTATG-isoTAT的模板-引物中间体与下一个互补的dCTP共孵育,在60 s时检测到延伸反应的产率~ 80%,略低于NaM-TPT3的延伸产率(图2D2E)。此外,研究人员还发现在NaM或第一个G对位掺入第一个isoTAT后引物可以继续延伸,掺入isoTAT到下一个G的对面。在NaM-G模板中,研究人员用8 mM disoTATTP共孵育5 min时,isoTAT:G(25 nt)的延伸率可达92.5%;当用2 mM disoTATTP 孵育10 min时,延伸产率也可达到82.6%。当以G-G作为模板时,isoTAT:G(25 nt)的延伸率可达95.3%。上述动力学数据表明isoTAT可以用作桥碱基。

3Sanger测序分析TPT3-NaMC-GA-T碱基对的转换

 

作者接下来验证了桥碱基isoTATPCR实验中对UBP转化位天然碱基的应用。他们在PCR缓冲液中加入disoTATTP,在扩增过程中诱导TPT3-NaM转化为天然C-G对。另一方面,动力学数据表明,在某些序列背景下,NaM可以与A配对,而不能与其他天然核苷酸配对(补充图S3和表1)。因此,研究人员设计了使用disoTATTP/dNaMTP或仅使用dNaMTP与天然dNTPs配对的PCR分析体系,分析dNaM的偏好性及桥碱基的转化效果(3A)。双链DNA模板1N2N3NUN分别表示含有1个、2个、3个或1NaM-TPT3(上游和下游有3个随机核苷酸)。实验发现,在使用disoTATTP/dNaMTPdNTPsPCR体系中NaM-TPT3主要转化为G-C,而使用dNaMTP与天然dNTPsPCR体系中NaM-TPT3主要转化为T-A。作者认为,桥碱基的转换和NaM的固有偏好,通过两次PCR实验及随后的Sanger测序信号比较,可以为多个已知或未知位点的TPT3-NaM UBPs提供一种有效而简洁的检测方法。此外,作者在两种PCR条件下,采用1N模板进行qPCR扩增,考察模板数量的影响。经过40PCR循环,作者发现1N的扩增即使只有0.004 pg也能保持高效和准确的扩增,而只使用NaMPCR扩增效率更高(3D)

4: 深度测序分析邻近序列对桥碱基转换的影响

由于序列依赖性对疏水UBP的体内和体外复制都有不利影响,作者对当前的PCR体系的序列依赖性进行详细研究,以促进其广泛应用。对UN模板PCR产物进行深度测序,核苷酸条件分别为I(disoTATTPdNaM和天然dNTPs)II(dNaM和天然dNTPs)。对于I组体系,在中位数(244)附近的标准钟形频率分布表明检测到的序列组合没有显著的偏差差异(4A)。相比之下,II组体系的频率分布呈现出不太规则的钟形,一些序列组合的读数小于100或大于750,这表明一些特殊的序列上下文具有异常的偏好(4B)

深度测序数据可以分析附近碱基对UBP转化的详细影响。研究人员首先计算桥碱基变换前、后三个位置的单基分布。如图4C所示,I组体系前后6个天然碱基位置(每个碱基约占25%)均未发现碱基偏好,且NaMG的有效转化超过66%。采用同样的分析方法,II组体系NaMT的有效转化超过60%,且下游3个碱基位置均可找到碱基偏好。其次,作者评估了二核苷酸在桥-碱转化中的作用。如图4D所示,在上游或下游的所有32个组合中,I组体系没有表现出明显的偏好;II组体系上游组合没有明显的偏好,而下游组合有明显的偏好。这种偏好可以合理解释图4B中不太规则的钟形分布。

5: 临近三个碱基对桥碱基转换UBP的依赖性分析

另外,研究人员分析了临近三个碱基对UBP转化的影响,结果如图5AB所示。在所有4096个桥碱基转化组合中,约95%的组合中TPT3-NaM主要转化为C-G,少数下游为CGGGGG的序列及特定序列中,TPT3-NaM转化为G-CA - TT – A。在NaM单独诱导转化的体系中,91%TPT3-NaM转化为A – T,少数特定序列转化为G-CA - TT – A。上述结果表明,双定位方法具有高通读率和低序列依赖性的特点。

对于插入多个TPT3-NaM UBPs或非默认位点的UBPs的要求越来越高,例如在SSO中进行体内复制以插入更多的ncAAsSELEX。由于现有的方法如Sanger末端法和生物素移位法(6A)的限制,迫切需要非默认位点的UBPs检测。新出现的数据表明,一些序列在体内复制中不太可被SSO接受,因此需要在携带UBP的质粒复制后分析突变产物。作者选择含有一个或三个UBP且具有不同相邻碱基的质粒进行保留/突变分析(6B)。提取质粒,通过桥碱基和NaM或仅NaM转换进行PCR扩增36个循环。结果表明,在含有1UBP GXA (X = NaM)的质粒中,NaM通过桥碱基几乎全部转化为GT(图6C)。

 

有趣的是,含有三个UBP的质粒中的NaM碱基在GXA的三碱基组合中转化为A+GA+T的混合物,在TXT的三碱基组合中转化为T+G或仅有T的混合物,这表明在GXANaM会发生至A的突变,在TXT组合中NaM发生至T的突变。而在CXT碱基组合中,NaM几乎完全突变为A(6E)。此方法直接给出了在SSO中复制多个UBPsDNA的突变信息。

研究人员试图采用标准曲线法定量研究保留率。TPT3-NaM转换成G-C后,将不同比例的天然G-C序列(内参)与产物混合、测序。利用反义链上C的信号比生成标准曲线。首先,作者检测了携带一个TPT3-NaM UBP并且NaM位于GXA中的质粒样品。根据建立的标准曲线,计算UPB复制保留率为88%,与使用NaM-TPT3进行信号衰减法测量的82%相当(6D)。然后研究人员对携带三个TPT3 – NaM UBP的质粒B样品进行分析。有趣的是,在同一条链上相邻碱基不同的UBPs的保留或突变率发生了明显的变化。以反义链计算,对于GXA碱基组合,保留率可达72%。相比之下,TXT碱基组合的UBP保留率为76%,而CXT碱基组合的UBP保留率仅为7.5%(6F)。他们的方法完全读取了序列,没有发现天然碱基突变,表明NaM-TPT3具有理想的生物正交性,可用于体内复制(6C, E)

7:桥碱基法准确识别多位点DNA病变的新工具。

随后,研究人员采用桥碱基的策略检测多发性病变中的DNA损伤(7A)。研究人员在模板中使用dU来表示不同的病变。用糖苷酶(UDG)产生AP(缺碱基)位点后DNA链断开,然后使用Kf (exo−)酶插入dTPT3TPbiotin(7C)。通过生物素-链亲和素基链移位方便地富集dTPT3TPbiotin标记的损伤DNA链。然后利用桥碱基disoTAT识别DNA损伤位点。结果表明,dT PT3TPbiotin可以插入dU病变部位并通过桥碱基PCR转移到C中,并且可以在该模型系统中识别多个dU位点(图7)。

8PCR桥碱基转化法确定DNA链中的AP损伤位点。

 

此外,研究人员将该方法应用于简单生物样品中AP位点的检测(图8)。据报道,H2O2诱导的AP位点对正在进行复制或转录的区域表现出偏好。将pUC19质粒转化到大肠杆菌中,用H2O2诱导AP位点损伤。用非天然核苷酸dTPT3TPbiotin标记质粒DNA中的AP位点,分离DNAPCR转换,并进行深度测序。如果AP位点有一个核苷酸损伤,则通过置换PCR将其转化为AC。对于AC,只能分别计算CA的突变水平,因为它们是被转化的核苷酸之一。其中AC信号增加的位点有重叠情况。这表明AP位点可能在某些优先区域积累,PCR桥碱基转化法可以用于确定AP位点等DNA损伤。

9. 分析含有多个TPT3的适体亲和力及测序应用。

 

最后,研究人员将该方法应用于测序含有多个UBP的适体。研究人员用TPT3或天然碱基替换含有3UBP Ds碱基适配体中的Ds碱基,用SPR进行亲和分析。他们发现含有两个TPT3的适体与天然碱基的适体具有相似的亲和力,而含有三个TPT3的适体比含有天然碱基的适体具有更高的亲和力(图9A)。接下来,研究人员用测序终止法和PCR桥碱基转化法对具有3TPT3的适体测序。实验发现,测序终止法在第一个UBP后终止而无法继续后边的测序步骤;PCR桥碱基转化法则可以很容易地检测到存在于适配体中的多个NaM-TPT3 UBP(9BC)

 

2023年5月26日 09:48
浏览量:0
收藏