韩 达 课 题 组

韩 达 课 题 组

课题组工作丨PNAS丨解密sgc8c DNA适体的复杂三维结构和功能优化

 

核酸的三维结构和构象动态对其发挥精密的生物功能至关重要。核酸适体通过折叠成特定的三维结构实现对蛋白和小分子等标靶的高亲和力、高特异性识别。靶向膜蛋白的核酸适体在疾病检测和靶向治疗等领域展现出巨大潜力。通常,利用冷冻电镜、X射线晶体衍射和核磁共振(NMR)技术测定蛋白-核酸适体复合物的三维空间结构是研究适体识别机制和功能优化的最直接策略。然而,对于具有较大构象动态性的蛋白和核酸适体,往往不易获取准确的复合物结构信息。生物大分子结构预测模型如AlphaFold 3RoseTTAFoldNA等在RNARNA-蛋白复合物结构预测性能上有所提升,但对DNA复杂三维结构预测表现欠佳。这是因为相较于RNADNA形成长程三级相互作用(long-range tertiary interactions)的能力较弱,导致Protein Data Bank (PDB)数据库中DNA复杂三维结构的数量极少。因此,如何在缺乏复合物结构信息的情况下研究重要DNA适体的识别机制和功能优化,是领域内亟待解决的关键问题。

通过分析PDB数据库中蛋白-DNA适体复合物结构,作者发现DNA适体通常以碱基配对区域作为支架以维持三维空间折叠,而利用非稳定配对区域的核苷酸作为结合位点。若与蛋白作用仅引起核酸适体在其结合位点或附近发生局部构象变化,而不破环原本的三维折叠,即可通过监测NMR化学位移扰动(CSPs)来探测核酸适体的结合位点,从而指导其功能优化。该思路也被Bhattacharya等人用于生物大分子的定向进化(Nature, 2022, 610, 389)。在此基础上,仅解析核酸适体的三维结构则是有意义的。Borggrafe等人利用NMR实验捕捉碱基配对信息以更好地约束构象动态性较高的区域,从而成功解析10-23 DNAzyme的溶液结构(Nature, 2022, 601, 144)。这些展现出NMR技术在研究生物大分子互作、功能核酸结构和定向进化方面的巨大优势。

受上述启发,中国科学院杭州医学研究所谭蔚泓院士/韩达研究员/郭沛副研究员团队提出了一种简单高效的NMR技术思路,在无需获取蛋白-核酸适体复合物结构的条件下探索核酸适体的结合机制和功能优化,相关工作以Structure-based investigation of a DNA aptamer targeting PTK7 reveals an intricate 3D fold guiding functional optimization为题发表在PNAS上。

Sgc8c是通过Cell-SELEX技术获得的靶向白血病细胞的DNA适体,其分子靶标为酪氨酸蛋白激酶7PTK7)。PTK7是一种无催化活性的跨膜蛋白,在多种肿瘤细胞中高表达。鉴于sgc8c对靶蛋白/细胞的高亲和力和高特异性,它被广泛应用于疾病检测和靶向治疗。然而,sgc8c执行精密功能的结构基础尚不清楚,导致其功能优化受到限制。作者以sgc8c为研究对象,通过NMR CSPs和定点突变实验确定了sgc8c结合PTK7的关键位点,测定了sgc8c的三维空间结构,发现其中重要的长程三级相互作用,并基于结构-功能关系设计sgc8c优化体,显著提升了适体的热稳定性、生物稳定性以及蛋白/细胞靶标结合亲和力。

Sgc8c二级结构和关键结合位点:在模拟Cell-SELEX的盐离子和温度条件下,作者分析sgc8c NOESY核磁谱图中的亚氨基质子(G H1T H3)信号区,捕捉到C3∙G40G9∙C13C10∙G12C18∙G36C19∙G35G20∙C34T2∙A41T4∙A39A5∙T38A6∙T3710Watson-Crick碱基配对,确定了sgc8c的二级结构,包含P1P2P3三个配对区(1A-B)。向sgc8c滴定PTK7后,10个亚氨基质子信号依旧存在(1C),说明sgc8c在结合PTK7后仍能维持原本的三维空间折叠。利用滴定PTK7前后sgc8c G H1T H3T H7信号的化学位移变化绘制了CSPs图,其中G9 H1G12 H1T38 H3G36 H1显示出相对较大的CSPs1D),指示这些核苷酸可能处于结合位点。通常来说,生物大分子的关键功能区域(如结合位点)对残基突变较为敏感。作者将CSPs较大的G9∙C13C10∙G12A5∙T38C18∙G36进行突变,采用SPR和细胞流式测定适体与PTK7蛋白和CCRF-CEM细胞的结合,最终确定P2区的核苷酸(即G9∙C13C10∙G12T11)是sgc8c的关键结合位点和重要功能元件。

图1. sgc8c的二级结构和关键结合位点

Sgc8c三维空间结构:鉴于sgc8c在结合PTK7前后仍能维持其三维空间折叠,作者测定了sgc8c的溶液核磁结构(2),揭示sgc8c折叠成复杂的三通(three-way junction)结构,包含P1区(核苷酸# 1-637-41)、P2区(核苷酸# 9-13)和P3区(核苷酸# 18-36)、J1连接区(核苷酸# 7-8)和J2连接区(核苷酸# 14-17)。有趣的是,sgc8cP1P3区形成跨度约53 Å的同轴堆叠,几乎呈共线排列。Passalacqua等人近期报道的lettuce DNA适体结构也有此特点(Nature, 2023, 618, 1078)。这种长跨度的同轴堆叠在RNA三通和四通结构中多见,而在DNA中却很少见。此外,作者还发现Mg2+对维持sgc8c三通结构和功能有重要作用。

图2. Sgc8c的三维空间结构(PDB ID: 8Y0F)

Sgc8c中的长程三级相互作用:作者在sgc8c三维结构中发现了DNA中少见的长程三级相互作用,例如C7A39/T38形成氢键、G17C3形成氢键(3A)。将C7G17替换成缺碱基位点(dS)破坏了适体的三维空间折叠,丧失了对靶蛋白/细胞的结合能力(3B-C)。为了进一步确定C7G17长程氢键作用的重要性,作者分别将C7突变成尿苷dU(缺少N4氨基)、G17突变成2-氨基嘌呤2-AP(缺少N1亚氨基)、G17突变成黄嘌呤X(缺少N2氨基),SPR结果显示G17XPTK7无结合,C7dUG17-2APPTK7的结合能力显著减弱(3C),说明长程三级相互作用对sgc8c的结构和功能至关重要。

图3. 长程三级相互作用对sgc8c结构和功能至关重要

结构-功能关系指导的sgc8c优化策略:上述结果表明维持sgc8c结构和功能的重要核苷酸包括:构成结合位点的P2区、参与长程三级相互作用的C7G17、形成重要碱基堆积的C19∙G35G20∙C34,值得一提的是,sgc8c可将不同区域的十多个碱基募集在三通结构中心,构成其关键位点(essential site4A),这在DNA结构中非常罕见。Sgc8c关键位点中的核苷酸不耐受突变(13),因此优化sgc8c应考虑对P1底部和P3顶部进行改造。

图4. 基于结构-功能关系指导的sgc8c适体优化

为提升适体的热稳定性和靶标结合亲和力,作者将P3顶部的AATA四核苷酸环(#25-28)替换为GAA三核苷酸环,同时保留或删除翻转在外侧的C29GAA25-28GAA25-29突变体能够维持原本的三维空间折叠(4B),它们的Tm值较sgc8c分别升高约711 °C,其中GAA25-28表现出更强的蛋白结合亲和力,并在37 °C条件下与CCRF-CEM细胞结合的KD达到pM级别(4C-E)。为增强适体的生物稳定性,作者首先将P1末端的24对碱基替换为镜像核苷酸,得到L1-2L1-3L1-4突变体。L1-3 L1-4虽能够抵抗酶切,但它们与蛋白/细胞的结合亲和力显著下降(4F-H),这是因为镜像核苷酸破坏了C3A39参与的重要长程氢键(3)。为保护这些氢键,作者在P1末端延长23对镜像核苷酸,获得的L+2bpL+3bp均有出色的抗酶切能力,且与蛋白/细胞的结合亲和力同sgc8c相当。最后,作者整合了GAA25-28变体和L+2bpL+3bp修饰,获得sgc8c-x1sgc8c-x2的优化适体。相较于sgc8c,优化后的适体表现出更高的热稳定性,更优的靶标结合亲和力、更强的抗核酸酶切能力和血清稳定性(5),可作为极具生物医学应用潜力的核酸分子工具。

图5. 优化适体sgc8c-x1sgc8c-x2的功能验证

该工作提出一种简单高效的NMR技术思路,用于在缺乏复合物三维结构信息的情况下探索适体的识别机理和功能优化。研究结果揭示了sgc8c DNA适体形成精密复杂的三通结构,它能巧妙地从不同区域招募十余个核苷酸汇聚于三通中心构成其结构-功能的关键位点,这些信息有效地指导了适体的功能优化。该工作为研究靶向膜蛋白的核酸适体结构与功能提供了新思路和技术路线,同时揭示了长程三级相互作用对塑造DNA分子复杂结构和精密功能的关键作用。

原文链接:https://www.pnas.org/doi/10.1073/pnas.2404060121

第一作者:何阿信博士

通讯作者:谭蔚泓院士,韩达研究员,郭沛副研究员

2024年7月11日 13:18
浏览量:0
收藏