课题组工作丨ACS Chem. Neurosci.丨CTG三核苷酸重复序列发夹的高分辨率核磁结构
短串联重复序列(short tandem repeats, STRs)占人类基因组的~3%,具有遗传不稳定性[1],其扩增突变导致超过50种人类神经退行性疾病[2]。在DNA复制、转录、修复等过程中,非B型DNA结构的形成被认为是重复序列扩增突变的根源(图1A)[3],靶向结合非B型DNA结构的小分子药物有望抑制重复序列扩增,从而达到治疗疾病的效果[4]。因此,对重复序列DNA结构的研究有利于理解相关疾病的分子机理和靶向药物研发。
近日,中国科学院杭州医学研究所韩达研究员/郭沛副研究员团队在ACS Chemical Neuroscience期刊上发表了题为High-Resolution NMR Structures of Intrastrand Hairpins Formed by CTG Trinucleotide Repeats的工作。该工作首次解析了与强直性肌营养不良1型(myotonic dystrophy type 1, DM1)相关的CTG三核苷酸重复序列DNA形成的发夹的高分辨率结构,并根据其结构特点找到特异性结合该发夹结构的小分子配体,该配体有望通过阻碍DNA复制、干预DM1疾病中的CTG重复序列扩增。
图1. (A)DNA复制过程中新生链上形成非B型DNA结构(如发夹)导致重复序列扩增;(B-D)本工作解析G(CTG)4C发夹的高分辨率三维结构(PDB ID: 8X4F)。
CTG重复序列扩增发生在DMPK基因的3′非翻译区,导致强直性肌营养不良1型(DM1)的发生。此前研究者通过酶/化学探针、单分子荧光共振能量转移(smFRET)等手段表征了CTG重复序列可形成发夹结构[5];然而,由于CTG重复序列的高度动态性,其高分辨率结构尚未解析。我们发现,在4个CTG重复单元的首尾加上5′-G和3′-C以形成末端“封闭”碱基对,即G(CTG)4C,能够在保留重复特征的同时得到CTG序列形成的最小、单一的发夹结构。我们进一步利用液体核磁共振(NMR)波谱实验辅以约束型分子动力学模拟,成功解析了G(CTG)4C发夹的高分辨率三维结构(图1B)。该发夹由5个碱基对形成的茎部和TGCT四核苷酸环组成。在茎部,G1-C14、C2-G13、G4-C11和C5-G10形成Watson-Crick碱基对;T3和T12则通过T3 H3···T12 O4 and T3 O2···T12 H3氢键形成摆动碱基对(图1C),并且堆积在相邻Watson-Crick碱基对之间。四核苷酸环由T6、G7、C8和T9组成,其中T6和T9通过T6 H3···T9 O4 和T6 O2···T9 H3氢键形成闭环碱基对,G7和C8则连续堆积在环的5′端(图1D)。该发夹中的T·T错配以及TGCT环可作为小分子配体的结合位点。
接着,我们利用NMR解析了更长的、含有偶数重复单元的G(CTG)6C发夹结构(图2A):与G(CTG)4C类似,G(CTG)6C形成平末端发夹,T9、G10、C11、T12形成四元环。基于该发夹,我们进一步探索了利用小分子配体靶向CTG重复序列DNA发夹结构的可能性,选择能与U·U错配结合的小分子DAP进行概念验证。等温滴定量热法(ITC)测得DAP结合G(CTG)6C发夹的平衡解离常数KD约23 μM(图2B),FRET熔融实验进一步表明了DAP的结合能够提高G(CTG)6C发夹的热力学稳定性(图2C)。向G(CTG)6C样品中加入DAP引起环碱基T9和T12甲基化学位移的变化(图2D-E),表明DAP结合在TGCT环上或附近。这些结果支持了用小分子靶向CTG重复序列DNA的可行性。
图2. 利用ITC、FRET熔融、核磁实验表征DAP对G(CTG)6C发夹的结合。
最后,我们通过引物延伸实验探究DAP结合CTG重复序列DNA的生物学影响。我们设计了含有20个CTG重复单元的模板链,以含有相同碱基组成的随机序列作为对照组,在有/无DAP的条件下,通过KF聚合酶进行引物延伸(图3A)。对于含有随机序列的模板,引物延伸在2小时内完成,且延伸效率不受DAP浓度的影响(图3B)。相反,CTG重复序列的存在减慢了延伸反应,且随着DAP浓度的增加,延伸不完全的产物逐渐增加(图3C)。延伸不完全的产物可能源自重复序列造成的复制终止,或者KF绕过CTG发夹导致的重复序列缩短。上述实验表明,DAP可以特异性结合CTG重复序列的发夹结构,进而阻碍DNA复制。
图3. DAP特异性阻碍含有CTG重复序列模板的复制。
DNA重复序列的扩增突变导致五十多种不可治愈的神经退行性疾病,对于相应核酸结构的理解有助于阐明相关分子机制、指导靶向药物的设计。在本工作中,我们首次揭示了CTG重复序列的高分辨率三维结构,为靶向药物的设计筛选、错配修复酶与CTG DNA相互作用的探究提供重要结构基础。同时,我们基于该三维结构发掘了结合CTG重复序列的小分子配体,并且证明该小分子配体的结合可以特异性阻碍含有CTG重复序列的模板延伸,为DM1和其他CTG重复序列扩增疾病的治疗策略提供了新思路。
原文链接:https://doi.org/10.1021/acschemneuro.3c00769
第一作者:万里祺,何阿信
通讯作者:韩达研究员,郭沛副研究员
参考文献
[1] Y. Shi, Y. Niu, P. Zhang, H. Luo, S. Liu, S. Zhang, J. Wang, Y. Li, X. Liu, T. Song, et al., Characterization of genome-wide STR variation in 6487 human genomes. Nat. Commun. 2023, 14, 2092.
[2] C. Depienne, J.-L. Mandel, 30 years of repeat expansion disorders: What have we learned and what are the remaining challenges? Am. J. Hum. Genet. 2021, 108, 764-785.
[3] W. M. Guiblet, M. A. Cremona, R. S. Harris, D. Chen, K. A. Eckert, F. Chiaromonte, Y.-F. Huang, K. D. Makova, Non-B DNA: a major contributor to small- and large-scale variation in nucleotide substitution frequencies across the genome. Nucleic Acids Res. 2021, 49, 1497-1516.
[4] M. Nakamori, G. B. Panigrahi, S. Lanni, T. Gall-Duncan, H. Hayakawa, H. Tanaka, J. Luo, T. Otabe, J. Li, A. Sakata, et al., A slipped-CAG DNA-binding small molecule induces trinucleotide-repeat contractions in vivo. Nat. Genet. 2020, 52, 146-159.
[5] C.-W. Ni, Y.-J. Wei, Y.-I. Shen, I. R. Lee, Long-range hairpin slippage reconfiguration dynamics in trinucleotide repeat sequences. J. Phys. Chem. Lett. 2019, 10, 3985-3990.