韩 达 课 题 组

韩 达 课 题 组

NAT CHEM丨共结合介导的蛋白组学方法用于活细胞中的G-四联体互作蛋白筛选

作者:唐倩

DNA-蛋白相互作用在调控某些重要生物过程中起到重要作用,筛选、鉴定能和特定的功能性基因组位点结合的蛋白能帮助我们从分子层面了解其调控机制。来自剑桥大学的Shankar Balasubramanian教授的团队提出了一种称之为共结合介导的蛋白组学(co-binding-mediated protein profilingCMPP)方法用于研究染色质中的G四联体(DNA G-quadruplexes G4s)结合组,该工作近日发表在Nature Chemistry上。

img1

错综复杂的蛋白-核酸相互作用在诸如基因表达、DNA复制、DNA修复等细胞活动中发挥着重要作用。染色质免疫共沉淀(ChIP)与质谱联用的蛋白组学方法能够分析染色质结合的蛋白质组成,然而这些方法需要高亲和力、高选择性的抗体,且一次只能分析一种蛋白。此外,BioID、APEX等酶催化的邻近标记方法能够共价标记内源性邻近蛋白,然而较低的标记动力学限制了该方法的空间分辨率,且融合蛋白的细胞毒性及其不可忽视的尺寸也限制了该方法的应用。

DNA G4联体由富含鸟嘌呤(G)DNA序列折叠形成的四链结构,它们存在于人类细胞中,且其形成处于一个动态过程。人类基因组中包含700000多个G4形成序列(G4-seq),这些位点是潜在的G四联体(G4s)形成位点。G4染色质免疫沉淀测序(G4 ChIP-seq)发现内源G4富集于染色质开放区域及高表达的癌症基因的启动子区域,且近期的研究发现这些G4可能与乳腺癌的转录因子相关。此外,染色质中的G4 形成是动态变化的,且其稳态和功能很可能受到与其相互作用的蛋白的调控。然而目前研究G4互作蛋白往往是在体外用化学合成的G4结构亲和富集细胞裂解液中的蛋白来进行,这些亲和富集的方法并不能反应真实的染色质环境。

img2

1. CMPP原理

 

在这一篇工作中,作者介绍了一种共结合蛋白组学方法并将其用于研究G4互作蛋白。如1所示,在前期工作的基础上,作者设计了一种可以与细胞染色质G4结合小分子探针,当某一蛋白与G4相互作用时,由于在空间上毗邻,随即可利用光交联使G4结合的小分子探针与蛋白共价交联从而标记这些与G4相互作用的蛋白。

img3

2. 体外进行的共结合介导的G4结合蛋白邻近捕捉

 

2a所示,作者设计了两种G4配体探针,分别为photoPDS-1 (1)和phtoPDS-2 (2),两者均由G4选择性小分子配体PDS分子、炔烃及具有光学活性的脂肪族二氮嗪基团构成,后者相较于前者有更长的linker,使之可以结合潜在的不同结合位点的互作蛋白。此外,作者还制备了只具有光交联活性却没有G4结合单元的对照分子(命名为3)。作者发现12探针均能选择性结合G4寡核苷酸(如G4 Kit1, G4 Myc and G4 Telo),且不与双链DNA分子(dsDNA)结合(2b, c),此外没有观察到对照探针3与G4结合。

作者以G4特异性抗体BG4为模型在体外测试了这两种探针。如2d所示,作者将BG4抗体与已知的G4结构(G4 Myc)以及不能形成G4结构的寡核苷酸序列(单突变单链Myc,ss mutMyc)共孵育,随后加入123三种探针,并用365nm波长的光照触发光致交联。随后用TAMRA-azide分子标记探针分子,并用SDS-PAGE分离蛋白-寡核苷酸-探针混合物。如2e所示,探针12均能标记G4 Myc结合的BG4,而对照分子3则没有可见条带。此外,对照寡核苷酸ss mutMyc,dsMyc以及无寡核苷酸的对照样品均没有可见条带。

img4

3. 人细胞中的G4结合组分析

 

作者进一步地将这一G4互作蛋白探针用于人细胞中的G4互作蛋白研究。作者用探针123分别处理HEK293T细胞,随后将细胞核提取物用TAMRA分子标记。如3b所示,SDS-PAGE显示12探针有一系列清晰的条带,表明探针有效结合了特定的蛋白。这也说明探针有较好的细胞渗透性和核摄取效率。作者进一步用无标记定量液质联用组学(label-free, quantitative liquid chromatography (LC) MS proteomics)方法鉴别了这些被捕捉到的G4互作蛋白。最终,对于探针1和探针2,分别富集到248和209种蛋白(3c, d),其中探针2结合的蛋白有96%与探针1结合蛋白重合,这也说明所试验的探针linker长度对结果并无显著影响。此外,探针1和探针2捕捉的蛋白与先前已报道的G4互作蛋白有重合(探针1 24%,探针2 14%),这也说明该方法用于研究未知的G4互作蛋白捕捉的可行性(3e)。通过生物信息学分析,这些捕捉到的蛋白与各种细胞核过程相关(3f),且其中很大一部分蛋白与转录相关(3g),这与现有研究结果表明的G4可能参与转录调控的结论相符。重要的是,除了鉴别到与现有数据库重合的19种G4互作蛋白,作者发现了一系列未被报道的新的G4互作蛋白,包括表观遗传调控因子UHRF1,转录终止因子 TTF2,ATP依赖的RNA解旋酶(如DDX1 、DDX24)以及前体RNA剪接因子RBM22等。此外,包括SMARCA4和SMARCC1在内的几种染色质重塑复合物的亚基也被捕捉到,近期也有相关工作报道它们与G4潜在的相互作用。

img5

4. 新颖G4结合蛋白的验证

 

这些被捕捉到的G4互作蛋白可能是直接与G4发生相互作用,也可能作为蛋白复合物的一部分参与到与G4的结合,为了更好地了解它们与G4作用的机制,作者在体外探究了这些蛋白与G4的相互作用。作者选用了能形成不同G4拓扑结构的3’端生物素修饰的G4寡核苷酸,包括平行构象(Myc, Kit1 and Kit2)、反向平行构象(TBA)和杂合构象(BCL2)的G4,以序列单突变无法形成G4结构的作为对照。这些寡核苷酸被固定在链霉亲和素修饰的磁珠上用于在HEK293T细胞核裂解液中亲和富集目标蛋白。作者重点研究了SMARCA4, UHRF1, RBM22, TTF2, DDX24, DDX1 和HMGB2这几种归属于不同功能蛋白类型的新发现的G4互作蛋白。蛋白印记分析显示这7种蛋白中的6种都特异性地结合G4寡核苷酸,而与对照组没有结合(4a)。考虑到亲和富集试验并不能区分直接与G4作用的蛋白和共沉淀而被富集的蛋白,作者又用纯化的重组蛋白(SMARCA4, UHRF1, DDX1, DDX24 and RBM22)进行了酶联免疫试验,结果显示这五种蛋白能选择性的、高亲和力地与G4结合。这些实验结果表明作者提出的CMPP方法可有效地被用于细胞内G4互作蛋白的捕捉(4b-f)。

img6

5. SMArCA4 富集于染色质G4s形成位点验证

 

在这篇工作的最后,作者考察了染色质中内源G4与SMARCA4(染色质重塑复合物SWI/ SNF的组成部分)的相互作用。作者以K562细胞为研究对象,用染色质免疫共沉淀测序鉴别了28265个SMARCA4结合位点,发现内源性G4的结合位点有84%与SMARCA4结合位点重合(5a, b)。并且,在那些富含鸟嘌呤却已被验证无法形成G4结构的区域并未发现信号(5c)。这一结果说明SMARCA4是直接结合染色质中的G4结构而非富含鸟嘌呤的双链DNA序列。通过研究不同功能基因组的 SMARCA4 结合位点,作者观察到最大比例的 SMARCA4-G4 共定位在启动子(峰值的42%),这表明与G4结构的相互作用可能在 SMARCA4 启动子活性中发挥特殊作用(5d)。

Zhang, X., Spiegel, J., Martínez Cuesta, S. et al. Chemical profiling of DNA G-quadruplex-interacting proteins in live cells. Nat. Chem. 13, 626–633 (2021).

 

2021年8月6日 09:54
浏览量:0
收藏