韩 达 课 题 组

韩 达 课 题 组

Nature | 大规模分析癌症基因组中的重复序列扩增

大家好,今天分享一篇202212月发表在nature上的文章,题为“大规模分析癌症基因组中的重复序列扩增

作者介绍

 

Michael Snyder,斯坦福大学基因学家。致力于基因组学和蛋白质组学。开发了蛋白质组芯片、人类全基因组的高分辨率阵列、转录因子结合位点映射方法和从头基因组测序技术。

研究背景

人类基因组的很大一部分由重复的DNA序列组成,这些序列以串联或穿插形式存在。串联重复序列扩增(>100bp)可能导致50余种疾病,包括亨廷顿和脆性X综合征。然而,目前有关串联重复序列扩增的研究重点主要集中在神经和神经退行性疾病方面,在肿瘤等复杂疾病中研究较少。此外,生物信息学工具多被用于识别短读长的重复扩增,如微卫星不稳定性,缺乏对癌症中全基因组大规模重复串联扩增频率的系统分析。

     微卫星指分布在人类基因组中简单重复的DNA序列,一般由1-6个碱基组成(重复单元),串联重复排列,重复次数5-50次

     微卫星不稳定(Microsatellite instabilityMSI)指由于在DNA复制时插入或缺失突变引起的短、重复DNA序列长度改变的现象,常由错配修复功能缺陷引起。正常机体能够对错误DNA进行修正,而肿瘤组织中DNA修复蛋白出现障碍,无法修复

在本文中,研究人员分析了29种癌症类型中2,622个人类癌症基因组样本,在7种类型的癌症中发现了160个重复序列扩增,并确定了癌症基因组中一类新的复发性变化

结果与讨论

1.重复扩增序列(Recurrent repeat expansionsrRE)

首先,研究者收集了来自ICGCTCGA两个数据库中29种癌症类型的2622个癌症全基因组测序数据,将每种癌症类型作单队列分析。通过EHdn测序方法,研究者确定了2622个候选rREs。为了精确解释拷贝数变异,研究者设计了一种局部读取深度滤过方法对重复读取产生的信号进行归一化处理,得到578个候选rREs。研究者在七种人类癌症(前列腺癌、肝细胞癌、胶质母细胞瘤、肺癌、肾癌、卵巢癌)中检测到160rREs。大多数癌症基因组至少包含一个rRE,在前列腺癌和肝癌中包含多个rREs。研究者进一步发现携带rRE的样品不存在MSI富集。相反,在微卫星稳定样品中发现了对rRE的微弱偏好,证实rREsMSI的形成无关。

2.rRE的特征

rRE的位置研究表明:在160rREs中,基序长度呈现双峰分布,1/3表现GAA基序。此外,rREs在整个基因组中分布不均匀,偏向于染色体臂的末端,这与其他疾病中发现的rREs特征一致。研究者进一步检测与基因特征相关的rREs的分布,其中7%基序被标记为外显子,其他出现在顺式调节元件如内含子、非翻译区和剪接位点内。通过距离分析发现,与简单重复序列相比rRE距离cCRE更近,这提示附近的rRE可能会改变调节元件的功能。

3.rRE与癌症的关系

研究者考察了rRE与人类疾病的关系。他们发现9rREs可以定位到癌症体细胞突变数据库中的1级基因上。同时,160rREs相关的前5种疾病中有4种是癌症。为了检验这些rREs是否在肿瘤中发挥作用,研究者将其与已确定的癌症风险位点进行关联分析。在前列腺癌相关rREs中,有63个位点与前列腺癌易感性相关。同时,rREs比标准STR更接近前列腺癌症易感基因座。此外,TP53突变与rREs显著相关。

4.肾细胞癌中的rRE

接下来,研究者对肾细胞癌中的rREs进行研究。UGT2B7编码一种葡萄糖醛酸酶,它可以清除体内包括化疗药物在内的小分子,并在肾脏和肝脏中选择性表达。研究者在正常肾细胞系HK-2中鉴定了~26 GAAA重复序列。相比之下,在5个透明肾癌细胞系中发现了~63~160 GAAA重复单元的扩增,且大多数扩增是杂合的。研究者进一步通过PacBio HiFi UGT2B7内含子中GAAA rREs进行可视化分析,结果进一步证实了PCR数据的准确性。通过对UGT2B7rREs周围染色质环境分析发现,GAAA主要存在于其附近的增强子区。他们选择不含rREUGT2B7同型细胞作为对照,发现rREs的重复基序GAAAUGT2B7转录本亚型的显著减少相关。因此,研究者认为GAAA rREs可能影响肾癌细胞中UGT2B7表达。

5.rRE的靶向分子

为了进一步验证RCC中重复扩增是否有助于细胞增殖,研究者分别设计了包含一个以GAAA为目标的聚酰胺和一个溴域配体JQ1Syn-TEF3、一个对照分子Syn-TEF4,以及缺乏JQ1结构域的聚酰胺PA3PA4。选择Caki-1786-O细胞作为样本,因为它们在UGT2B7中分别有最大和最小的GAAA束,结果显示Syn-TEF3可显著降低Caki-1细胞的增殖,且呈剂量依赖性,对786-O细胞的影响不大。Syn-TEF4在任何一种细胞系中都没有显著降低增殖。碘化丙啶染色实验表明,与DMSO处理的对照组相比,经Syn-TEF3处理的Caki-1细胞的细胞死亡显著增加,786-O细胞没有显著变化,Syn-TEF4对两种细胞系的细胞死亡均没有显著影响。因此,研究者认为GAAA重复扩增可能代表RCC的基因易损性。

总结

在本文中,研究者在7种人类癌症类型中鉴定出160rRE;大多数rRE对癌症亚型有特异性;rRE往往在调节元件附近的人类基因座中富集;rREMSI状态无关;用小分子靶向RCC GAAA-重复扩增序列导致癌症细胞死亡。因此,研究者认为rREs可能是人类癌症遗传变异的一个重要但尚未被充分研究的来源,并可能在基因调控方面发挥作用

 

Erwin, G.S., Gürsoy, G., Al-Abri, R.et al. Recurrent repeat expansions in human cancer genomes. Nature (2022). https://doi.org/10.1038/s41586-022-05515-1

 

2023年2月4日 12:25
浏览量:0
收藏