韩 达 课 题 组

韩 达 课 题 组

Nat Commun丨甲基化分析探索血浆 cell-free DNA 片段化的分子基础

今天介绍的文献是上个月发表的Nature CommunicationDNA methylation analysis explores the molecular basis of plasma cell-free DNA fragmentation

作者介绍:

通讯作者孙坤博士是来自深圳湾实验室的肿瘤研究所特聘研究员,孙坤博士长期从事生物信息学和基于外周血游离DNA进行癌症诊断的研究。他曾参与开发基于DNA甲基化水平分析的血浆游离DNA组织成分分析和癌症组织预测方法,并发现具有组织特异性的DNA末端以及其作为生物标记物在无创产前诊断和癌症诊断中的应用前景。孙坤博士曾在卢煜明教授课题组从事博后工作,并担任助理研究员。

背景介绍

循环游离DNAcfDNA)是细胞在凋亡、坏死等过程中释放到血液中的降解的DNA分子。cfDNA是液体活检的重要标志物,已广泛用于无创产前检查和癌症液体活检研究。血浆中cfDNA片段的断裂模式以及基因组上的覆盖,都可以间接反映体内基因表达调控的状态,例如核小体定位和基因表达活性,具体的片段特征包括:Size、末端位置及末端序列Motif等。这些特征逐渐引起科学家们的研究兴趣,在2015年被提出一门新的组学--片段组学(Fragmentomics)。

真核生物DNA被逐级有序地组装成高级结构,染色质的基本组成单位是核小体,它是由一段双链DNA4种碱性的组蛋白共同构成的;八个组蛋白分子(H2A×2H2B×2H3×2H4×2)共同形成一个八聚体的核心组蛋白,长度约为143bpDNA双链在核心组蛋白八聚体上盘旋1.75圈,形成核小体的核心颗粒;组蛋白H1在八聚体处结合20bpDNA分子;共166bpDNA片段在组蛋白八聚体上缠绕了2圈。

结果介绍

  1. cfDNA大小与片段末端的关系

cf DNA的典型大小分布呈现的特点包括166bp主峰和143bp以下的10bp周期峰(可能与组蛋白八聚体和双螺旋DNA10bp即有一个结合点,或缠绕于组蛋白的DNA双螺旋的大沟存在可被核酸酶识别并切割的序列),与核小体结构特点相呼应。首先分析chr12p11.1位点——cf DNA片段化分析的理想模型,并根据cf DNA分子大小将其分为短(≤147 bp)和长(≥170 bp)两类;对于每个cfDNA分子,其片段末端在基因组坐标中的低值和高值分别称为上游( U)和下游( D )末端。结果显示,cfDNA短片段在核小体内的片段末端比例均显著高于长片段(c-f)。进一步将分析扩展到全基因组水平,利用微球菌核酸酶消化-深度测序( MNase-seq )实验确定的核小体定位轨迹对cf DNA片段末端进行注释,与chr12p11.1位点分析结果高度一致(g-i),说明从核小体结构的不同位点剪切了不同大小的cf DNA,且短cf DNA分子更倾向于在核小体内部剪切。

  1. cfDNA片段大小与片段末端和峰的关系

chr12p11.1位点进行更细致的短片段分析,以探究10 bp的周期性,并重新绘制片段末端分布。U末端的峰多出现在核小体中心的上游,而D末端的峰多出现在核小体中心的下游,表明U / D末端与核小体结构具有高度的一致性。使用快速傅里叶变换( FFT )的频率分析显示在U端和D端都有很强的10 bp周期性。由于切割末端的峰位对应于核酸酶切割偏好性更高的位点,通过UD末端峰位组合产生的虚拟片段大小与cf DNA大小分布中的峰值相吻合。结果表明,片段末端不仅可以解释10 bp的周期性,还可以作为cf DNA大小特征中峰值位置的决定因素。

  1. DNA甲基化与cfDNA片段大小的关系

为探索决定切割末端的核酸酶偏好性的分子调控因子,对健康对照、肝细胞癌患者和肺腺癌患者的血浆cf DNA进行NEBNext Enzymatic Methyl-seq ( EM-seq )。首先分析chr12p11.1位点,根据cfDNA分子所携带的CpG二核苷酸的DNA甲基化水平,将cfDNA分子分为高甲基化和低甲基化两类,然后分别统计这两类cfDNA分子在核小体中的大小和末端分布(a – f)。在健康对照和癌症患者中,CpG二核苷酸低甲基化的cf DNA分子的明显较短。进一步在全基因组范围内探讨DNA甲基化与cf DNA片段大小的关系,发现cfDNA片段大小和DNA甲基化水平之间存在正相关(g - i);此外,DNA甲基化也呈现出较强的10 bp周期模式,峰值位置接近于其大小分布,与核小体周围DNA甲基化模式的周期模式相呼应。

  1. DNA甲基化与核小体可及性的关系

接着探讨核小体可及性是否是连接DNA甲基化和cf DNA片段化的媒介。研究表明,DNA甲基化在造血干细胞(HSCs )中水平最高,随着造血分化逐渐降低。ATAC-seq数据结果显示,造血干细胞的片段明显长于分化细胞(ab)。建立条件性敲除Dnmt3aDnmt3b基因(Dnmt3缺失)的小鼠模型,即缺乏编码从头DNA甲基化所必需的酶,其中1Dnmt3缺失样本中~ 200 bp (即含有完整核小体的片段)的峰甚至消失。作者又分析新方法生成的数据集,它们是由Tn5酶切后再进行亚硫酸氢盐测序,从而可以直接测量Tn5酶切后的DNADNA甲基化水平。发现低甲基化DNA片段的大小确实明显短于高甲基化DNA片段(d-f)。

  1. 甲基化DNA末端模体模式的改变

为进一步阐明细胞凋亡过程中DNA甲基化和酶切之间的联系,利用无细胞甲基化DNA免疫共沉淀-测序( cfMeDIP-seq ),该方法捕获了含有甲基化CpGcfDNA分子,与全基因组鸟枪法测序相比,可以富集甲基化的cfDNA。分析cfMe DIP - seq与普通cf DNA鸟枪法测序数据配对的数据集,分析显示,cfMeDIP - seq实验中CCCA末端基序的出现频率与配对鸟枪法测序数据相比显著增加。

  1. E-index用于癌症诊断

考虑到cf DNA切割末端和片段大小之间的内在联系,作者想探究cf DNA末端模式是否可以作为泛癌症诊断生物标志物。分析每个基因组位点作为片段末端的频率,以模拟背景cfDNA末端偏好性,然后对每个待评估样本,采用加权平均法测量其cf DNA末端与模型的一致性水平,称之为' E-index'

调查了包含健康对照、HCC和肺癌患者的cf DNA数据集, ROC 曲线显示,E-index可以很好地区分HCC和肺癌样本与对照组,AUC分别为0.770.91E-index数值与肿瘤样本中的肿瘤DNA载量呈显著负相关(a-c)。进一步分析两个泛癌数据集,E-index在大多数癌症样本(脑癌、结直肠癌、肺癌)中显著较低,并且在区分癌症患者和对照中表现出显著的能力(d - h);此外,转移性肺癌患者的E-index显著低于非转移性肺癌患者,并且E-index有良好的区分这两类的能力(f)

总结

  • 1.短cf DNA分子的片段末端与长cf DNA分子的片段末端存在显著差异
  • 2.短cf DNA分子的片段末端表现出与cf DNA大小模式相似的10 bp周期性表明切割末端与cf DNA大小之间存在内在联系。
  • 3.不同DNA甲基化水平的cf DNA分子表现出截然不同的大小和末端分布。
  • 4.DNA甲基化可能通过DNA甲基化-核酸酶偏好性-切割末端大小分布轴作为cf DNA片段化的关键调节因子
  • 5.DNA甲基化作为一种重要的表观遗传调控因子,在正常细胞中受到严格调控且高度保守,导致背景cf DNA具有相对稳定的片段化特征;然而,在胎盘组织和恶性肿瘤细胞中,整体DNA甲基化水平降低:表明低DNA甲基化可能是血浆中胎儿和肿瘤来源的cfDNA缺乏的一个普遍分子因素。

An Y, Zhao X, Zhang Z, et al. DNA methylation analysis explores the molecular basis of plasma cell-free DNA fragmentation. Nat Commun. 2023;14(1):287. Published 2023 Jan 18. doi:10.1038/s41467-023-35959-6

 

2023年3月1日 11:49
浏览量:0
收藏