韩 达 课 题 组

韩 达 课 题 组

NAT BIOMED ENG丨通过低深度测序对低频DNA变体进行选择性多重富集检测和定量分析

作者:马倩

img1

由于合成测序法中的固有错误,等位基因低于1%DNA序列变体难以通过测序进行量化。尽管分子识别条形码可以使用下一代测序(NGS)来检测变异等位基因频率(VAF低至0.1%的突变,但仍需要超过25,000x的测序深度,因此阻碍了临床患者样本以及研究中使用的大多数样本的高灵敏度突变检测本研究表明,利用聚合酶链反应和阻断核苷酸,通过低深度多路复合NGS扩增后,可以检测到中位数为300倍的低频DNA变异。利用80-plexNGS panel250x测序深度,可以检测到VAF0.019%的单核苷酸突变以及VAF0.07%的人类细胞系污染。通过16-plex NGS panel覆盖涉及黑色素瘤的9个基因的145个突变,作者检测了19份新鲜冷冻的肿瘤活检样本,其7份中检测到低VAF突变(0.2~5%),这表明肿瘤的异质性明显之前的认知更高。 

高通量合成测序,也被称为下一代测序(NGS),是在许多遗传位点用于DNA的高度多重表征的最有力的方法之一。下一代测序通常用于检测等位基因频率≥5%DNA序列变异。然而,标准NGS panelVAF检测极限(LoD)介于1~5%之间。基于独特的分子标识符(UMI)的纠错方法可以规避NGS固有误差限制以实现约0.1% SNV LoD但这些通常需要25000x极高深度测序这导致每个样品NGS花费超过$1000超出许多研究人员临床医生和患者的承受范围。同时,对于在低VAF下高灵敏度检测DNA序列变体的研究和临床需求却不断增长。对于其中需要低VAF检测实例包括无细胞DNAcfDNA信息分析非侵入性癌症治疗的指导和后处理监测稀土微生物检测微生物谱和细菌亚群分析。数字PCR和等位基因特异性PCR可用于检测和定量VAF低至0.1%的一种或几种可疑DNA变异体,但无法合理扩展以满足研究和临床应用的多重需求。 

本文介绍了多重阻断剂置换扩增(mBDA,这是一种文库制备方法,仅使用250x的测序深度,对VSF低至0.019%SNV进行稳健的NGS检测和定量分析多重BDA通过在多重PCR靶标富集步骤中选择性富集DNA序列变体来发挥功能。与其他等位基因富集方法不同,mBDA可以很好地扩展到多样panel。因为后mBDA NGS库显示VAF远远超过NGS固有错误率,所以低深度测序足以进行变体检测,并且不需要纠错。通过将所需的NGS reads数量减少100倍以上,mBDA在低通量NGS仪器(例如Illumina MiSeq)上实现了以非常低的VAFDNA变体进行可负担的测序。 

mBDA方法允许通过合理设计与理想SNP等位基因完美结合的“阻断剂”寡核苷酸,对单核苷酸多态性(SNP)等位基因进行高度多重的序列选择性PCR扩增。阻断剂的结合域与正向PCR引物的结合区域重叠,导致竞争性杂交反应,其中正向引物必须置换阻断剂才能DNA模板结合(图2(a))。阻断序列被设计成比正向引物更牢固地结合到带有预期的SNP等位基因的DNA模板上,但不那么牢固地结合到带有变异SNP等位基因的DNA模板上。因此,与野生型模板相比,每个PCR循环以明显更高的产量扩增了变异模板。通过PCR循环的过程,变异等位基因可以比野生型等位基因优先以1,000倍的效率进行扩增。

img2

 图2:使用mBDA富集等位基因可以使用低深度测序检测稀有变体。

DNA到文库,mBDA NGS文库制备工作流程耗时不到6小时;该过程总结在图2b中。为了证明通过mBDA进行等位基因富集,作者构建了一个针对80个常见人类SNP80-plex mBDA NGS panel。当将NA18537等位基因视为野生型时,NA18537和NA18562 gDNA以99.8%:0.2%比例混合作为易于配制的参考样品,在所有80个SNP位点中均有0.2%的VAF。图2c显示了使用标准多重PCR靶标富集工作流程对0.2%的VAF样品进行的Illumina MiSeq测序结果。与每个SNP位点的变异等位基因对齐的读取数比预期等位基因低约500倍,符合预期。图2d中显示了NA18537:NA18562(99.8%:0.2%)样品的不同等分试样的mBDA NGS结果。尽管使用的总读取量比标准扩增子NGS文库少9倍,但mBDA NGS文库显示出更高的变体等位基因读取深度,因为预期的等位基因读取数量大大减少了。图2e显示了每个SNP基因座的变异读段数(VRF),中值VRF从标准NGS库中的0.2%增加到mBDA NGS库中的约30%。因此,此处的变异SNP等位基因富集了150倍的中位数。 

mBDA NGS用于VAF变体检测

接下来,作者mBDA NGS方法应用于具有低比例(0.07~0.25%)同种污染物的DNA样品(图3a)。由于mBDA NGS库所需的NGS读数显着减少,因此能够在单个Illumina MiSeq芯片上运行21个不同的DNA样品。在每个文库中,杂合等位基因(绿色阴影区域)和纯合变异等位基因(橙色区域)的VAF通常与预期一致,>80%VAF在每组中位数的两倍内。 

img3

3:使用mBDA NGS检测和定量低VAF的变体。

基于NGS数据的污染物识别 

在人类细胞系污染的特定应用中,mBDA NGS数据可用于告知污染物的具体身份。在这种情况下,将建立一个已知的可能污染物基因型的数据库,并将mBDA NGS结果与每种潜在污染物的基因型进行比较。其中PrTP)是基于图3d的真实阳性的概率,而TP是基因型j的真实阳性的数量,TN是真实阴性的数量,FP是错误阳性的数量,FN是基因型的数量假阴性。图4a示出了两种不同基因型的似然性计算的图形实例。正确的比较基因型比不正确的基因型具有更高的可能性L 

img4

4:基于mBDA NGS数据确定污染物种类

4b显示了图3a中21个mBDA NGS文库和35个不同比较基因型的每个成对组合的L的对数转换值。故意从数据库中保留了污染物D40的基因型,以观察未知污染物的影响。在除D40以外的所有情况下,正确的基因型均产生最高的L值。在D40污染的情况下,没有比较基因型产生很高的L,但所有L值均明显高于未污染的DNA样品(图4c)。对于污染物含量极低的样品,正确的污染物基因型的L值降低了(图4d); D10污染物样品的污染物分数最低(0.07%),对应于正确基因型的最低L值。但是,基于L的第二高值的分布,甚至可以以六个标准的置信度偏差(P <10)可靠地调用D10。 

使用qPCR筛选细胞系污染 

定量PCRqPCR)由于其可靠性,易用性和较短的周转时间,是迄今为止最常用的检测DNA标记的方法。定量PCR可以有效地用于检测已知污染物的独特DNA序列。例如,基于qPCR的人类细胞株支原体污染检测可以作为检测物种间污染的一种方法而建立起来。但是,存在许多潜在的人类细胞系污染物。研究报告称,最常见的十大污染物合计仅占所有已知污染案例的50%目前尚无qPCR方法可检测任意同种DNA污染的报道。 

在这里,作者将mBDAqPCR联合,可用于构建快速且易于使用的测定法,以检测任意同种细胞或DNA污染。在mBDA qPCR实施方案中,设计了一个mBDA引物-阻断剂组,可特异性抑制所需细胞系纯合的SNP等位基因组。当一组选定的SNP足够大时,任何污染性DNA的基因型都可能与panel至少一SNP中所需的细胞系不同。双链嵌入染料(如SybrGreen)可用于报告PCR扩增子的总量。在具有无限EF的理想mBDA qPCR实施方案中,未受污染的细胞系DNA样品不会产生扩增。将mBDA panel减小到40-plex可以显着改善我们的qPCR LoD(用于检测污染物),而减小到21-plex则可以带来额外的边际改进。 

图5a,b显示了使用21-plex SNP分析法对NA18537中具有各种HeLa污染物组分的DNA样品进行qPCR检测。选择HeLa作为污染物是因为它是人类细胞和DNA污染的最常见来源,约占所有报告病例的25%。在以NA18537作为预期基因型的qPCR分析中的21个SNP位点中,HeLa具有17个变异等位基因(图5a)。在未污染的NA18537与带有0.1%HeLa的NA18537中观察到的平均qPCR Ct 值在统计学上有显着差异。 

img5

5:使用带有qPCRmBDA检测细胞系污染。

由于污染物与21-plex SNP位点中的预期细胞系具有相同基因型的可能性很小,作者期望21-plex qPCR分析能够检测到任意人类突变。为了从实验上支持该假设,接下来在NA18537上进行了21-plex mBDA qPCR分析,使用了来自37个不同人类DNA样品的5%污染物(图5c)。污染物包括来自普通细胞系的DNA以及来自志愿者的DNA。所有5%的污染物的样品可从未被污染样品中识别出来。 

基于qPCR,Sanger和NGS的细胞测定都可用于肿瘤靶向治疗中的1~5%之间突变VAF的检测。然而,靶向治疗的选择性压力下,肿瘤亚克隆与抗药性突变能迅速扩大并导致治疗失败或癌症复发。因此,对低VAF耐药性突变的可靠检测可以为个性化治疗选择提供信息,包括使用联合疗法来改善患者预后。为了应对这一挑战,作者接下来构建了一个由16-plex mBDA NGS panel,该panel涵盖了跨越9个基因的145个通常观察到的黑色素瘤突变(图6a)。在BDA富集区则被设计成涵盖了9个基因中最常观察到的突变,基于COSMIC数据库。

img6

6:临床样品上mBDA面板的验证。

作者分析了18个黑色素瘤组织样本,一个非小细胞肺癌(NSCLC组织样本。19个样本中共有7个(37%)的突变具有0.2~5%的低VAF作者发现VAF亚克隆耐药性突变的出现具有高VAF克隆突变的肿瘤样品中概率更高。

img7

1不同NGS方法在分析体细胞突变中的性能比较

临床cfDNA样品验证 

外周血中的无细胞DNA代表了有前途的非侵入性肿瘤分析生物标志物,可用于癌症管理不仅可用于肿瘤活检不方便的情况下的治疗选择,可纵向用于治疗后监测。mBDA也非常适合检测cfDNA突变,因为cfDNA中的变异VAF可能非常低(<1%在这里,作者验证了mBDA NGS panel对于IVNSCLC患者的临床cfDNA样品上的有效性。mBDA panel涵盖了14个基因(AKT1, ALKBRAFDDR2EGFRERBB2KRASMAP2K1METNRASPIK3CAPTENROS1TP53)的31Nuprobe商业开发,作为VarMap NSCLC panel。通过使用UMI进行深度测序,将被称为的突变及VAF与被称为VAF进行了比较。在总共528个基因位点12个样本×44个基因位点)中,观察到78%的阳性一致性比率(14/18)和98.6%的阴性一致性比率(503/510)。对临床样品中VAF低至0.23%的突变进行了定性和定量的分析 

总结

mBDA技术主要针对热点区域中的突变和小的插入/缺失的检测和定量。因此,mBDA非常适合在临床指南(例如国家综合癌症网络的指南)中检测可操作的癌症突变,以及从最初的全外显子组测序或肿瘤活检的全基因组测序分析中发现的个性化突变通过mBDA qPCR分析,研究人员将能够检测不到1%的同种DNA的低水平污染,从而提高了基于细胞系的科学研究的严格性。作为基于mBDANGS面板临床应用的概念验证,作者构建了一个16复式黑色素瘤mBDANGS面板并将其应用于19个肿瘤组织样品。作者发现37%的样本(95%的置信区间为19~58%)包含可检测的亚克隆突变,包括已知的耐药性突变,其 VAF介于0.2~5%之间。接受靶向治疗的患者中耐药性突变的增加通常被认为是治疗期间从头突变的增加和耐药性突变的先前亚克隆的扩大的结合。另外,关于健康衰老个体皮肤中体细胞突变的基因组异质性的报道 表明低VAF和高VAF突变之间的相关性可能是由于尚未完全了解的更复杂的机制所致。 

迄今为止,所有达到0.1%VAF LoDNGS panel都使用UMI,其深度超过25,000x。这使得稀有突变分析仅在具有最高通量NGS的仪器上才可行,例如NovaSeq(表1。但是,高昂的资本支出(NovaSeq大约需要1,000,000美元)使得大多数医院和实验室都无法使用高通量的NGS仪器。通过仅使用250x的深度即可对低VAF突变进行准确和定量的测序,mBDA技术使具有较低通量的NGS仪器(例如,价值50,000美元的MiniSeq)能够分析临床样本中许多基因的低VAF突变。mBDA所需的测序读数减少也表明生物信息学分析时间和数据存储量显着减少。同时促进对低VAF体细胞突变的临床样本的分散NGS测试将加速精密医学的采用,并改善患者的预后。 

 

2021年6月9日 09:28
浏览量:0
收藏