韩 达 课 题 组

韩 达 课 题 组

Cell Reports Medicine丨循环微生物 DNA 作为肺癌早期诊断和复发的生物标志物

 

大家好,今天分享的文献是4月份发表在Cell Reports Medicine上的一篇文章,标题为“Circulating microbiome DNA as biomarkers for early diagnosis and recurrence of lung cancer”

本文的第一通讯作者是北京大学人民医院胸外科邱满堂副研究员。邱满堂副研究员以第一或通讯作者身份(含共同)在Science Translational MedicineScience AdvancesCancer Research等杂志发表SCI论文20余篇,H 指数为 245 篇为 ESI TOP1%高被引论文,成果被 Science Translational Medicine 杂志官网首页推荐,同时被Nature Reviews Clinical Oncology 撰文评述。研究方向为胸部肿瘤早期检测技术研发、肿瘤微环境中的代谢重编程、基于RNA的创新治疗。

研究背景:

肺癌(LC)是全球第二大常见癌症,也是全球癌症死亡的主要原因。LC的预后与癌症患者的诊断分期显着相关,提高早期检出率是降低LC死亡率的关键。然而,超过80%LC首诊时处于疾病晚期;目前胸部CT由于假阳性成像结果率高、辐射暴露和成本较高,需要开发新型早期筛查方法。手术是治疗早期LC患者的首选方法,尽管手术治愈了大多数 I–IIIALC患者,但其中10%-50%的患者会出现复发,特别是术后3年内复发。因此,开发高准确度的方法来提高LC的早期检测和识别术后复发风险高的患者是至关重要的。

肺的粘膜表面暴露在外部环境中,促进了大量微生物群落的定居。这些微生物群落在肺癌的发展、诊断和预后中发挥着重要作用。随着分子生物学和测序技术的进步,Poore等人发现从外周血中提取的循环微生物组DNAcmDNA),即非人类的、微生物衍生的DNA,可以区分多种癌症和健康对照(HC),为癌症液体活检开辟了一种新的范式,并表明cmDNA在癌症检测中是一种有价值的工具。然而,cmDNALC早期诊断和术后复发中的作用未完全揭示。

 

整体设计:

1:本项研究设计

本研究设计如图1所示,共有416名受试者参与了这项研究。对血浆进行5X cfDNA WGS,过滤人源性reads后,使用Kraken2分类、Braken获取cmDNA图谱,从而分析每个受试者的cmDNA特征。

 

结果:

1. LCHCcmDNA图谱

 

2:训练队列中所有参与者的cmDNA组成

测序结果表明,HCLC的人类reads占比分别为98.04%97.25%,微生物reads占比分别为0.012%0.009%。接下来,研究者比较了LCHCcmDNA多样性和组成。在健康人群中,微生物物种总数显著增加;α多样性分析显示,健康组的Shannon多样性和Simpson多样性均显著高于LC组。在门水平上,变形杆菌、放线杆菌和厚壁菌在两组中的循环微生物群落中占主导地位,其次是拟杆菌和子囊菌(图2A)。

假单胞菌属的相对丰度在LC组显著更高,棒杆菌属的相对丰度在HC组更高(图2B)。研究者对15cmDNA患者的肺组织进行了肿瘤内微生物组分析,包括肿瘤组织和配对的正常组织,发现假单胞菌序列也在肿瘤组中丰富,尽管没有达到显著性差异。cmDNA20个富集种主要属于变形杆菌门,其中包括产氮假单胞菌和荧光假单胞菌等在LC组明显增多(图2C)。此外,根据肿瘤大小和肿瘤分期划分的不同LC亚组之间的cmDNA分析显示,cmDNA组成在目水平上保持相对稳定(图2D)。

2. cmDNA panel作为早期肺癌的诊断标志物

3:差异类群鉴定和肺癌检测模型开发

β多样性显示,LC患者和HC之间cmDNA存在显著差异(图3A)。研究者进行了线性判别分析(LEfSe),以进一步比较cmDNA微生物特征(图3B)。随后,研究者鉴定出46种在LC患者中富集的菌种和130种在HC中富集的菌种,这些菌种可能与肺癌相关(图3C)。研究者进一步选取了119个平均下降精度得分>1的重要特征进行随机森林机器学习模型开发。该模型的受试者工作特征曲线下面积(AUC)为95.6%,灵敏度为81.2%,特异度为90.7%,准确度为86.8%(图3D)。此外,研究者评估了cmDNA panel对于不同肿瘤大小的区分能力:通过五重交叉验证检验各亚组间的区分度,他们发现cmDNA panel对于识别肿瘤较小(<1 cm)和肿瘤较大(>1cmAUC分别是91.5%94.0%(图3E)。

研究者分别在两个独立的验证数据集中评估了检测模型的性能。在独立验证ILC以早期疾病居多(I期,45/48,93.8%),而独立验证II中的LC患者处于晚期(III-IV期,33/33,100.0%)。该模型在外部验证中显示出很高的AUC值,在验证I和验证II中分别为92.1%95%置信区间[CI]: 86.7%-97.5%)和97.2% 95% CI: 93.7%-100.0%)(图4A)。当合并两个验证队列时,该模型的灵敏度为87.7% 95% CI: 78.0%-93.6%),特异性为79.4% 95% CI: 67.5%-87.9%), AUC93.2% 95% CI: 89.2%-97.2%)(图4A4B)。此外,在两个验证数据集中,LC患者的预测癌症评分明显高于HC患者(图4C)。为了进一步评估该模型的稳健性,在一个独立的小型验证数据集中将WGS测序深度降低到1X后,这些癌症患者的预测癌症评分仍高于截断值(图4D)。

4:肺癌检测模型的独立验证

3. cmDNA 特征作为肺癌复发的预测标志物

研究者接下来研究了cmDNA微生物特征与临床T1LC切除患者复发的关系。研究者建立了LC早期复发队列,包括36例术后3年内复发的患者(R组)和65例长期存活3年以上无复发的患者(NR组)。R组和NR组的患者在年龄、性别、吸烟史、肿瘤直径和病理方面匹配。

561LC患者的R组和NR组差异cmDNA

随后,研究者将复发队列按64的比例随机分为训练组和测试组。在训练组中,cmDNA来自61LC患者(22R39NR)的血浆样本。接下来,研究者研究了cmDNA微生物类群在属和种水平上的变化:在属水平上,不动杆菌属、丛毛单胞菌属和大肠埃希氏菌属等是训练集中最丰富的属(图5A);在种水平上,研究者确定了R组和NR组之间微生物组成中最丰富的五个物种,即贝雷兹不动杆菌、约翰森不动杆菌、洛菲不动杆菌、睾丸酮丛毛单胞菌和痤疮皮肤杆菌(图5B)。 研究者通过LEfSe分析发现R组富集23个类群,NR组富集39个类群,这些类群可能与术后复发有关(LDA >2, p < 0.05)(图5C)。

6:术后复发预测模型

随后,研究者探索了利用cmDNA特征来区分R组和NR组患者的可行性。5倍交叉验证的准确率为85.3%,平均AUC值为87.3%。该模型基于cmDNA特征,在训练集中的灵敏度为72.7%,特异性为84.6%AUC88.1% 95% CI, 79.7%-96.6%)(图6A)。在测试集中,该模型的灵敏度为71.3%,特异性为84.6%AUC80.9%(图6B)。研究者观察到,R组的预测复发评分在训练集和测试集上显著高于NR组(图6C)。Kaplan-Meier生存曲线显示,高危组的无复发生存期(RFS)明显短于低危组 (图6D)。图6E中展示了随机森林分析得出的前20个关键分类群。重要的是,研究者发现嗜甲基菌科与RFS显著相关(图6F)。

 

总结:

本研究开发了一种基于cmDNA的诊断模型,可以有效地区分早期LC患者和非癌症对照。研究结果还表明,cmDNA作为一种有希望的术后复发生物标志物,可以显著改善患者的预后。

 

全文链接:

https://www.cell.com/cell-reports-medicine/fulltext/S2666-37912400167-8

2024年6月20日 11:26
浏览量:0
收藏