韩 达 课 题 组

韩 达 课 题 组

课题组工作丨SCIENCE ADVANCES丨用于快速诊断呼吸系统感染类型的自动化DNA分子计算平台

由细菌或病毒病原体引起的急性呼吸道感染(acute respiratory infectionARI是寻求医疗服务最常见的原因。对ARI的病原学进行快速、准确的诊断与分类,不仅有助于及时制定治疗方案,而且可以防止抗生素的不当使用。当前的临床常用的血常规与C反应蛋白(CRP)在判定感染类型中存在着准确率不足的挑战。此外,尽管宏基因组测序和基因芯片可以通过测量样本并与已知致病菌或致病病毒的序列信息进行比对来发现感染类型,但受限于较长的检测时间与较高的检测成本,使得其临床应用极具挑战。因此,当前临床仍然缺乏快速准确区分病毒与细菌引发ARI的分子诊断方法。

2022年11月25日,中科院基础医学与肿瘤研究所/上海交通大学医学院分子医学研究院-谭蔚泓院士/韩达研究员/张朝副研究员课题组在Science Advances上发表了题为“An automated DNA computing platform for rapid etiological diagnostics”的研究。该研究设计了一种基于宿主免疫细胞基因表达谱的快速分类方法。通过人工智能模型筛选得到一个由7个基因组成的表达谱模型(Result=CARG1×1+CCD177×4+CVNN1×5-CIFIT1×1-CTRDV3×1-CSIGLEC1×4-CLY6E×4,C表示浓度,Result>0为细菌感染,Result<0为病毒感染)并进一步通过设计核酸分子计算探针精准执行表达谱模型中的数学运算,可实现“样本入-结果出”式的全自动化分子诊断,最终实现快速、精准、低成本地区分临床病人血液中的细菌与病毒感染类型,有望为临床多靶标的分子诊断提供全新的解决方案。

基于DNA的分子计算已被实验证明可以在不同的基质上实现复杂的计算[4-6]。随着分子编程方法的发展,不同的逻辑(如AND、OR和NOR)和算法(如权重、加总和减法)可以在分子水平上得到实现[7-9]。从应用的角度上讲,DNA分子计算曾被开发以解决数学中NP-complete问题,并进一步推广到解决计算机中的图像识别问题 [10-11]。此外,韩达团队通过开发新型探针和核酸扩增方法,成功将DNA计算方法推广到基于多靶标的复杂疾病(如恶性肿瘤)临床诊断领域 [12-13]。总体来说,DNA分子计算技术不仅可以将诊断方法的应用从单个标志物扩展到多个标志物,还可以将多标志物的诊断模型在分子层面进行整合,完成诊断结果的直接报告,从而实现智能式的诊断。如图所示(图1),基于DNA计算的分子分类器的工作流程包括三个主要步骤[14-15]。首先,利用数据库中病毒和细菌ARI病人血液中的转录组数据,用支持向量机构建分类器模型。其次,设计了一种基于DNA的分子分类器,可在分子水平上执行构建的理论模型。它可以对样本中的转录组分子信号进行“原位”加权、求和、减法等算术运算,并以不同荧光输出的方式报告分类结果。最后,将分子分类器用于临床样本感染类型的分类。

图1 分类模型的构建

本研究中,研究人员首先利用数据库中公开可用的基因表达谱数据,通过数据挖掘筛选差异基因,用支持向量机等训练分类器模型,获得了一个由七个基因组成的表达谱模型。然后,设计基于DNA的分子分类器,在分子水平上的执行七个基因的模型运算公式(Result=CARG1×1+CCD177×4+CVNN1×5-CIFIT1×1-CTRDV3×1-CSIGLEC1×4-CLY6E×4,C表示浓度,Result>0为细菌感染,Result<0为病毒感染),最终以不同荧光输出的方式报告分类结果(报告红色荧光代表细菌感染,报告绿色荧光代表病毒感染)。到目前为止,DNA分子已经被应用于从癌症筛查的计算模型中生成诊断信息,且不需要计算机的帮助,但仍有人为干预,如样品制备和装载,阻止了基于DNA计算的诊断的完全自动化的实现。通过将样本加载、标记物扩增、分类器和结果报告整合到一个自动化平台将提供一种更快速、准确的方法(图2a)。因此,研究人员设计了一套自动化平台,具体包括:(1)自动核酸提取:用于样本的加载,核酸纯化与提取;(2)自动加样系统:用于样本的加样与转运;(3)温度控制:用于调控反应的温度;(4)结果报告:通过不同的荧光输出报告分类结果。

为了证明该方法是一个可靠、方便的临床诊断平台,需要满足两个关键因素。首先是在临床样本中对ARI进行准确分类。二是满足临床实验室需求的高吞吐量和自动化水平。作者接下来对18例合成样本进行细菌性和病毒性ARI的分类,分类准确率达到94%(图2b,c)。对80例临床样本进行细菌性和病毒性ARI分类,在4小时的诊断周期中达到了86%的准确度,其中,灵敏度为85.0%(95% CI:0.6947 ~ 0.9375),特异性为87.5%(95% CI:0.7239 ~ 0.9530)(图2d,e)。而在同一队列样本中,临床最常用的C-反应蛋白(CRP)检测和全血计数(CBC)检测的准确率分别为74%和54-62%(图2f)

图2 自动化检测流程图和分类结果分析

与现有的ARI快速诊断方法相比,自动化DNA计算方法在准确性高、周转时间快、自动化程度高等方面具有一定的优势。数据训练和建模,加上胜者通吃计算方案的实现,可实现“免数据处理”式的多靶标分子诊断。使用该系统对基因表达进行分类所需的工作量与分析中使用的基因数量无关,因为DNA计算允许并行引入多个输入。相比之下,RT-qPCR是目前临床中定量基因表达谱的金标准,其复杂性与被分析的基因数量成比例相关,因为更多的基因需要更多的人力资源来进行繁琐的、循序渐进的单个RNA定量。其次,如果使用常用的384孔板,整个系统可以每台机器每天进行多达600-1200次测试。最后,该方法的诊断准确性高于现有的临床方法。这进一步证明了在临床应用中利用宿主外周血转录谱进行疾病病因诊断的潜力。

参考文献

[1] S. C. Sealfon, T. T. Chu. Methods in molecular biology (Clifton, N.J.) 671, 3-34 (2011).

[2] R. Stark, M. Grzelak, J. Hadfield. Nature reviews. Genetics 20, 631-656 (2019).

[3] E. L. Tsalik et al. Science translational medicine 8, 322ra311 (2016).

[4] Q. Liu et al.. Nature 403, 175-179 (2000).

[5] D. Han et al. Nature chemistry 7, 835-841 (2015).

[6] R. S. Braich, N. Chelyapov, C. Johnson, P. W. Rothemund, L. Adleman. Science 296, 499-502 (2002).

[7] D. Fu, S. Shah, T. Song, J. Reif. Methods in molecular biology 1772, 411-417 (2018).

[8] X. Chang et al. Journal of the American Chemical Society 141, 12738-12743 (2019).

[9] Q. Gao et al. Angewandte Chemie 59, 23564-23568 (2020).

[10] L. M. Adleman. Science 266, 1021-1024 (1994).

[11] L. Qian, E. Winfree, J. Bruck. Nature 475, 368-372 (2011).

[12] C. Zhang et al. Nature nanotechnology 15, 709-715 (2020).

[13]. C. Zhang et al. Angewandte Chemie International Edition 61, e202117658 (2022).

[14] L. Qian, E. Winfree. Science 332, 1196-1201 (2011).

[15] R. Lopez, R. Wang, G. Seelig. Nature chemistry 10, 746-754 (2018).

原文链接:https://www.science.org/doi/10.1126/sciadv.ade0453

第一作者:马倩博士

通讯作者:谭蔚泓院士,韩达研究员,张朝副研究员

 

2022年12月5日 21:42
浏览量:0
收藏