余宏杰课题组在新冠病毒的基因监测和数据共享领域取得进展

更新日期:  |  点击数:1639

近期,复旦大学余宏杰课题组在新冠病毒的基因监测和数据共享领域取得重要进展。研究结果以“Global landscape of SARS-CoV-2 genomic surveillance and data sharing”为题,于2022年3月28日在线发表在Nature Genetics(论文链接:https://www.nature.com/articles/s41588-022-01033-y)。

新型冠状病毒(Severe acute respiratory syndrome coronavirus 2, SARS-CoV-2)在自然选择和免疫压力下可以发生突变,变异毒株因其传播能力、致病能力和免疫逃逸能力的改变,可能会引起疫情的再次暴发流行。基因监测可以及时捕获SARS-CoV-2的突变和进化,为疫苗毒株和抗病毒药物的评估和重新选择提供科学依据。若基因监测不及时或不完整,则会使得某些变异株隐匿传播,容易造成大规模扩散和变异株的再次变异。自新冠肺炎暴发以来,SARS-CoV-2的基因监测策略受限于监测目标、资源可及性和测序平台等因素在全球各国间存在较大差异,全球基因监测网络及其异质性的程度尚未阐明。

从基因监测网络中产生的基因数据需及时上传到公共平台,以便全球科学家进行变异株的溯源和评估。SARS-CoV-2基因测序数据的不充分和不及时共享将限制其种系发生和地理扩散研究的准确性。是否所有国家和地区都会充分共享SARS-CoV-2的基因数据也不得而知。

为此,余宏杰课题组开展了一项研究,通过收集全球各国的基因监测方案、官方报道的变异株数据及公共平台上的基因测序数据,构建了一系列评价指标,分析了SARS-CoV-2基因监测的异质性、基因测序数据的特性和质量、基因数据的共享程度,以及引起关切变异株(Variants of concern, VOCs)的发现和全球传播。

研究结果显示,截至2021年10月31日,38.1%、14.4%、21.2%的国家分别开展了高、中、低水平的SARS-CoV-2常规基因监测,另外有26.3%的国家进行了有限的基因监测。有限的基因监测主要集中在中东和非洲地区。基因监测方案的差异性还体现在监测目标人群、采样方法和测序方法等方面。在实现测序能力的可及性方面,96个国家的可及性较高,70个国家仍需依赖国际、区域或其他国家的支持。

图1. 全球SARS-CoV-2基因监测策略和测序可及性

研究进一步分析了基因测序数据的特性和质量,包括测序平台和技术、序列数量、测序比例、序列周转时间、序列元数据的完整性等,结果显示各国存在测序程度和基因元数据质量的差异。研究还探讨了这些差异的潜在影响因素。

此外,本研究还系统评估了各国VOC序列的共享程度,发现有37%的国家共享了<50%的基因测序数据。Alpha, Beta, Gamma和Delta变异株序列共享<50%的国家的比例分别为36.1%、17.0%、16.2%和33.3%。总体而言,高收入国家的基因数据共享程度高于非高收入国家。最后,本研究利用基因测序数据描绘了各种VOC在全球出现、流行和传播的全貌。

图2. 各国VOC变异株基因测序数据的共享程度

本研究定量评估了全球SARS-CoV-2基因监测的异质性,为完善全球基因监测网络提供了科学依据。基因序列元数据的完整性较差,提示未来需要规范基因测序数据的质控和共享。此外,本研究还揭示了部分国家虽然进行测序,但受限于主客观因素导致其基因测序数据并未充分共享。因此,为及时应对未来可能出现的变异株,全球应扩大基因监测的合作,对基因测序数据共享的流程进行标准化,提高基因测序数据共享的及时性和完整性,从而让基因数据更好地服务于公共卫生决策。

复旦大学2020级硕士生陈志元为第一作者,复旦大学公共卫生学院教授、复旦大学附属华山医院感染病科和上海市重大传染病和生物安全研究院双聘PI余宏杰为通讯作者。此研究得到国家自然基金委重点项目(82130093)等项目的资助。