首页 >资讯
我国科学家在Cell Host & Microbe期刊发文揭示新型冠状病毒2019-nCoV的基因组
发布时间:2020/02/11

世界卫生组织(WHO)将一种新型冠状病毒命名为“2019年新型冠状病毒(2019-nCoV)”。它是最近于2019年12月初在中国湖北省武汉市开始的肺炎疫情的罪魁祸首。这次疫情与一家大型的海鲜和动物市场有关,目前正在开展调查以确定这种病毒感染的来源。迄今为止,中国已经确诊了成千上万例人类感染病例并向全球传播了许多病例。

冠状病毒主要引起呼吸道和胃肠道感染,并且在遗传学上被分为四个主要的病毒属:甲型冠状病毒(Alphacoronavirus)、乙型冠状病毒(Betacoronavirus)、丙型冠状病毒(Gammacoronavirus)和丁型冠状病毒(Deltacoronavirus)。前两个属主要感染哺乳动物,而后两个属主要感染鸟类。人们先前已鉴定六种人类冠状病毒,包括HCoV-NL63和HCoV-229E,它们属于甲型冠状病毒;HCoV-OC43、HCoV-HKU1、重症急性呼吸综合征(SARS)冠状病毒(SARS-CoV)和中东呼吸综合征(MERS)冠状病毒(MERS-CoV),属于乙型冠状病毒。直到2003年SARS大流行、2012年MERS疫情和近期的2019-nCoV疫情发生后,冠状病毒才引起全球关注。SARS-CoV和MERS-CoV被认为是高致病性的,而且SARS-CoV和MERS-CoV可能由蝙蝠传播给果子狸或单峰驼,最后传播给人类。


冠状病毒的基因组大小在26000至32000个碱基之间,包括可变数量(6至11个)的开放阅读框(ORF)。第一个ORF大约占整个基因组的67%,编码16种非结构蛋白(non-structural protein, nsp),剩下的ORF编码辅助蛋白和结构蛋白。四种主要的结构蛋白是刺突表面糖蛋白(S)、小包膜蛋白(E)、基质蛋白(M)和核衣壳蛋白(N)。S蛋白在结合到宿主细胞表面上的受体中起着至关重要的作用,并且决定着宿主趋向性。

SARS-CoV的S蛋白和MERS-CoV的S蛋白通过不同的受体结合结构域(RBD)与不同的宿主受体结合。SARS-CoV使用血管紧张素转换酶2(ACE2)作为主要受体之一,并使用CD209L作为替代受体,而MERS-CoV使用二肽基肽酶4(DPP4,也称为CD26)作为主要受体。初步分析提示着2019-nCoV与蝙蝠SARS样冠状病毒(SARS-like CoV)具有密切的进化关联性。

在一项新的研究中,来自中国医学科学院北京协和医学院、中国疾病预防控制中心病毒病预防控制所、中南大学、苏州大学和湖南大学的研究人员根据新冠状病毒2019-nCoV---的前三个已确定的基因组,即Wuhan/IVDC-HB-01/2019(GISAID登录号:EPI_ISL_402119)(HB01),Wuhan/IVDC-HB-04/2019( EPI_ISL_402120)(HB04)和Wuhan/IVDC-HB-05/2019(EPI_ISL_402121)(HB05),对这种病毒进行了深入的基因组注释,并与相关冠状病毒进行了比较,这些相关冠状病毒包括1008个人SARS-CoV,338个蝙蝠SARS-like CoV和3131个人MERS-CoV,它们的基因组在2020年1月12日(发布日期:2019年9月12日)之前已在病毒病原体数据库(Virus Pathogen Database)、分析资源(Analysis Resource, ViPR)(http://www.viprbrc.org)和美国国家生物技术信息中心(NCBI)上发表。相关研究结果于2020年2月7日在线发表在Cell Host & Microbe期刊上,论文标题为“Genome Composition and Divergence of the Novel Coronavirus (2019-nCoV) Originating in China”。

对这三种2019-nCoV毒株的基因组序列进行比较显示它们几乎是一样的,在大约29.8 kb的基因组中仅有5个核苷酸不同。对2019-nCoV基因组进行注释后发现它有14个ORF,编码27种蛋白(图1A)。位于这种基因组5'末端的orf1ab和orf1a基因分别编码pp1ab和pp1a蛋白。这两种蛋白总共包含15种nsp,具体为nsp1至nsp10和nsp12至nsp16(图1A)。这种基因组的3'端包含四种结构蛋白(S、E、M和N)和八种辅助蛋白(3a、3b、p6、7a、7b、8b、9b和orf14)。在氨基酸水平上,2019-nCoV与SARS-CoV非常相似,但也有一些显著差异。比如,8a蛋白存在于SARS-CoV中,而在2019-nCoV中不存在;8b蛋白在SARS-CoV中为84个氨基酸,但在2019-nCoV中则较长,为121个氨基酸;3b蛋白在SARS-CoV中为154个氨基酸,但在2019-nCoV中则较短,只有22个氨基酸。还需开展进一步的研究来阐明这些差异如何影响2019-nCoV的功能和发病机理。

图1.2019-nCoV的基因组组成和系统进化树,图片来自Cell Host & Microbe, 2020, doi:10.1016/j.chom.2020.02.001。


正如利用分子进化遗传学分析(MEGA)(版本7.0)构建出的基于全基因组的系统进化树(图1B和S2)所显示的那样,2019-nCoV与MERS-CoV、蝙蝠SARS-like CoV和SARS-CoV处于相同的乙型冠状病毒进化枝中。这种系统进化树分为两个进化枝。乙型冠状病毒属构成一个进化枝,而甲型冠状病毒、丙型冠状病毒和丁型冠状病毒属构成另一个进化枝。2019-nCoV与蝙蝠SARS-like CoV平行进化,而SARS-CoV由蝙蝠SARS-like CoV进化而来,这表明就全基因组序列而言,相比于SARS-CoV,2019-nCoV与蝙蝠SARS-like CoV存在更密切的亲缘关系。 

相关数据还显示2019-nCoV的基因组与蝙蝠SARS-like CoV(MG772933)的基因组具有最高相似性。相比之下,2019-nCoV与MERS-CoV的进化距离较远,亲缘关系也不密切。针对pp1ab、pp1a、E、M、7a和N基因的编码蛋白的系统进化树分析显示2019-nCoV最接近于蝙蝠SARS-like CoV(图1C)。就S基因而言,2019-nCoV最接近于蝙蝠冠状病毒,而它的3a和8b基因都最接近于SARS-CoV。尽管不论是在整个基因组上还是在单个基因上的系统进化树分析都明确表明,2019-nCoV与蝙蝠SARS-like CoV存在最密切的亲缘关系(图1B和1C),但是这些研究人员没有发现单个蝙蝠SARS-like CoV毒株含有的所有蛋白都与2019-nCoV最为相似(图1B和1C)。

鉴于2019-nCoV与SARS-CoV或蝙蝠SARS-like CoV之间存在密切的亲缘关系(图1B和1C),对不同蛋白中氨基酸替换的研究可能能够揭示2019-nCoV在结构和功能上与SARS-CoV有何不同。在2019-nCoV(HB01)的氨基酸序列与SARS-CoV和蝙蝠SARS-like CoV的对应共有序列(consensus sequence)之间共有380个氨基酸替换(图2)。在nsp7蛋白、nsp13蛋白、E蛋白、M蛋白、辅助蛋白p6和8b中均未发生氨基酸替换。nsp3和nsp2中分别有102个和61个氨基酸替换。此外,在长1273个氨基酸的S蛋白中发现了27个氨基酸替换,包括RBD中的氨基酸区域357-528有6个氨基酸替换,在基础亚结构域(SD)中的氨基酸区域569-655有6个氨基酸替换。此外,在受体结合亚基S1结构域的C端(图2)存在的4个氨基酸替换(Q560L、S570A、F572T和S575A)位于两个以前被报道为SARS-CoV抗原的肽中。

图2.2019-nCoV相比于SARS-CoV和SARS-like CoV发生的氨基酸替换,图片来自Cell Host & Microbe, 2020, doi:10.1016/j.chom.2020.02.001。


由于对这种新型病毒的了解非常有限,这些研究人员无法对2019-nCoV与SARS-CoV或SARS-like CoV之间存在的大量氨基酸替换给出合理的解释。比如,2019-nCoV和SARS-CoV中与人受体ACE2蛋白直接相互作用的受体结合基序中不存在氨基酸替换,但在RBD的其他区域发生了六个突变。与SARS-CoV相比,这些差异是否会影响2019-nCoV的宿主趋向性和传播特性值得在未来开展进一步的研究。

参考资料:

Aiping Wu et al. Genome Composition and Divergence of the Novel Coronavirus (2019-nCoV) Originating in China. Cell Host & Microbe, 2020, doi:10.1016/j.chom.2020.02.001.