新型冠状病毒3CL水解酶的结构特征及其抗原表位分析

2020-11-19 05:01道,彭
生命科学研究 2020年5期
关键词:表位糖基化配体

王 道,彭 亮

(中南大学湘雅二医院妇产科,中国湖南长沙410011)

在过去的20年中,严重急性呼吸综合征冠状病毒(severe acute respiratory syndrome coronavirus,SARS-CoV)和中东呼吸系统综合征冠状病毒(Middle East respiratory syndrome coronavirus,MERSCoV)的肆意流行已威胁到人类的生命。2019年12月,新型冠状病毒SARS-CoV-2引起的一系列感染病例在中国湖北省武汉出现,到目前为止,已经蔓延到全球多个国家和地区[1~6]。尽管SARS-CoV-2的致死率较低,但比SARS-CoV传播得更广泛[7],其引发的疾病已被世界卫生组织正式命名为2019冠状病毒病(coronavirus disease 2019,COVID-19)。SARS-CoV-2是一种β冠状病毒,其RNA基因组与SARS-CoV基因组约有82%的相似性[8],属于正冠状病毒亚科(Orthocoronavirinae),Sarbecovirus亚属[9]。石正丽等[10~11]根据病毒基因组推测,中华菊头蝠(Rhinolophus sinicus)是SARS相关冠状病毒的天然宿主。另有研究认为马来穿山甲[12~13]、水貂[14]是SARS-CoV-2的潜在中间宿主。截至2020年5月19日,SARS-CoV-2感染人数依然呈指数增长,全球累计确诊病例突破470万例。COVID-19的严重性和迅猛性迫使我们亟需开发新的药物来对抗新兴的冠状病毒。

SARS-CoV-2是一种单链RNA冠状病毒,其第一个可读框(open reading frame 1a/b,ORF 1a/b)编码16个非结构蛋白(nonstructural protein,NSP),其中最具特征的主要药物靶标是3CLpro(3C-like protease)[15]。3CL水解酶能裂解多聚蛋白,并且产生成熟的酶,然后在11个位点进一步裂解下游的NSP以释放NSP4~16。其余的ORF则编码几种辅助蛋白和结构蛋白,其中包括刺突(S)糖蛋白、包膜(E)蛋白、基质(M)蛋白和核衣壳(N)蛋白[11]。3CLpro的主要功能是介导NSP成熟,参与RNA转录翻译、蛋白质合成加工及修饰、蛋白质复制和宿主感染等重要过程。因此,抑制3CLpro活性将能阻止病毒的感染和复制,这使3CLpro成为小分子抑制剂的主要靶标之一[16]。而且,人体内尚未发现具有类似裂解特异性的识别蛋白酶,所以以3CLpro为靶标开发的小分子抑制剂具有较好的安全性。

目前,临床缺乏针对COVID-19的有效抗病毒药物,仅仅集中在对症治疗和呼吸支持上[17]。过去SARS或MERS患者使用的洛匹那韦/利托那韦、利巴韦林、干扰素等未能明显改善COVID-19患者的临床状况,也未能减少咽喉部检出的病毒RNA[18]。另外,备受期望的瑞德西韦(remdesivir)的疗效和安全性也尚需观察[19]。因此,我们首要任务是找到能有效抑制新病毒的靶点。生物信息学现已被广泛地应用在前期药物筛选和研发等重要领域,本研究借助多种生物信息学手段对3CLpro蛋白的结构特征和抗原表位进行预测分析,为SARSCoV-2的疫苗研发提供新的思路。

1 材料与方法

1.1 材料

从美国国家生物信息中心(National Center for Biotechnology Information,NCBI;https://www.ncbi.nlm.nih.gov/)的GenBank中获取新型冠状病毒的3CLpro蛋白序列(登录号:YP 009725301.1.)。

1.2 方法

基于多种在线数据库(表1)对3CLpro的理化性质、亲/疏水性、跨膜区、磷酸化位点、糖基化位点、SUMO化位点以及二级结构、结构域、配体结合域和B/T细胞的优势抗原表位区域进行预测,并且挖掘可能潜在的小分子药物。

2 结果与分析

2.1 3CLpro的氨基酸序列比对

运用ClustalX2对PDB数据库中SARS-CoV-2(6LU7)、SARS-CoV(1UJ1)和 MERS-CoV(4RSP)的3CLpro蛋白进行氨基酸序列比对,并将信息提交到JalView进一步做可视化分析。结果显示,上述3种病毒中3CLpro蛋白的氨基酸序列的相似性非常高,在多聚蛋白切割位点具有显著的保守性,相似度达到81.66%(图1)。由此可见,3CLpro的氨基酸序列高度保守或者相同,提示其切割位点可能具有非常高的相似性。

2.2 3CLpro的理化性质

基于ExPASy Server,利用ProtParam预测3CLpro的基本理化性质。结果显示,3CLpro蛋白由306个氨基酸组成,包含带负电荷的26个氨基酸残基(Asp+Glu)和带正电荷的22个氨基酸残基(Arg+Lys)(表2);蛋白质的分子式为C1499H2318N402O445S22,相对分子质量为33 796.64,等电点为5.95;280 nm波长处的消光系数为33 640,吸光度为0.995,半衰期为1.9 h,脂肪稳定系数为82.12,表明3CLpro蛋白具有稳定性;亲水性的平均值为-0.019,表明该蛋白质具有亲水性。

2.3 3CLpro的亲/疏水性和跨膜区

运用ProtScale数据库对3CLpro蛋白的亲水性进一步进行分析。图2结果显示,3CLpro蛋白有4个高分值峰区(score>1.5),分别位于第204位、第206位、第 208~209位和第 261~264位氨基酸,其中最高分值位于第209位的亮氨酸(score=2.167);4个低分值峰区(score<-1.5),分别位于第51~52位、第96~99位、第218位和第240~242位,其中最低分值位于第98位的苯丙氨酸(score=-2.067)。3CLpro存在大量亲水区,推测属于亲水性蛋白质。

运用TMHMM数据库对3CLpro蛋白的跨膜区进行预测,结果显示不存在一段由胞内向胞外的跨膜区域(图 3)。

表1 生物信息数据库及在线网站Table 1 Bioinformatic databases and websites

表2 3CLpro的氨基酸组成Table 2 Amino acid composition of 3CLpro

图1 3CLpro蛋白的氨基酸序列比对Fig.1 Alignment analysis of amino acid sequence of 3CLpro

2.4 3CLpro的糖基化、磷酸化和SUMO化位点

运用 NetNGlyc 1.0 Server、NetPhos 3.1 Server和SUMOplot分别对3CLpro的糖基化、磷酸化和SUMO化位点进行分析,结果显示,3CLpro的糖基化位点有2个(图4);磷酸化位点共有27个,包括丝氨酸(S)位点14个、苏氨酸(T)位点10个和酪氨酸(Y)位点3个(图5);SUMO化位点有3个,包括K90、K12 和 K97,而且 K90 位点(score=0.91)发生SUMO化修饰的可能性最高(图6)。

图2 3CLpro蛋白的亲/疏水性分析Fig.2 Hydrophilicity/hydrophobicity analysis of 3CLpro

图3 3CLpro蛋白的跨膜区域分析Fig.3 Transmembrane region analysis of 3CLpro

2.5 3CLpro蛋白的二级结构和结构域

运用PSIPRED预测3CLpro的二级结构,结果显示,3CLpro蛋白共有66个α-螺旋和96个β-折叠。其中,参与形成α-螺旋的氨基酸占21.57%(66/306);参与形成β-折叠的氨基酸占31.37%(96/306);其余的都是无规则卷曲,说明3CLpro蛋白的氨基酸大部分处于有序状态。

Pfam在线工具对3CLpro的结构域预测结果显示,29~306氨基酸位置存在一个endopeptidase/C30保守序列。图7显示PSIPRED和Pfam两个在线工具的预测结果基本一致。

2.6 3CLpro蛋白的配体结合位点和小分子药物分析

PrankWeb平台可利用随机森林算法预测3CLpro蛋白表面上的配体结合位点。图8中5种彩色矩形代表预期口袋和实际结合的可能区域,其保守性使用灰色条形图描绘。在结构可视化结果中,蛋白质表面用不同的颜色突出显示各个口袋区域,蛋白质原子的灰色越深表示保守性越高。在表3数据中,蓝色区(pocket 1)得分是11.184 0,大于其他颜色区域的得分,说明蓝色区是最大可能的配体结合区域,其溶剂可及表面积为72,表面原子数为 45,氨基酸残基位点为 24~27、41~49、140~145、163~166、189。

图4 3CLpro蛋白的糖基化位点分析Fig.4 Prediction of N-glycosylation sites in 3CLpro

图5 3CLpro蛋白的磷酸化位点分析Fig.5 Prediction of phosphorylation sites in 3CLpro

图6 3CLpro蛋白的SUMO化位点分析Fig.6 Prediction of sumoylation sites in 3CLpro

DrugBank数据库是基于药物-基因组学的在线平台,能够有效地挖掘药物。本文的分析结果显示,存在8种可能能够抑制3CLpro蛋白的小分子药物。这8种小分子药物的accession number分别为 DB08748、DB07620、DB07743、DB08732、DB-07293、DB08656、DB14761、DB15686,其化学式如图9所示。

2.7 3CLpro蛋白的B/T细胞抗原表位

首先,基于Kolaskar & Tongaonkar Antigenicity预测3CLpro的B细胞表位抗原性,结果显示N端的 15~23、32~45、65~72、83~91、101~107、111~120、123~129、153~162、201~212、244~253 和258~271区域为可能的B细胞抗原表位(图10A)。随后,基于Bepipred Linear Epitope Prediction预测3CLpro的B细胞表位抗原性,结果显示N端的5~13、47~57、93~109、170~196、225~228、236~247、273~278、290~298 和 301~302 区域的抗原性较强(图10B)。综合以上预测,推导出B细胞的优势抗原表位区域主要为第101~107位氨基酸。进一步运用SYFPEITHI软件预测出3CLpro多个潜在的T细胞抗原表位,主要组织相容性复合体(major histocompatibility complex,MHC)类型选择RT1.AI,其中大于15分以上的位点有11个(表4)。

图7 3CLpro蛋白的二级结构及结构域分析Fig.7 Prediction of secondary structure and structural domains of 3CLpro

图8 3CLpro蛋白的配体结合区域分析Fig.8 Prediction of ligand binding sites of 3CLpro

3 讨论

截至目前,在中国以外地区,大量COVID-19患者已经使医疗系统不堪重负。但新药上市并非一蹴而就,候选药物的安全性还需进一步在临床试验中得到验证[20~21]。鉴于3CLpro在病毒复制过程中的重要作用,我们对SARS-CoV-2、SARS-CoV和MERS-CoV的3CLpro蛋白进行了序列比对,发现3种病毒中3CLpro蛋白具有81.66%的相似性(图1),提示3CLpro有望成为未来强有吸引力的药物作用靶点。相反,SARS-CoV-2的基因组3′端编码的4个结构蛋白和8个辅助蛋白由于存在太多的变异性,难以成为广谱抑制剂的位点[22]。

表3 3CLpro蛋白的配体结合区域数据Table 3 Ligand binding sites of 3CLpro

图9 3CLpro蛋白的小分子药物预测Fig.9 Prediction of small molecule drugs of 3CLpro

本文先对3CL水解酶的理化性质、亲/疏水性和跨膜区进行了预测。结果显示,3CLpro蛋白的理论等电点是5.95,说明3CLpro属于酸性蛋白质,这与本文理化分析中带负电荷的氨基酸数目大于带正电荷的氨基酸数目的结果相符;而且3CLpro属于亲水性蛋白质(图2),我们推测其亲水区末端突出脂包膜外表面,其后是疏水的结构域,但是,TMHMM数据库预测其不存在跨膜区(图3)。另外,本文的预测结果显示3CLpro存在2个糖基化位点(图4)、27个磷酸化位点(图5)和3个SUMO化位点(图6),其中,2个糖基化位点的预测结果与Vankadari等[23]研究认为SARS-CoV-2是一种高度糖基化的病毒颗粒的结论相一致,研究者也许能够利用其他小分子结合到这些修饰位点来抑制病毒复制。因为3CLpro是冠状病毒复制所必需的酶,而人体内没有与3CLpro具有类似切割位点的蛋白酶,所以以它为靶标筛选出的特异性强的抑制剂可能具有更好的药物安全性。但是,这还需要从临床上得到验证。Ge等[24]报道,SARS-CoV-2主要是依靠刺突糖蛋白结合到宿主细胞表面的血管紧张素转换酶Ⅱ(angiotensin converting enzyme 2,ACE2)受体,从而进入宿主体内,跨膜丝氨酸蛋白酶2(transmembrane protease serine 2,TMPRSS2)则在入侵过程中发挥“助攻”作用。Hoffmann等[25]发现TMPRSS2也是潜在的可用于COVID-19治疗的靶标。需要指出的是,除肺以外,ACE2还在心脏、食道、膀胱和回肠等组织广泛表达[26],因此其靶标药物的毒副作用就必须得到足够的关注。相比ACE2和TMPRSS2,3CLpro的抑制剂能够迅速达到直接灭活病毒的目的。

图10 3CLpro蛋白B细胞抗原表位预测和抗原性分析Fig.10 B cell epitope prediction of 3CLpro

表4 3CLpro蛋白T细胞抗原表位预测Table 4 T cell epitope prediction of 3CLpro

随着COVID-19给世界各地带来的经济损失和心理恐慌,公众对相关药物研发的期盼尤为迫切。科学家们前期已经从现有上市药物中找到部分能够“老药新用”的化合物[27]。本研究也预测到多个3CLpro蛋白的配体结合位点,其中蓝色区域分数最高,是口袋和实际配体结合可能性最高的区域(图8和表3)。另外,我们还挖掘到8种潜在的对3CLpro具有抑制作用的小分子药物(图9),其中就有瑞德西韦(图9G),但瑞德西韦对COVID-19的疗效还有待评估[28]。Chen等[29]使用3CLpro分子模型筛选出16个潜在的候选药物,并推测维帕他韦(velpatasvir)和雷地帕韦(ledipasvir)的副作用较小,但这两种药物的抑制作用还有待证实。早在2003年,Hilgenfeld团队就构建了SARS-CoV 3CLpro的同源模型晶体结构[30];2020年3月,他们合成了可抑制SARS-CoV-2的拟肽α-酮酰胺抑制剂。令人鼓舞的是,研究人员称给药小鼠暂时未出现任何不良反应[31]。此外,本文还采用多参数方法分析了3CLpro多个B细胞抗原表位,发现潜在的抗原表位优势区域在第101~107位氨基酸(图10);同时,预测出了11个评分大于15的T细胞抗原表位,它们主要位于 15~23、32~45、65~72、83~91、101~107、111~120、123~129、153~162、201~212、244~253 和 258~271 氨基酸残基附近(表4)。总的来讲,人类免疫缺陷病毒(human immunodeficiency virus,HIV)[32]和丙型肝炎(hepatitis C virus,HCV)[33]抑制药物被逐步研制的事实表明,新型冠状病毒疫苗和药物抑制剂仍是当下COVID-19最根本有效的防治手段[34]。

现今科学家仍然在抗击COVID-19,但有些问题仍不明确。本文借助生物信息学工具快速地解析了3CLpro蛋白结构,预测了其配体结合位点和潜在的B/T细胞表面抗原,可为疫苗和药物的研发提供一定的理论基础。

猜你喜欢
表位糖基化配体
生物信息学方法预测病原体抗原蛋白序列中多肽疫苗候选表位
含季铵盐的芳酰腙配体的铜 (Ⅱ)配合物的合成和表征:体外DNA键合和核酸酶活性
乙型肝炎病毒B和C基因型S蛋白特异性CTL表位保守性分析
蛋白质O-GlcNAc糖基化修饰在妇科肿瘤中的研究进展
基于[2,2]对环芳烷骨架手性配体的设计、合成及其在不对称反应中的应用研究进展报告
联合T、B细胞表位设计多肽疫苗的研究进展①
结核分枝杆菌抗原Lppx和MT0322人T细胞抗原表位的多态性研究
糖基化终末产物对胰岛β细胞的损伤及作用机制研究进展
糖基化终末产物与冠脉舒张功能受损
油炸方便面贮藏过程中糖基化产物的变化规律