结核潜伏感染蛋白Rv1737c B细胞、CTL及Th表位预测与分析

2015-02-25 07:42白雪娟赵亚静吴雪琼
实用临床医药杂志 2015年3期
关键词:结核分枝杆菌生物信息学

白雪娟, 赵亚静, 梁 艳, 吴雪琼

(解放军第309医院 全军结核病研究所 全军结核病防治重点实验室/

结核病诊疗新技术北京市重点实验室, 北京, 100091)

结核潜伏感染蛋白Rv1737c B细胞、CTL及Th表位预测与分析

白雪娟, 赵亚静, 梁艳, 吴雪琼

(解放军第309医院 全军结核病研究所 全军结核病防治重点实验室/

结核病诊疗新技术北京市重点实验室, 北京, 100091)

摘要:目的利用生物信息学方法建立一套预测B细胞、CTL及Th细胞免疫功能多肽的方法,用于筛选新型结核病诊断抗原分子和候选疫苗抗原。方法采用DNAStar软件包中的Protean软件从α螺旋、β折叠及转角等二级结构的数量和分布、亲水性和表面可及性等方面预测分析该蛋白序列成为B细胞表位的可能性,预测CTL表位时,先采用Blast方法分析该序列与人类序列的同源性,然后综合应用SYFPEITHI超基序法、BIMAS量化基序法及NetCTL预测其CTL表位,应用RANKPEP及SYFPEITHI超基序法远程预测Th细胞表位,筛选表位集中、分值较高者作为候选多肽片段。结果Protean软件预测结果表明Rv1737c蛋白序列亲水性和表面可及性都较弱, α转角、β折叠结构数目较多且分布广泛,而转角及卷曲结构较少,B细胞表位数目较少; Rv1737c蛋白的CTL及Th表位主要集中于第100位氨基酸之后,其中与HLA-A2表型相对的CTL表位,与HLA-DRB1*0401及HLA-DRB1*1501表型相对的Th表位较其他表型数目较多、分值较高。结论Rv1737c蛋白可能不利于作为B细胞抗原,但其可能是一种较好的T细胞抗原,成为结核病诊断抗原分子和候选疫苗抗原。

关键词:结核分枝杆菌; Rv1737c; 表位预测; 生物信息学

Epitope prediction and analysis of Rv1737c protein of

结核病是因感染结核分枝杆菌(M.tb)所致的危害全球人类健康的主要传染病之一[1]。据报道[2-3]全球约有20亿人感染结核分枝杆菌,其中约90%感染者为潜伏期感染,而大多数活动性结核病是由潜伏感染的结核杆菌重新激活所致。因此,结核潜伏者感染的筛查与防治对于控制结核病的发生有着重要意义。Rv1737c抗原是Voskuil等[4]利用基因芯片技术发现48个与缺氧相关的结核分枝杆菌潜伏感染抗原之一,其编码一种硝酸盐和/或亚硝酸盐转运蛋白。有研究[5-6]表明,与活动性结核患者相比,该抗原更易被结核分枝杆菌潜伏感染人群外周血中的淋巴细胞识别;另外其在所有卡介苗菌株中表达缺失,由此推测如将抗原Rv1737c用于结核分枝杆菌潜伏感染诊断,有可能与接种卡介苗者相区分[7]。因此,本研究选择Rv1737c抗原作为靶点,采用生物信息学方法,应用目前使用较多且较成熟的在线及离线预测工具对其进行B细胞、CTL及Th表位预测,试图找到表达具有优势抗原表位的特异性片段。

1材料与方法

1.1材料

Rv1737c蛋白序列来源于网站http://www.tbdb.org/, 生物信息学分析软件及网站来源于internet网络资源,具体如下所述:

1.1.1B细胞表位预测:采用美国DNASTAR公司产品DNA Star软件包中Protean软件,可将其安装于计算机上进行DNA和蛋白质分析。

1.1.2CTL表位预测: Blast分析: http://web.expasy.org/blast/; SYFPEITHI超基序法远程预测:http://www.syfpeithi.de/; BIMAS量化基序法预测: http://www-bimas.cit.nih.gov/molbio/hla_bind/; NetCTL预测: http://www.cbs.dtu.dk/services/NetCTL/。

1.1.3Th表位预测: RANKPEP预测:http://bio.dfci.harvard.edu/RANKPEP/; SYFPEITHI超基序法远程预测: http://www.syfpeithi.de/。

1.2方法

1.2.1DNA star分析:筛选时依据亲水性好(hydrophilicity), 表面可及性高(accessibility),柔韧性好(flexibility),抗原性强(antigenic index), 卷曲(coils)和转角(turns)可能性大的为候选B细胞表位,尽量避开α螺旋、β折叠结构。

1.2.2CTL表位分析:BLAST分析:采用EXPASY在线软件(NCBI BLAST2 service)对Rv1737c蛋白氨基酸序列与人类蛋白质的同源性进行分析,在EXPASY主页http://web.expasy.org/blast/,输入Rv1737c蛋白的氨基酸序列,选择Homo sapiens,进行blast比对。

SYFPEITHI超基序法远程预测CTL表位:进入SYFPEITHI主页http://www.syfpeithi.de/, 选择Epitope prediction进入CTL表位预测界面,对Rv1737c的HLA-A* 0201、HLA-A*03和HLA-B*0702限制性CTL表位进行远程预测。对分值较高(≥18分)的九肽做进一步分析。

BIMAS量化基序法预测CTL 表位:进入BIMAS主页http://www-bimas.cit.nih.gov/molbio/hla_bind/, 选定预测抗原肽长度为9, MHC类型为HLA-A*0201、HLA-A*3和HLA-B*7, 将已获得的抗原氨基酸全长输入待预测序列框,运行远程预测程序,获得预测结果。

NetCTL预测CTL表位:进入NetCTL主页http://www.cbs.dtu.dk/services/NetCTL/, 选定A2、A3、B7表型,输入氨基酸序列后进行在线预测,选取综合预测值(COMB)>0.75的九肽为候选CTL表位。

1.2.3Th表位分析: RANKPEP分析:进入RANKPEP主页http://imed.med.ucm.es/Tools/rankpep.html, 选择MHC类型为HLA-DRB1*0101、HLA-DRB1*0301、HLA-DRB1*0401、HLA-DRB1*0701、HLA-DRB1*0801、HLA-DRB1*1101及HLA-DRB1*1501的限制性Th细胞表位预测,选取红色标记的潜在可能表位序列。

SYFPEITHI超基序法远程预测Th表位:进入SYFPEITHI主页http://www.syfpeithi.de/, 选择Epitope prediction进入CTL表位预测界面,主要对HLA-DRB1*0401、HLA-DRB1*0701、HLA-DRB1*08、HLA-DRB1*1101、HLA-DRB1*13及HLA-DRB1*15限制性Th细胞表位进行预测。对分值较高(≥18分)的由15个氨基酸构成的表位多肽作分析。

2结果

2.1Rv1737c蛋白B细胞抗原表位的DNA star预测分析结果

利用DNA star软件包中的Protean软件,结合Gamier-Robson和Chou-Fasman两种方法预测Rv1737c蛋白的二级结构,以β折叠较多,分布较均匀,分值较高且位置集中的氨基酸残基位于6-23、72-92、97-118、142-171、173-184、204-224、229-243、300-312、364-385位; α螺旋结构也较多,主要集中位于33-42、70-80、162-186、196-203、249-259、274-293、386-395位氨基酸残基;转角结构相对较少,位于120-124、130-132、190-191、261-263、344-345;无规则卷曲结构位于25-29、107-108、158-163、192-193、228-230、291-295、313-314、325-327位氨基酸残基,数目也较少,分布比较散。用Kyte-Doolittle方法分析Rv1737c蛋白的疏水性和亲水性,结果显示该蛋白主要表现为疏水性,亲水性区域较短且分散,仅以1-5、32-42、64-70、127-132、195-203、243-247、268-271、323-327、357-363、384-395位氨基酸残基处的亲水性指数较高,提示这些区域暴露于表面的几率较大,作为抗原表位的可能性也最大。用Emini方法预测蛋白的表面可及性,显示该蛋白呈现在表面可能性较大的区域主要仅集中于1-34、63-65、123-131、184-192、268-270、292-295、323-325、355-363、385-390、392-395位氨基酸残基,其他部位展示的可能性较小或表现为负值。Rv1737c蛋白含有较多的柔韧性区域且分布较均匀,位于27-32、39-41、60-70、126-134、183-185、190-199、246-248、260-263、292-296、313-316、331-334、342-344、365-363、386-392位氨基酸残基,提示该蛋白肽段的柔韧性较大,发生扭曲、折叠的概率较高,能形成丰富的二级结构。

图1 应用DNAstar软件分析Rv1737c蛋白序列结果

2.2Rv1737c蛋白CTL表位预测分析结果

对Rv1737c蛋白氨基酸序列与人类蛋白质的同源性进行blast分析,结果表明该蛋白与人类蛋白质序列一致率低,同源性较差。将Rv1737c蛋白序列输入3种CTL表位分析软件,选择HLA-A2、HLA-A3和HLA-B7三种MHC限制类型,预测9个氨基酸长度的T细胞表位,表1列出由3种方法预测的分值较高且有候选意义的CTL表位数目情况;表2综合考虑3个软件的预测结果,针对每一种表型,筛选出分值较高的多肽序列。

2.3Rv1737c蛋白Th表位预测分析结果

将Rv1737c蛋白序列输入2种Th表位分析软件,选择HLA-DRB1*0101、HLA-DRB1*0301、HLA-DRB1*0401、HLA-DRB1*0701、HLA-DRB1*0801、HLA-DRB1*1101及HLA-DRB1*1501限制性Th细胞表位预测,获得9个或15个氨基酸长度的T细胞表位,表3列出由2种方法预测的分值较高且有候选意义的Th表型表位数目情况;表4综合考虑2个软件的预测结果,筛选出针对某个表型分值均较高的Th表位序列。

3讨论

表1 不同在线预测工具对抗原Rv1737c的CTL表位综合分析结果

表2 综合分析Rv1737c蛋白获得的候选CTL表位序列信息

表3 不同在线预测工具对Rv1737c抗原Th细胞表位的综合分析

表4 综合分析Rv1737c蛋白获得的候选Th表位信息

随着生物信息学的快速发展,通过生物信息学软件和网站对相关信息进行分析、处理、模拟,最终预测抗原表位的模式,已为越来越多的研究者所采用[8-9]。因为这样的研究方式可以减少实验的盲目性,加强实验的目的性,大大提高实验的成功率[10]。表位是抗原分子中决定抗原特异性的特殊化学基团,表位的免疫学特性研究可以帮助研究者们更好地认识抗原在机体内的免疫机制,以之为基础的诊断试剂和疫苗开发也成为近年来研究的热点[11-12]。开发结核潜伏感染相关抗原表位为深入研究潜伏感染机制,发现新的潜伏感染诊断标志物及有效的潜伏感染表位疫苗的研究奠定了基础。

蛋白质的二级结构与B细胞表位关系密切。维持α螺旋、β折叠结构的化学键能较高,稳定性强,造成这些结构很难较好地与抗体嵌合,且经常处于蛋白质内部,因而很少成为抗原表位。β转角和无规则卷曲结构单元是比较松散的柔性结构,易于扭曲、盘旋并展示在蛋白表面,有利于抗体嵌合,常含有B细胞的优势表位[13-14]。通过DNAstar分析,作者发现蛋白Rv1737c整体亲水性和表面可及性都较弱,α转角、β折叠结构数目较多且分布广泛,而转角及卷曲结构较少,这些因素都不利于将其作为B细胞抗原。将Rv1737c蛋白序列输入3种CTL表位分析软件,选择不具种族特异性的高频MHC-I类等位基因HLA-A2[15-17], 联合HLA-A3和HLA-B7限制类型,预测CTL细胞表位,发现CTL表位集中于第100位氨基酸之后,且与HLA-A3和HLA-B7两种表型相比较,针对HLA-A2表型的表位数目最多,分值较高。组合HLA-A2、HLA-A3和HLA-B7这3个超型的限制性表位,在黑人、白人和亚裔人中涵盖率达到90%[18-19]。因此,联合应用HLA-A2、HLA-A3和HLA-B7 3个超型的限制性表位,可以诱导针对不同HLA基因位点的CTL反应,从而大大拓宽免疫反应人群。SYFPEITHI和BIMAS数据库筛选是进行CTL表位预测运用最多的方法,但这两种方法并没考虑抗原肽提呈效率因素,而NetCTL考虑到了这一因素,因此将这三种方法综合进行分析,可以提高表位预测的准确率,减少后续实验验证的表位数目[18]。

HLA-DRB1*0101、HLA-DRB1*0301、HLA-DRB1*0401、HLA-DRB1*0701、HLA-DRB1*0801、HLA-DRB1*1101及HLA-DRB1*1501是中国人群常见的表型[20-21],用两种Th表位分析软件对上述表型进行预测,发现RANKPEP较SYFPEITHI提供更多的预测表位类型,综合两种方法预测结果,发现得分较高的候选Th型表位多数(14/20)亦集中于100位氨基酸之后;针对HLA-DRB1*0401及HLA-DRB1*1501表型的表位数目最多,分值较高;对于HLA-DRB1*0401表型, SYFPEITHI较RANKPEP预测获得表位数目更多,且两种方法获得得分高的表位序列的一致性较高。由此可见,Rv1737c蛋白序列以T细胞表位为主,且Th与CTL表位位置集中于100位氨基酸之后,这一结果与DNAstar初步分析结果一致,这两种表位之间仅有一条序列一致,其余都不相同。

Riano等[5]发现DosR抗原Rv1737c能在潜伏感染个体中诱导产生较之活动性结核患者中更高水平的IFN-γ; 在南非乌干达结核分枝杆菌潜伏感染者中免疫原性也比较好, ELISA方法检测显示外周血中IFN-γ的水平较高[6]。这些结果提示该抗原可能与潜伏感染维持和保护结核再感染相关。Rv1737c蛋白有可能是一种较好的T细胞抗原,本研究预测结果与文献报道比较一致。

本文通过生物信息学方法对Rv1737c蛋白进行预测分析,尽可能多地搜索和了解该蛋白的结构与功能的信息。在表位预测和结合力分析方面充分考虑了多种软件对MHC-I及Ⅱ类分子对多肽的限制性问题,权衡分析各项结果,为结核病防治筛选新的诊断抗原分子和候选疫苗抗原,为实验研究和应用前景分析提供信息,但筛选得到的候选表位肽是否能有效刺激T细胞免疫应答,还有待于下一步体外、体内实验的进一步验证。

参考文献

[1]Dye C, Scheele S, Dolin P, et al. Consensus statement. Global burden of tuberculosis: estimated incidence, prevalence, and mortality by country. WHO Global Surveillance and Monitoring Project[J]. JAMA,1999,282(7):677.

[2]Centers for Disease Control and Prevention, USA[EB/OL]. [2012-03-13]. http://www.cdc.gov/tb/publications/LTBI/intro.htm.

[3]Smieja M J, Marchetti C A, Cook D J, et al. Isoniazid for preventing tuberculosis in non-HIV infected persons[J]. Cochrane Database Syst Rev, 2000, 2, CD001363.

[4]Voskuil M I, Schnappinger D, Visconti K C, et al. Inhibition of respiration by nitric oxide induces a Mycobacterium tuberculosis dormancy program[J]. J Exp Med, 2003, 198(5): 705.

[5]Ria o F, Arroyo L, París S, et al. T cell responses to DosR and Rpf proteins in actively and latently infected individuals from Colombia[J]. Tuberculosis (Edinb), 2012, 92(2): 148.

[6]Black G F, Thiel B A, Ota M O, et al. Immunogenicity of novel DosR regulon-encoded candidate antigens of Mycobacterium tuberculosis in three high-burden populations in Africa[J]. Clin Vaccine Immunol, 2009, 16(8): 1203.

[7]Honaker R W, Stewart A, Schittone S, et al. Mycobacterium bovis BCG vaccine strains lack narK2 and narX induction and exhibit altered phenotypes during dormancy[J]. Infect Immun, 2008, 76(6): 2587.

[8]赵屹, 谷瑞升, 杜生明. 生物信息学研究现状与发展趋势[J]. 医学信息学杂志, 2012, 5(33): 2.

[9]刘银凤, 张雷. 生物信息学数据库在医学研究中的应用[J]. 中国病原生物学杂志, 2014, 9(10): 1.

[10]李海侠, 毛旭虎. 蛋白质抗原表位研究进展[J]. 微生物学免疫学进展, 2007, 35(1): 54.

[11]宋帅, 李春玲, 贾爱卿. 抗原表位研究方法进展[J]. 动物医学进展, 2010, 31(12): 87.

[12]李健, 余传信. 表位疫苗的研究进展[J]. 中国热带医学, 2007, 7(9): 1681.

[13]孙涛, 程安春, 汪铭书. 蛋白质B细胞抗原表位测定方法的研究进展[J]. 黑龙江畜牧兽医, 2008, (7): 23.

[14]郭春艳, 赵向绒, 胡军. B细胞抗原表位的研究进展及其应用[J]. 生物技术通讯, 2013, 24(2): 266.

[15]孙燕妮, 王一松, 王海霞, 等. 潜伏期结核分枝杆菌HLA-A*0201限制性CD8+CTL表位的高通量筛选[J]. 中国病原生物学杂志, 2013, 8(1): 26.

[16]陈燕, 娄加陶, 吴传勇. 结核分枝杆菌抗原Ag85A( Rv3840 c)限制性CD8+CTL表位的预测及鉴定[J]. 临床军医杂志, 2007, 35(1): 18.

[17]陈婷, 万瑛, 汤旭东. 人肿瘤转移相关抗原肝素酶HLA-A2.1限制性CTL表位的预测及初步鉴定[J]. 第三军医大学学报, 2007, 29(22): 2120.

[18]朱宇皇, 高艳锋, 吕虹,等.结核分枝杆菌抗原Rv1258c、Rv1410c及Rv3425的HLA限制性CTL表位预测[J]. 郑州大学学报: 医学版, 2011, 1(46): 13.

[19]Sette A, Sidney J. Nine major HLA class I supertypes account for the vast preponderance of HLA-A and -B polymorphism[J]. Immunogenetics, 1999, 50(3/4): 201.

[20]Panigada M L, Sturniolo T, Besozzi G, et al. Identification of a Promiscuous T-Cell Epitope in Mycobacterium tuberculosis Mce Proteins[J]. Infect Immun, 2002, 70(1): 79.

[21]叶娟, 张舒林, 刘文第. 结核分枝杆菌RD12区T细胞表位分布情况预测及分析[J]. 上海交通大学学报: 医学版, 2014, 34(1): 7.

mycobacterium tuberculosis dormant infection

on B cell, CTL and Th cells cells n on

BAI Xuejuan, ZHAO Yajing, LIANG Yang, WU Xueqiong

(InstituteforTuberculosisResearch,ArmyTuberculosisPreventionandControlKey

Laboratory,BeijngKeyLaboratoryofNewTechniquesofTuberculosisDiagnosisand

Treatment,the309thHospitalofPeople′sLiberationArmy,Beijing, 100091)

ABSTRACT:ObjectiveTo establish a method of predicting immune function polypeptides of B cells, CTL and Th cells for screening new TB diagnostic antigens and vaccine candidates by means of bioinformatics.MethodsSequences of proteins of B cell epitopes predicted by Protean software of DNAstar software package by the quantity and distribution from two dimensional structures of α-helix, β-pleated sheet and rotation structures. To predicte CTL epitopes, the sequence homology with the human sequence using Blast method, then the CTL epitopes were predicted by means of combination analysis of SYFPEITHI supermotif method, BIMAS quantitative motif method and NetCTL prediction method. The Th epitopes were predicted by RANKPEP and SYFPEITHI supermotif prediction method. The epitopes with higher concentration and higher scores were taken as the candidate polypeptides. ResultsProtean software showed that the hydrophilicity and surface accessibility of Rv1737c protein sequence were weak, the alpha angle and beta folding structures were more in number and distributed widely, and the angle and coil structure was less, the B cell epitopes were rare. The epitopes of Rv1737c protein on CTL and Th were concentrated after the 100th amino acid, in which

phenotypes of HLA-A2 corresponding with CTL, HLA-DRB1*0401 and HLA-DRB1*1501

corresponding with Th had more numbers and higher scores. ConclusionRv1737c protein may not benefit to be B cell antigen, but it may be a better T cell antigen for tuberculosis diagnosis marker and vaccine candidate.

KEYWORDS:mycobacterium tuberculosis; Rv1737c; epitopes prediction;bioinformatics

通信作者:吴雪琼, Email: wu-xueqiong@263.net

收稿日期:2014-12-21

中图分类号:R 519

文献标志码:A

文章编号:1672-2353(2015)03-005-05

DOI:10.7619/jcmp.201503002

猜你喜欢
结核分枝杆菌生物信息学
浅谈医学院校生物信息学专业青年教师规范培训模式的建立
“PBL+E—learning”教学模式探索
移动教学在生物信息学课程改革中的应用
中医大数据下生物信息学的发展及教育模式浅析
生物信息学课堂危机及对策研究
安阳地区初治肺结核患者菌型鉴定与耐药性分析
利福平和异烟肼耐药基因突变快速检测方法在结核病中的应用
广东顺德区结核分枝杆菌临床耐药性分析