应用DNAStar软件预测结核分枝杆菌Rv3812的抗原表位*

2016-04-19 07:02李江英白雪娟张俊仙阳幼荣赵卫国吴雪琼
郑州大学学报(医学版) 2016年2期
关键词:表位残基抗原

李江英,白雪娟,梁 艳,张俊仙,阳幼荣,赵卫国#,吴雪琼#

1)河北北方学院 张家口 075000 2)解放军第309医院全军结核病研究所;全军结核病防治重点实验室 北京 100091



应用DNAStar软件预测结核分枝杆菌Rv3812的抗原表位*

李江英1,2),白雪娟2),梁艳2),张俊仙2),阳幼荣2),赵卫国1,2)#,吴雪琼1,2)#

1)河北北方学院 张家口 0750002)解放军第309医院全军结核病研究所;全军结核病防治重点实验室 北京 100091

关键词抗原表位;结核分枝杆菌Rv3812;二级结构

摘要目的:预测结核分枝杆菌Rv3812蛋白的抗原表位。方法:利用DNAStar软件包中Editseq软件将结核分枝杆菌Rv3812氨基酸序列进行编辑保存,然后利用Protean软件进行氨基酸序列分析,预测Rv3812蛋白的二级结构、B细胞抗原表位及T细胞抗原表位,然后再用BLAST分析其与人类抗原表位的同源性。结果:Rv3812蛋白具有丰富的二级结构和多处抗原指数较高的区段,潜在的B细胞抗原表位较少,可能位于55~68、77~99、116~120、265~280、283~294、303~326、330~337和425~435位氨基酸残基或其附近。该蛋白潜在的T细胞抗原表位较多,可能位于6~30、55~85、97~140、159~191、202~204、208~231、251~264、270~281、287~299、311~334、337~343、349~356、368~385、394~413、428~433、437~441、470~476、479~481和488~493位氨基酸残基或其附近。结论:Rv3812是一个T细胞抗原表位占优势的蛋白抗原,B细胞抗原表位略少。

Prediction of epitopes of Mycobacterium tuberculosis Rv3812 protein using DNAStar software

LIJiangying1,2),BAIXuejuan2),LIANGYan2),ZHANGJunxian2),YANGYourong2),ZHAOWeiguo1,2),WUXueqiong1,2)

1)HebeiNorthUniversity,Zhangjiakou0750002)PLAKeyLaboratoryofTuberculosisControlandPrevention;TuberculosisResearchInstituteofPLA,No. 309HospitalofChinesePLA,Beijing100091--------------------

*国家重大传染病防治科技重大专项基金2012ZX10003008002;军队医学科技“十二·五”重点项目BWS11J050;北京市科技创新基地培育与发展工程专项Z141107004414021;解放军第309医院重点课题2015ZD-004

Key wordsantigen epitope;Mycobacterium tuberculosis Rv3812 protein;secondary structure

AbstractAim: To predict the epitopes of Mycobacterium tuberculosis Rv3812 protein.Methods: Using DNAStar package Editseq software to save Mycobacterium tuberculosis Rv3812 amino acid sequence for editing, and then use Protean software to carry on the amino acid sequence analysis, predicting the secondary structure, B cell epitopes and T cell epitopes of Mycobacterium tuberculosis Rv3812. Use the BLAST to analysis its homology with human antigen epitopes. Results: The Rv3812 protein had rich secondary structure and multiple sections with higher antigenicity. There were a few potential B cell epitopes at 55-68, 77-99,116-120,265-280,283-294,303-326,330-337,425-435 amino acid residues or nearby. There were also more potential T cell epitopes at 6-30,55-85, 97-140,159-191, 202-204,208-231,251-264,270-281,287-299,311-334,337-343,349-356,368-385,394-413,428-433,437-441,470-476,479-481,488-493 amino acid residues or nearby.Conclusion: Mycobacterium tuberculosis Rv3812 protein is a T-cell-epitope dominant antigen, B cell epitopes also exists but less than T cell epitopes.

结核病是由结核分枝杆菌引起的一种人畜共患传染病,是当今严重危害人类健康的公共卫生问题,跻身全球十大疾病死亡原因之列。卡介苗(BCG)作为一种活性减弱的牛型结核分枝杆菌疫苗,是目前使用最广泛的疫苗之一[1-2]。我国是全球22个结核病高负担国家之一,同时也是全球27个耐多药结核病和广泛耐药结核病流行严重的国家之一,年发病人数约130万,占全球发病人数的14.3%,位居全球第2位[3-4]。因此, 开发安全高效的新型结核疫苗具有重要的社会效益。抗原表位是指抗原分子中决定抗原特异性的特殊化学基团,代表了抗原分子上的一个免疫活性区,负责与抗体分子或者细胞表面的抗原受体结合而发挥免疫效应。1998年结核分枝杆菌标准株H37Rv全基因组测序的完成,使得生物信息学技术进行表位预测成为可能[5]。结核分枝杆菌Rv3812(即PE_PGRS62)基因全长1 515 bp,属于富含甘氨酸和丙氨酸的独特的PE蛋白家族,是膜结合蛋白,由504个氨基酸组成,相对分子质量为51 789.3,等电点为4.180 2。有研究[6-10]发现结核分枝杆菌Rv3812是T细胞抗原占优势的蛋白,是潜在的候选T细胞抗原疫苗。作者运用DNAStar软件对Rv3812蛋白的二级结构和B、T细胞抗原表位进行分析和预测,为进一步对Rv3812中可能作为抗原表位的多肽进行分析以及研究新型结核疫苗奠定基础。

1材料与方法

1.1材料应用DNAStar有限公司开发的生物软件DNAStar软件包,在计算机上进行DNA和蛋白质分析;利用DNAStar软件包中Editseq软件将结核分枝杆菌Rv3812氨基酸序列进行编辑保存,然后用Protean软件对蛋白的二级结构和抗原表位进行分析和预测[11]。从NCBI网站获取Rv3812蛋白氨基酸全长序列(504个氨基酸),GenBank序列号NP_218329.1。

1.2Rv3812氨基酸序列与人类蛋白质的BLAST分析采用EXPASY在线软件(NCBI BLAST2 service)对Rv3812氨基酸序列与人类蛋白质的同源性进行分析,具体方法:利用Internet 网络进入EXPASY主页(http://web.expasy.org/blast/),选择蛋白数据库[blastp-query against the UniProt Knowledgebase (Swiss-Prot+4TrEMBL)],选择database (Homo sapiens),选定Run BLAST,输入Rv3812蛋白的氨基酸序列后进行比对。

1.3Rv3812蛋白二级结构的预测用Gamier-Robson方法[12]、Chou-Fasman方法[13]预测Rv3812蛋白的二级结构。二级结构预测方案认为β转角、无规则卷曲结构为凸出结构,多出现在蛋白质抗原表面, 利于与抗体嵌合,较可能成为抗原表位。而α螺旋、β折叠结构规则不易形变, 较难嵌合抗体, 一般不作为抗原表位[14]。

1.4Rv3812蛋白B细胞抗原表位的预测用Kyte-Doolittle方法[15]和Hopp-Woods方法[16]预测蛋白质的疏水区和亲水区,亲水性指数比较高的区域暴露于表面的几率较大,作为抗原表位的可能性也最大[17]。用Emini方法[18]预测特定区域位于蛋白质的表面可能性,即蛋白质抗原中氨基酸残基被溶剂分子接触的可能性,它反映了蛋白质抗原内、外各层残基的分布情况。用Karplus-Schulz方法[19]预测蛋白质骨架区的柔韧性,柔韧性好的肽段,发生扭曲、折叠的几率较高,能形成丰富的二级结构。用Jameson-wolf方法[20]预测潜在的蛋白质抗原决定簇,抗原性好的肽段提示含有潜在抗原表位的可能性大。最后根据Rv3812蛋白二级结构预测结果及蛋白质亲水性、表面可能性、抗原性及柔韧性,综合预测潜在优势B细胞抗原表位。

1.5Rv3812蛋白T细胞抗原表位的预测用AMPHI方法[21]预测免疫优势辅助性T 淋巴细胞抗原位点;用Rothbard-Taylor方法[22]预测含有特定基序(motif)的潜在T细胞抗原决定簇,最后综合预测潜在优势T细胞抗原表位。

2结果

2.1BLAST分析结果通过分析,发现Rv3812蛋白的氨基酸序列与人类黏蛋白/黏液素(MUC5AC)只有10.3%(52/504个氨基酸)的同源性,同源性主要位于第248~466位氨基酸残基,这段同源性达到22%。

2.2Rv3812蛋白二级结构、B细胞抗原表位及T细胞抗原表位预测见图1。预测Rv3812蛋白α螺旋结构形成在7~33、37~48、67~79、82~91、100~117、146~198、232~243、248~257、303~308、370~391、396~412和493~504位氨基酸残基,共212个氨基酸,占整个氨基酸序列的42%;β折叠在1~8、46~55、61~65、96~102、120~129、131~136、199~217、220~226、259~300、325~333、337~369、413~425、432~443、446~450、453~460、465~484和486~494位氨基酸残基,共222个氨基酸,占整个氨基酸序列的44%。在各β折叠单元之间存在β转角和无规则卷曲,其中β转角在34~37、56~59、65~69、81~84、92~95、116~119、137~139、142~145、218~221、228~231、244~247、267~270、290~293、314~317、320~323、334~337、390~393、408~411、424~431、433~436、443~446、450~453和460~463位氨基酸残基,共96个氨基酸,占整个氨基酸序列的19%;在34~36、59~60、140~145、227~230、312~315、332~336和428~431位氨基酸残基存在无规则卷曲,共28个氨基酸,占整个氨基酸序列的5%。

2.3Rv3812蛋白的亲水性分析Rv3812蛋白存在的低亲水性区域主要位于25~27、77~83、103~107、129~135、137~141、144~146、151~153、303~312、382~384和429~431位氨基酸残基,高亲水性区域主要位于55~65、85~99、155~159和318~324位氨基酸残基,总共有94个氨基酸,占整个氨基酸序列的19%,其中高亲水性的氨基酸占整个氨基酸序列的8%。Rv3812蛋白存在较多的疏水性区域,并且疏水性程度较高,高疏水性区域主要位于1~24、31~54、108~118、160~196、199~229、233~236、238~243、246~248、250~255、258~267、272~282、339~381、291~302、390~405、418~428和434~504位氨基酸残基;低疏水性区域主要位于100~102、121~126、147~150、313~317、328~333、385~388和407~416位氨基酸残基,总共有394个氨基酸,占整个氨基酸序列的78%,其中高疏水性的氨基酸占整个氨基酸序列的70%。

图1 结核分枝杆菌Rv3812蛋白二级结构和抗原表位预测

2.4Rv3812蛋白的表面可能性分析Rv3812的表面可能性较大的区域主要位于24~26、57~62、88~92、128~131、154~157、283~285、304~309、320~324、332~333、335~336、383~384和431~432位氨基酸残基,其他部位展示的可能性较小或表现为负值,共44个氨基酸,约占整个氨基酸序列的8%。

2.5Rv3812蛋白柔韧性分析Rv3812蛋白含有的柔韧性区域主要位于22~27、34~38、57~68、79~82、90~98、102~107、117~120、128~133、204~207、216~222、265~280、284~294、319~326、330~336、347~353、380~385、418~421、425~435、461~463和468~473位氨基酸残基,共142个氨基酸,约占整个氨基酸序列的28%。

2.6Rv3812蛋白抗原性分析Rv3812蛋白含有的抗原性区域主要位于25~32、 44~50、 56~66、79~87、 89~98、103~110 、118~121、267~274、284~295、315~327、333~339、381~387和426~436位氨基酸残基,共118个氨基酸,约占整个氨基酸序列的23%。

2.7Rv3812蛋白B细胞抗原表位的预测分析通过以上预测的Rv3812蛋白的二级结构的转角区、无规则卷曲区、蛋白质亲水性、表面可能性、柔韧性及抗原性,得到B细胞潜在优势抗原表位主要位于55~68、77~99、116~120、265~280、283~294、303~326、330~337和425~435位氨基酸残基或其附近,共113个氨基酸,约占整个氨基酸序列的22%。

2.8Rv3812蛋白T细胞抗原表位的预测分析用AMPHI方法和Rothbard-Taylor方法预测的T细胞潜在优势抗原表位主要位于6~30、55~85、97~140、159~191、202~204、208~231、251~264、270~281、287~299、311~334、337~343、349~356、368~385、394~413、428~433、437~441、470~476、479~481和488~493位氨基酸残基或其附近,共303个氨基酸,约占整个氨基酸序列的60%。

3讨论

综合运用生物信息学的技术方法对蛋白质的相关信息进行分析、处理、模拟和预测,最终预测抗原表位的模式,已为越来越多的研究者所采用[23-24]。因为这样的研究方式可以减少实验的盲目性,加强实验的目的性,大大提高实验的成功率[14]。而开发结核感染相关抗原表位,为深入研究结核感染机制、发现新的结核感染诊断标志物及获取有效的表位疫苗奠定了基础[25]。

该研究通过BLAST分析,发现Rv3812蛋白的氨基酸序列与人类蛋白质的同源性很低,不会诱导产生免疫性疾病。与黏蛋白/黏液素(MUC5AC)同源性虽然很低,但在第248~466位氨基酸残基上有22%的同源性,因此,在抗原表位设计、合成时需注意这些同源性区域,以获得交叉反应性低的、特异性的抗原表位。

该研究运用生物信息学技术对Rv3812蛋白的B细胞抗原表位进行预测,从该蛋白的二级结构、亲水性、表面可能性、柔韧性及抗原指数等方面进行分析,Rv3812蛋白α螺旋和β折叠结构数量较多,分别占整个氨基酸序列的42%和44%;在各β折叠单元之间存在β转角较多,占整个氨基酸序列的19%;但无规则卷曲相对较少,占整个氨基酸序列的5%,预示该蛋白可能含有相对较少的B细胞抗原表位;该蛋白亲水性多肽也较少,占整个氨基酸序列的19%,而高亲水性氨基酸只占8%;疏水性多肽较多,占整个氨基酸序列的78%,其中高疏水性氨基酸占比高达70%,设计表位时应注意这些区域。该蛋白含有的表面可能性区域很少,只占整个氨基酸序列的8%,说明形成表位的可能性较小;该蛋白含有的柔韧性区域较少,占整个氨基酸序列的28%,说明形成表位的可能性较小,不容易与抗体进行结合;该蛋白含有的抗原性区域也较少,占整个氨基酸序列的23%,提示可能成为表面抗原的多肽较少。综合分析得到潜在B细胞表位相对较少,占整个氨基酸序列的22%。由于考虑的方面较多,DNAStar软件预测的B细胞表位相对准确性较高。但DNAStar软件是在氨基酸一级结构的基础上应用多个参数预测B细胞抗原表位,忽略了各氨基酸之间的分子作用力,因此,对构象依赖的B细胞表位的预测有一定局限性。为进一步确认新发现的B细胞线性表位,该研究通过人工方法合成Rv3812相应的B细胞线性表位多肽并进行免疫学验证,例如酶联免疫吸附试验(ELISA法)[26],由于多肽抗原相对分子质量太小而不能产生显著的免疫反应,为此,常将多肽抗原偶联到牛血清白蛋白(BSA)、血蓝蛋白(-KLH)等较大的蛋白载体上,以期获得更高的免疫原性[27]。

该研究用DNAStar软件的AMPHI方法和Rothbard-Taylor方法预测结核分枝杆菌Rv3812蛋白T细胞潜在的优势抗原表位较多,占整个氨基酸序列的60%,是一个T细胞占优势的蛋白。Chaitra等[10,28]预测并进行鉴定的抗原表位有61~69、260~268和490~498位氨基酸残基, 61~69位氨基酸残基在该作者预测的55~85位氨基酸残基范围内,260~268位氨基酸残基中的260~264在作者预测的251~264位氨基酸残基上,265~268在作者预测的251~264位氨基酸残基的附近位置上,490~498位氨基酸残基中的490~493在作者预测的488~493位氨基酸残基上,484~498在作者预测的488~493位氨基酸残基的附近位置上。作者与Chaitra等预测的表位有些微差异,产生差异的原因可能是DNAStar软件预测T细胞表位考虑的因素较少,预测的准确性不一定高,导致有的优势表位未能预测到,也可能是由于机体内免疫应答机制的复杂性,表位预测还不能完全反应体内的实际情况。因此,作者将联合应用SYFPEITHI 软件(http://www.syfpeithi.de)、BIMAS 软件(http://www-bimas.cit.nih.gov)和NetCTL软件(http://www.cbs.dtu.dk/services/NetCTL/)进一步预测T细胞表位,以提高预测的准确度和特异性,然后再合成多肽表位做进一步的体外验证试验。例如T细胞表位可通过T 细胞增殖性试验、细胞杀伤实验、流式细胞技术、ELISPOT技术等鉴定。

总之,该研究结果显示,结核分枝杆菌Rv3812蛋白是一个T细胞抗原表位占优势的蛋白抗原,所含的潜在B细胞抗原表位较少,预测结果将为该蛋白的免疫学特性研究及其应用奠定理论基础。

参考文献

[1]谢媛琪,林小田,王昱.某区部队肺结核发病影响因素分析[J].解放军预防医学杂志,2015,33(1):11

[2]石洁,朱岩昆,郑丹薇,等.结核分枝杆菌 mpt59和 esxA 融合基因编码蛋白的原核表达及免疫原性观察[J].郑州大学学报(医学版),2015,50(6):761

[3]唐神结,肖和平.结核病流行趋势及治疗未来展望[J].中国实用内科杂志,2012,32(8):565

[4]陈艳清,张林波.结核分枝杆菌免疫逃逸分子机制的研究进展[J].免疫学杂志,2014,30(1):84

[5]COLE ST,BROSCH R,PARKHILL J,et al.Deciphering the biology of Mycobacterium tuberculosis from the complete genome sequence[J].Nature,1998,393(6685):537

[6]樊博,王巍,程小星.结核分枝杆菌PE和PPE家族蛋白抗原性的生物信息学分析[J].中华临床医师杂志:电子版,2010,4(8):1362

[7]吴静希,李艳.结核分枝杆菌特异PE/PPE蛋白家族研究进展[J].军事医学,2011,35(2):158

[8]陈恬,谢建平.结核分枝杆菌PE_PGRS17基因(Rv0978c)的功能研究[D].重庆:西南大学,2012.

[9]CHAITRA MG,NAYAK R,SHAILA MS.Modulation of immune responses in mice to recombinant antigens from PE and PPE families of proteins of Mycobacterium tuberculosis by the Ribi adjuvant[J].Vaccine,2007,25(41):7168

[10]CHAITRA MG,SHAILA MS,CHANDRA NR,et al.HLA-A*0201-restricted cytotoxic T-cell epitopes in three PE/PPE family proteins of Mycobacterium tuberculosis[J].Scand J Immunol,2008,67(4):411

[11]朱育菁,刘波,郑伟文,等.基因序列蛋白质结构分析软件Protean使用技术[J].福建农业生物技术通讯,2004,6(4):8

[12]GARNIER J,OSGUTHORPE DJ,ROBSON B.Analysis of the accuracy and implications of simple methods for predicting the secondary structure of globular proteins[J].J Mol Biol,1978,120(1):97

[13]CHOU PY,FASMAN GD.Prediction of the secondary structure of protein conformation[M].New York:Plenum Press,1990:549

[14]李海侠,毛旭虎.蛋白质抗原表位研究进展[J].微生物学免疫学进展,2007,35(1):54

[15]KYTE J,DOOLITTLE RF.A simple method for displaying the hydropathic character of a protein[J].J Mol Biol,1982,157(1):105

[16]HOPP TP,WOODS KR.A computer program for predicting protein antigenic determinants[J].Mol Immunol,1983,20(4):483

[17]黎明,于天飞.DNAStar软件在动物病毒研究中的应用实例[J].高师理科学刊,2010,30(3):61

[18]EMINI EA,HUGHES JV,PERLOW DS,et al.Induction of hepatitis A virus-neutralizing antibody by a virus-specific synthetic peptide[J].J Virol,1985,55(3):836

[19]KARPLUS PA,SCHULZ GE.Prediction of chain flexibility in proteins[J].Naturwissenschaften,1985,72(4):212

[20]JAMESON BA,WOLF H.The antigenic index: a novel algorithm for predicting antigenic determinants[J].Comput Appl Biosci,1988,4(1):181

[21]GAO XM,LIEW FY,TITE JP.Identification and characterization of T helper epitopes in the nucleoprotein of influenza A virus[J].J Immunol,1989,143(9):3007

[22]KUTUBUDDIN M,KOLASKAR AS,GALANDE S,et al.Recognition of helper T cell epitopes in envelope (E) glycoprotein of Japanese encephalitis, West Nile and Dengue viruses[J].Mol Immunol,1991,28(1/2):149

[23]赵屹,谷瑞升,杜生明.生物信息学研究现状及发展趋势[J].医学信息学杂志,2012,5(5):2

[24]刘银凤,张雷.生物信息学数据库在医学研究中的应用[J].中国病原生物学杂志,2014,9(10):961

[25]白雪娟,赵亚静,梁艳,等.结核潜伏感染蛋白Rv1737c B细胞、CTL及Th表位预测与分析[J].实用临床医药杂志,2015,19(3):5

[26]GOYAL B,KUMAR K,GUPTA D,et al.Utility of B-cell epitopes based peptides of RD1 and RD2 antigens for immunodiagnosis of pulmonary tuberculosis[J].Diagn Microbiol Infect Dis,2014,78(4):391

[27]杨军,刘妮,张婷,等.HBeAg的B细胞线性表位预测及鉴定[J].南方医科大学学报,2013,33(2):253

[28]CHAITRA MG,SHAILA MS,NAYAK R.Detection of interferon gamma-secreting CD8+T lymphocytes in humans specific for three PE/PPE proteins of Mycobacterium tuberculosis[J].Microbes Infect,2008,10(8):858

中图分类号R378.91+1

#通信作者,吴雪琼,女,1963 年7月生,博士,研究员,研究方向:新型疫苗、诊断技术和新药的研究;E-mail: wu-xueqiong@263.net;赵卫国,男,1966年1月生,博士,教授,研究方向:结核分枝杆菌的快速诊断,E-mail:zhaowg309@163.com

doi:10.13705/j.issn.1671-6825.2016.02.007

猜你喜欢
表位残基抗原
汉滩病毒糖蛋白免疫反应性表位研究进展
人分泌型磷脂酶A2-IIA的功能性动力学特征研究*
基于各向异性网络模型研究δ阿片受体的动力学与关键残基*
水介导的通讯路径对脂肪酶热稳定性的影响
“残基片段和排列组合法”在书写限制条件的同分异构体中的应用
间日疟原虫传播阻断疫苗新型候选抗原Pvs48 T.B 细胞表位的预测与分析
负载抗原DC联合CIK对肝癌免疫微环境的影响
乙型肝炎病毒B和C基因型S蛋白特异性CTL表位保守性分析
联合T、B细胞表位设计多肽疫苗的研究进展①
前列腺特异性膜抗原为靶标的放射免疫治疗进展