芒果果实bHLH家族转录因子的生物信息学分析

2019-06-11 11:14郑斌文定青武红霞邹明宏刘恒
热带作物学报 2019年2期
关键词:生物信息学芒果

郑斌 文定青 武红霞 邹明宏 刘恒

摘  要  bHLH家族作为植物中较大的转录因子家族之一,在真核生物生长发育调控中具有重要作用。本研究基于芒果果实转录组数据,利用生物信息学方法鉴定出87个bHLH家族蛋白,其中酸性蛋白所占比例较大,大部分为不稳定蛋白,且均为不含信号肽的亲水性蛋白,除CL10714.Contig1为膜结合转录因子外,其余均不含跨膜结构。芒果bHLH蛋白结构域有多个氨基酸位点保守性较高,87个芒果bHLH蛋白中73个(83.91%)具有E-box结合功能。GO分析发现芒果bHLH蛋白共注释到生物学过程、细胞组分和分子功能3大类功能的17个亚类。进化树分析发现芒果bHLH蛋白与拟南芥有较高的保守性,并基于进化树对部分bHLH蛋白的功能进行了预测。本研究结果将为下一步芒果bHLH蛋白的功能研究奠定基础。

关键词  芒果;bHLH家族;转录因子;生物信息学

中图分类号  S667.7     文献标识码  A

碱性螺旋-环-螺旋(basic Helix-Loop-Helix, bHLH)转录因子为真核生物蛋白中的一个大家族[1],在生物的生长发育调控中起着极为重要的作用。bHLH转录因子于1989年首次在动物中发现,因含有bHLH结构域而得名[2]。bHLH结构域由大约60个氨基酸组成,分为碱性氨基酸区域(basic)和α-螺旋-环-α-螺旋区(HLH),碱性氨基酸区位于bHLH结构域的N端,长度约为15个氨基酸,主要负责与DNA顺式元件结合,HLH区位于该结构域的C-端,由大约40个氨基酸组成,具有形成二聚体的特性[2-4]。

植物中bHLH转录因子是仅次于MYB的第二大转录因子家族[5],其参与调控抗逆、器官发育、激素响应及代谢物合成等多个生物学进程[6]。与对照相比,拟南芥中过表达bHLH122基因的株系对干旱、NaCl和渗透胁迫的抗性增强[7];Jiang等[8]发现bHLH转录因子参与了黄瓜果实长度的调控;在拟南芥中,bHLH基因BEE1、BEE2和BEE3参与对油菜素内酯的响应,且这3个基因在油菜素内酯的信号传导中功能冗余[9];MdbHLH33参与调控苹果花色素苷的生物合成[10]。

基于高通量测序及生物信息学分析技术,人们已对一些植物的bHLH基因家族进行了挖掘、比较分析和功能预测,并对部分bHLH基因进行了功能分析。基于基因组信息,Geng等[11]在甜橙中发现56个bHLH转录因子,其中CsbHLH18通过调控抗氧化基因调节植株耐寒性及活性氧平衡。芒果素有“热带果王”之美誉,含有丰富的糖类、蛋白质、维生素、类胡萝卜素和钙质等营养成分,在我国主要分布在海南、广西、云南、四川、广东和福建等地,已成为我国热区农业的支柱产业[12],但目前关于芒果bHLH转录因子的研究还鲜有报道。为此,本研究基于芒果果实转录组测序结果,利用生物信息学手段对bHLH家族基因进行鉴定和分析,为进一步探究芒果bHLH转录因子的功能奠定基础。

1  材料与方法

1.1  材料

芒果蛋白序列来源于構建的转录组数据库(GenBank accession SRP035450)。拟南芥bHLH家族氨基酸序列下载于拟南芥信息资源(TAIR)数据库(http://www.arabidopsis.org/)。

1.2  方法

1.2.1  芒果bHLH家族蛋白的鉴定  从Pfam 31.0[13]数据库(http://pfam.xfam.org/)下载HLH结构域种子文件PF00010和PF14215,利用HMMER 3.1b2[14]软件分别构建Profile HMM(数值表格型隐马可夫模型),基于Profile HMM分别检索芒果转录组蛋白数据库并对检索结果进行整合去冗余,得到候选蛋白。将候选蛋白用SMART[15](http://smart.embl-heidelberg.de/)分析HLH结构域,同时用NCBI blast(https://blast. ncbi. nlm.nih.gov/Blast.cgi)和植物转录因子数据库[16](PlantTFDB)(http://planttfdb.cbi.pku.edu.cn/)进行进一步分析鉴定,筛选出具有全长氨基酸序列的芒果bHLH转录因子。

1.2.2  芒果bHLH家族蛋白生物信息学分析  基于筛选鉴定的芒果bHLH家族蛋白,利用在线工具ProtParam(http://web.expasy.org/protparam/)对其进行理化性质分析,并用在线软件SOPMA[17](https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_ sopma.html)分析其二级结构,信号肽的预测应用SignalP 4.1 Server[18](http://www. cbs.dtu.dk/services/SignalP/)软件进行分析,最后采用TMHMM Server v. 2.0(http://www.cbs. dtu.dk/services/TMHMM/)在线软件完成跨膜结构分析。

1.2.3  芒果bHLH家族蛋白结构域分析  使用BioEdit软件对芒果bHLH家族蛋白结构域进行比对,将比对结果用在线软件WebLogo 3(http://weblogo.threeplusone.com/cre ate.cgi)分析结构域序列标签。

1.2.4  芒果bHLH家族蛋白系统发育树构建及基序分析  利用MEGA 6.0软件内置的Clustal W程序对芒果bHLH家族蛋白的氨基酸序列进行比对分析,将比对结果采用邻接法构建系统发育树,选用Poisson模型,并进行自举评估(Bootstrap),重复次数为1000次,缺失值处理方式为配对状态删除(pairwise deletion),其他参数使用默认值[19]。运用MEME 4.11.02程序[20]分析芒果bHLH家族蛋白的基序,设定基序宽度为6~50,基序数量为5,其余参数为默认值。

1.2.5  芒果bHLH家族蛋白GO分析  首先使用Blast2GO 4.0软件[21]对芒果bHLH家族蛋白序列进行GO(gene ontology)注释,然后用在线软件WEGO[22](http://wego.genomics.org.cn/cgi-bin/ wego/index.pl)绘制GO功能分类图。

1.2.6  芒果和拟南芥bHLH蛋白进化树构建  使用MEGA 6.0软件采用最大似然法将芒果bHLH蛋白和拟南芥bHLH蛋白共同构建进化树。

2  结果与分析

2.1  芒果bHLH家族成员的获得

基于从Pfam 31.0数据库下载的种子文件PF00010和PF14215,使用HMMER 3.1b2软件从芒果转录组49 117个蛋白序列中分别筛选出211个和86个候选蛋白序列,逐个进行结构域及同源比对分析,去除重复及非全长氨基酸序列,共获得87个芒果bHLH家族蛋白序列(表1),其中最小的bHLH蛋白含89个氨基酸,最大的bHLH蛋白含944个氨基酸。

2.2  芒果bHLH家族蛋白特性分析

对芒果bHLH家族蛋白进一步进行生物信息学分析(表1),理化性质分析发现:87个芒果bHLH家族蛋白的相对分子量在10.17~102.47 ku之间,其中含61个酸性蛋白(理论等电点<7)和26个碱性蛋白(理论等电点>7);不稳定指数(Ⅱ)分析发现除Unigene21025和CL12 02.Contig3为稳定蛋白外(Ⅱ<40),其余均为不稳定蛋白(Ⅱ>40);平均疏水指数均小于0,为亲水性蛋白。二级结构分析发现:芒果bHLH家族蛋白中无规卷曲和α-螺旋所占比例较大,其中50个为无规卷曲所占比例最大,36个为α-螺旋所占比例最大,CL5018.Contig2二级结构中α-螺旋和无规卷曲所占比例一致。87个bHLH家族蛋白均不含信号肽。跨膜结构分析发现CL10714.Contig1含跨膜结构,为膜结合转录因子,其余bHLH蛋白均不含跨膜结构。

2.3  芒果bHLH蛋白结构域分析及分类

使用BioEdit对87个芒果bHLH蛋白的结构域进行比对,并用WebLogo 3获得芒果bHLH蛋白的结构域序列标签(图1)。分析发现,在芒果bHLH结构域的2个α-螺旋区内,23和54位点均为疏水性氨基酸亮氨酸(L),100%的20、44和51位点,98.85%的16位点以及97.70%的27位点为疏水性氨基酸(A、F、I、L、M、P、V、W或Y),而这些疏水性氨基酸对bHLH的蛋白二级结构的稳定性起着关键作用[23]。

在bHLH结构域的碱性区内,有多个关键位点用于识别并结合DNA特定碱基序列,其中9位点的谷氨酸(E)用于与DNA双螺旋结构的大沟结合[23],分析发现,73个(83.91%)芒果bHLH结构域的9位点为谷氨酸(E),其中72个在9位点为谷氨酸(E)且12位点为精氨酸(R),而且研究发现具有9位点为E且12位点为R结构的bHLH蛋白具有识别并结合E-box序列(CANNTG)的功能[24],57個(65.52%)bHLH蛋白结构域在5位点为组氨酸(H)或赖氨酸(K)、9位点为谷氨酸(E)且13位点为精氨酸(R),而在植物中该结构被证实用于识别并结合G-box[25]。在14个9位点不是谷氨酸(E)的bHLH结构域中,有3个bHLH结构域的碱性区内含5个及以上碱性氨基酸(R、K或H),这3个bHLH蛋白可能在非E-box序列处与DNA结合[4]。11个bHLH结构域9位点不是谷氨酸(E)且碱性区内含5个以下碱性氨基酸(R、K或H),该类bHLH蛋白不具有结合DNA功能[26]。

2.4  芒果bHLH家族蛋白进化树及基序分析

通过MEGA 6.0软件构建芒果bHLH家族蛋白的系统进化树。由图2可知,在进化树中,相同类型的bHLH蛋白聚在一起,且相近分支的bHLH序列长度及结构域位置相近。

3  讨论

植物bHLH蛋白参与抗逆、生长发育、生物合成及信号传导等生理生化过程[35]。基于生物信息学分析技术,目前已从一些植物如拟南芥[36]、水稻[37]、人参[38]、西瓜[39]、茶树[40]、葡萄[41]、苹果[42]等分别鉴定出162、167、169、96、120、110、175个bHLH蛋白。

本研究基于芒果果实转录组数据,鉴定出87个bHLH家族蛋白,其中酸性蛋白所占比例较大,大部分为不稳定蛋白,且均为不含信号肽的亲水性蛋白,此现象与‘短柄樱桃[43]等多种植物的bHLH家族蛋白相似。除CL10714.Contig1为膜结合转录因子外,其余bHLH蛋白均不含跨膜结构,推测CL10714.Contig1与芒果对环境的胁迫响应有关[44]。大部分芒果bHLH家族蛋白二级结构中无规卷曲所占比例最大,该结果与云南红皮梨bHLH转录因子一致[45]。

芒果bHLH蛋白结构域有多个氨基酸位点保守性较高,且保守位点与西瓜[39]和莲[46]bHLH蛋白的分析结果相似。87个芒果bHLH蛋白中的73个(83.91%)具有E-box结合功能,57个(65.52%)具有G-box结合功能,该结果与拟南芥(60.54%)和水稻(56.89%)[37]的分析结果相似。

进化树上相近分枝的芒果bHLH的基序组成相同,序列长度及结构域位置相近,与拟南芥bHLH的分析结果相似[27]。

芒果bHLH蛋白共注释到GO分类中生物学过程、细胞组分和分子功能3大类功能的17个亚类,其中56.32% bHLH蛋白注释到结合功能。

对芒果和拟南芥bHLH蛋白共同构建的进化树分析发现,芒果bHLH蛋白与拟南芥有较高的保守性,大部分芒果bHLH蛋白与拟南芥不同亚组的bHLH蛋白聚在一起,推测芒果bHLH蛋白与相近的拟南芥bHLH蛋白具有相似的功能,该分析将为下一步芒果bHLH蛋白的功能分析提供参考。基于此方法,Chen等[47]发现与拟南芥AtbHLH112同源的水稻OsbHLH068在参与盐胁迫响应时与AtbHLH112功能一致,参与花期调控时与AtbHLH112功能相反。

bHLH蛋白参与植物的多种生命活动,本研究从芒果转录组数据中鉴定87个bHLH家族蛋白,为今后芒果bHLH家族蛋白的研究提供了基础。由于转录组数据的局限性,所鉴定的仅为芒果bHLH家族的部分蛋白序列,因此,芒果bHLH家族蛋白还有待进一步挖掘和研究。本研究仅对部分芒果bHLH蛋白进行了功能预测,其具体功能有待进一步验证。

参考文献

Ledent V, Vervoort M. The basic helix-loop-helix protein family: comparative genomics and phylogenetic analysis[J]. Genome Research, 2001, 11(5): 754-770.

Murre C, Mccaw P S, Baltimore D. A new DNA binding and dimerization motif in immunoglobulin enhancer binding, daughterless, MyoD, and myc, proteins[J]. Cell, 1989, 56(5): 777-783.

FerrédAmaré A R, Pognonec P, Roeder R G, et al. Structure and function of the b/HLH/Z domain of USF[J]. The EMBO Journal, 1994, 13(1): 180-189.

Toledoortiz G, Huq E, Quail P H. The Arabidopsis basic/helix-loop-helix transcription factor family[J]. Plant Cell, 2003, 15(8): 1749-1770.

杨鹏程, 周  波, 李玉花. 植物花青素合成相关的bHLH转录因子[J]. 植物生理学报, 2012, 48(8): 747-758.

Kazan K, Manners J M. MYC2: The master in action[J]. Molecular Plant, 2013, 6(3): 686-703.

Liu W, Tai H, Li S, et al. bHLH122 is important for drought and osmotic stress resistance in Arabidopsis, and in the repression of ABA catabolism[J]. New Phytologist, 2014, 201(4): 1192-1204.

Jiang L, Yan S, Yang W, et al. Transcriptomic analysis reveals the roles of microtubule-related genes and transcription factors in fruit length regulation in cucumber (Cucumis sativus L.)[J]. Scientific Reports, 2015, 5: 8031.

Friedrichsen D M, Nemhauser J, Muramitsu T, et al. Three redundant brassinosteroid early response genes encode putative bHLH transcription factors required for normal growth[J]. Genetics, 2002, 162(3): 1445-1456.

Xu H, Wang N, Liu J, et al. The molecular mechanism underlying anthocyanin metabolism in apple using the MdMYB16 and MdbHLH33 genes[J]. Plant Molecular Biology, 2017, 94(1-2): 149-165.

Geng J, Liu J. The transcription factor CsbHLH18 of sweet orange (Citrus sinensis) functions in modulation of cold tolerance and reactive oxygen species homeostasis by regulating the antioxidant gene[J]. Journal of Experimental Botany, 2018, 69(10): 2677-2692.

武紅霞, 许文天, 罗  纯, 等. 芒果果实转录组数据组装及基因功能注释[J]. 热带作物学报, 2016, 37(11): 2191-2198.

Finn R D, Coggill P, Eberhardt R Y, et al. The Pfam protein families database: towards a more sustainable future[J]. Nucleic Acids Research, 2016, 44(Database issue): D279-D285.

Finn R D, Clements J, Eddy S R. HMMER web server: interactive sequence similarity searching[J]. Nucleic Acids Research, 2011, 39(Web Server issue): D29-D37.

Letunic I, Doerks T, Bork P. SMART 7: recent updates to the protein domain annotation resource[J]. Nucleic Acids Research, 2012, 40(Database issue): D302-D305.

Jin J, Tian F, Yang D, et al. PlantTFDB 4.0: toward a central hub for transcription factors and regulatory interactions in plants[J]. Nucleic Acids Research, 2017, 45(Database issue): D1040-D1045.

Geourjon C, Deléage G. SOPMA: significant improvements in protein secondary structure prediction by consensus prediction from multiple alignments[J]. Computer Applic ations in the Biosciences Cabios, 1995, 11(6): 681- 684.

Petersen T N, Brunak S, Von H G, et al. SignalP 4.0: discriminating signal peptides from transmembrane regions[J]. Nature Methods, 2010, 8(10): 785-786.

Hall B G. Building phylogenetic trees from molecular data with MEGA[J]. Molecular Biology and Evolution, 2013, 30(5): 1229-1235.

Bailey T L, Elkan C. Fitting a mixture model by expectation maximization to discover motifs in biopolymers[C]// International Conference on Intelligent Systems for Molecular Biology, 1994: 28-36.

Conesa A, G?tz S, Garcíagómez J M, et al. Blast2GO: a universal tool for annotation, visualization and analysis in functional genomics research[J]. Bioinformatics, 2005, 21(18): 3674-3676.

Ye J, Fang L, Zheng H, et al. WEGO: a web tool for plotting GO annotations[J]. Nucleic Acids Research, 2006, 34(Web Server issue): W293-W297.

Atchley W R, Zhao J. Molecular architecture of the DNA-binding region and its relationship to classification of basic Helix–Loop–Helix proteins[J]. Molecular Biology & Evolution, 2007, 24(1): 192-202.

Ellenberger T, Fass D, Arnaud M, et al. Crystal structure of transcription factor E47: E-box recognition by a basic region helix-loop-helix dimer[J]. Genes & Development, 1994, 8(8): 970-980.

Hudson K A, Hudson M E. A classification of basic Helix-Loop-Helix transcription factors of Soybean[J]. International Journal of Genomics, 2015, 2015(3): 603182.

Atchley W R, Fitch W M. A natural classification of the basic helix-loop-helix class of transcription factors[J]. Proceedings of the National Academy of Sciences of the United States of America, 1997, 94(10): 5172-5176.

Heim M A, Jakoby M, Werber M, et al. The basic helix-loop-helix transcription factor family in plants: a genome-wide study of protein structure and functional diversity[J]. Molecular Biology & Evolution, 2003, 20(5): 735-747.

Wang H, Yang L, Pan J, et al. The bHLH transcription factors MYC2, MYC3, and MYC4 are required for jasmonate-mediated inhibition of flowering in Arabidopsis[J]. Molecular Plant, 2017, 10(11): 1461-1464.

Selote D, Samira R, Matthiadis A, et al. Iron-binding E3 ligase mediates iron response in plants by targeting basic helix-loop-helix transcription factors[J]. Plant Physiology, 2015, 167(1): 273-286.

Li X, Zhang H, Ai Q, et al. Two bHLH transcription factors, bHLH34 and bHLH104, regulate iron homeostasis in Arabidopsis thaliana[J]. Plant Physiology, 2016, 170(4): 2478-2493.

Heisler M G, Atkinson A, Bylstra Y H, et al. SPATULA, a gene that controls development of carpel margin tissues in Arabidopsis, encodes a bHLH protein[J]. Development, 2001, 128(7): 1089-1098.

Rajani S, Sundaresan V. The Arabidopsis myc/bHLH gene ALCATRAZ enables cell separation in fruit dehiscence[J]. Current Biology, 2001, 11(24): 1914-1922.

Liu Y, Ji X, Nie X, et al. Arabidopsis AtbHLH112 regulates the expression of genes involved in abiotic stress tolerance by binding to their E-box and GCG-box motifs[J]. New Phytologist, 2015, 207(3): 692-709.

Li Y, Wang H, Li X, et al. Two DELLA-interacting proteins bHLH48 and bHLH60 regulate flowering under long-day conditions in Arabidopsis thaliana[J]. Journal of Experimen tal Botany, 2017, 68(11): 2757-2767.

劉晓月, 王文生, 傅彬英. 植物bHLH转录因子家族的功能研究进展[J]. 生物技术进展, 2011, 1(6): 391-397.

Bailey P C, Weisshaar B. Update on the basic helix- loop-helix transcription factor gene family in Arabidopsis thaliana[J]. Plant Cell, 2003, 15(11): 2497-2502.

Li X, Duan X, Jiang H, et al. Genome-Wide analysis of Basic/Helix-Loop-Helix transcription factor family in Rice and Arabidopsis[J]. Plant Physiology, 2006, 141(4): 1167-1184.

Chu Y, Xiao S, Su H, et al. Genome-wide characterization and analysis of bHLH transcription factors in Panax ginse ng[J]. Acta Pharmaceutica Sinica B, 2018, 8(4): 666-677.

何  洁, 顾秀容, 魏春华, 等. 西瓜bHLH转录因子家族基因的鉴定及其在非生物胁迫下的表达分析[J]. 园艺学报, 2016, 43(2): 281-294.

Cui X, Wang Y, Liu Z, et al. Transcriptome-wide identifica tion and expression profile analysis of the bHLH family genes in Camellia sinensis[J]. Functional & Integrative Ge nomics, 2018, 18(15): 489-503.

尹  欢, 蔡  斌, 李成慧, 等. 葡萄bHLH转录因子家族全基因组分析[J]. 江西农业学报, 2013, 25(9): 1-6.

Yang J, Min G, Li H, et al. Identification and expression analy sis of the apple (Malus×domestica) basic helix-loop- helix transcription factor family[J]. Scientific Reports, 2017, 7(1): 28.

应炎标, 朱友银, 郭卫东, 等. 樱桃bHLH转录因子家族基因鉴定及表达分析[J]. 分子植物育种, 2018, 16(14): 4559-4568.

王  楠, 向凤宁, 李  朔. 植物膜结合转录因子与胁迫响应[J]. 生命科学, 2016(7): 799-806.

孟富宣, 周  军, 辛培尧, 等. 云南红皮梨bHLH转录因子的生物信息学分析[J]. 基因组学与应用生物学, 2013(5): 652-659.

Hudson K A, Hudson M E. The basic helix-loop-helix tran scription factor family in the sacred lotus, Nelumbo Nucifera[J]. Tropical Plant Biology, 2014, 7(2): 65-70.

Chen H, Hsieh-Feng V, Liao P, et al. The function of OsbHLH068, is partially redundant with its homolog, AtbHLH112, in the regulation of the salt stress response but has opposite functions to control flowering in Arabidopsis[J]. Plant Molecular Biology, 2017, 94(4-5): 531-548.

猜你喜欢
生物信息学芒果
我爱刷牙
我爱刷牙
我才不要穿
小洞会“咬”人
小洞会“咬”人
浅谈医学院校生物信息学专业青年教师规范培训模式的建立
“PBL+E—learning”教学模式探索
移动教学在生物信息学课程改革中的应用
中医大数据下生物信息学的发展及教育模式浅析
生物信息学课堂危机及对策研究