基于EST和GSS序列的木豆miRNA生物信息学分析

2014-07-16 13:51李崇奇周鹏蔡望伟
安徽农学通报 2014年10期

李崇奇 周鹏 蔡望伟

摘 要:应用miRtour在线分析工具对木豆EST和GSS序列进行miRNA生物信息学预测,应用psRNATarget进行靶基因预测。结果发现,43条不同的木豆miRNA成熟序列,隶属于33个不同的miRNA家族。靶基因预测发现有36条编码序列受miRNA调控,其中17条序列编码酶,2条编码转录因子,7条编码参与细胞信号转导的蛋白,5条编码参与蛋白质降解通路的蛋白。

关键词:木豆;miRNA;EST;GSS

中图分类号 Q74 文献标识码 A 文章编号 1007-7731(2014)10-17-04

Abstract:Cajanus cajan microRNA has been predicted based on EST and GSS Sequences by miRtour,whereas miRNA-targeted mRNAs has been predicted by psRNATarget. 43 unique mature miRNA sequences were found belonging to 33 different miRNA familes in Cajanus cajan. 36 coding RNAs were regulated by miRNA in which 17 targets were enzymes,2 targets were transcription factors,7 targets were protein involved in signaling transduction,5 targets were protein participated in protein degradation pathway.

Key words:Cajanus cajan;miRNA;EST;GSS

木豆(Cajanus cajan)俗称大树豆,为一年生或多年生灌木植物,耐瘠薄干旱,原产于印度,我国大约于1 500a前开始从印度引种栽培,现主要栽培于长江以南省份,种植面积超过20万hm2[1]。木豆为世界第六大食用豆类,也是唯一的木本食用豆,此外还被广泛用作动物饲料、造纸原料、药用植物和紫胶虫寄主树,也可作水土保持和土壤改良树种[2]。miRNA是一类长度为19~24bp的内源性小RNA分子,其主要通过与靶基因结合后在转录后水平进行基因表达调控,由于其参与了植物器官的发育、代谢调节和抗逆反应等一系列复杂的生物学过程[3],因而近年来被广泛应用于植物的遗传品质改良工作。本研究拟应用miRtour在线分析工具(http://bio2server.bioinfo.uni-plovdiv.bg/miRTour/)[4]对木豆的EST序列和GSS序列进行分析,识别其miRNA基因和靶基因,为进一步开展木豆分子遗传育种工作奠定理论基础。

1 材料与方法

1.1 材料 木豆的EST序列和GSS序列分别从美国国家生物技术信息中心(National Center for Biotechnology Information,NCBI)的网站(www.ncbi.nlm.nih.gov)的EST和GSS数据库中下载,共得到25 576条EST序列和90 109条GSS序列。从rfam(http://rfam.sanger.ac.uk/)网站和pfam(http://pfam.sanger.ac.uk/)网站分别下载非编码RNA数据库和蛋白质数据库。

1.2 方法 将EST序列和GSS序列分批递交到miRtour网站上传后参数设置如下:与已知miRNA序列能够比对的最小数量(Minimum number of known miRNAs to be aligned)设置为1,miRNA序列与其互补序列的不配对数(Maximum unpaired nt in miR/miR*)设置为6,其他参数默认。下载分析结果可以得到相应的miRNA序列、前体序列以及前体序列的最小自由能、最小自由能指数等相关参数。然后应用blast-2.2.27+软件中分别与rfam数据库和pfam数据库进行比对,去除非miRNA序列,即可得到miRNA前体序列和相应的miRNA序列。将预测到木豆miRNA序列和木豆EST序列上传到psRNATarget网站(http://plantgrn.noble.org/psRNATarget/)[5]进行靶基因预测。然而将预测的靶基因序列与NCBI数据库进行blast分析,进行靶基因注释。

2 结果与分析

2.1 miRNA预测 经过miRtour分析后共发现81条序列具有茎环结构,其可能为木豆miRNA前体序列。与rfam和pfam数据库比对后没有发现在这81条序列中存在除miRNA序列之外的编码序列和非编码序列。去除重复预测miRNA序列后,共预测到43条不同的木豆miRNA成熟序列(表1),其中只有cca-miR809a和cca-miR533是从EST序列预测的,其余均为从GSS序列预测。预测到的木豆miRNA序列隶属于33个不同的miRNA家族,其中成员最多的为miR159家族,有4个成员。木豆miRNA长度为20~24nt,其中长度为21nt的miRNA最多,有30个。miRNA前体长度为90~222nt,平均长度为182nt。前体序列的最小自由能都为-15.79~-101.5kCal/mol,最小自由能指数为0.70~1.62,GC含量为11.71%~61.40%。

2.2 miRNA靶基因预测 43个木豆miRNA中有24个预测到了靶基因,预测到有90条EST序列代表的编码序列受miRNA调控,但能够被注释的编码序列有36条(表2)。靶基因中有17条序列编码酶,主要包括参与蛋白质分子折叠的UDP糖基转移酶、细胞壁生成的纤维素合成酶和参与氧化还原反应的开链马钱子甙合酶等。此外靶基因中有2个编码转录因子,编码核因子;7条编码参与细胞信号转导的蛋白,编码钙调蛋白、FAM10蛋白和STAT蛋白;5条编码参与蛋白质降解通路的蛋白,编码泛素和SKP1类蛋白;其余5条编码伸展蛋白、细胞色素C、分子伴侣和阿拉伯半乳聚糖肽。

3 结论与讨论

EST序列,又称表达序列标签,是从随机选择的cDNA克隆进行5′端和3′端单一次测序获得的短的cDNA 部分序列。GSS序列,又称基因组勘测序列是基因组DNA克隆的一次性部分测序序列,包括随机的基因组勘测序列、cosmid/BAC/YAC末端序列、通过Exon trapped获得基因组序列、通过Alu PCR获得的序列以及转座子标记(transposon-tagged)序列等[6]。目前EST序列和GSS序列被广泛地应用于植物miRNA的预测分析,然而应用GSS序列识别植物miRNA的数量与其GSS序列数量密切相关。Vishwakarma和Jadeja[7]对麻风树的46 862条EST和1 569条GSS序列发现24个miRNA基因;Katiyar等[8]对高粱240 161条EST和799 504条GSS序列发现31个新miRNA基因,但在mirBase数据库中已有148个miRNA基因。罗晓燕等[6]对核果类作物107 982条EST和48 273条GSS分析发现11个miRNA。李婧等[9]对玉米中EST和GSS分析发现10个miRNA。本研究对木豆25 576条EST序列和90 109条GSS序列进行生物信息学分析后发现43个miRNA基因,其识别效率与其它基于GSS的研究相差不大。靶基因分析发现,木豆miRNA主要调控核因子、泛素降解蛋白途径参与蛋白、细胞信号转导通路蛋白等36条编码序列。然而Bartel等[10]认为每个物种的miRNA数量应该达到其基因数量的1%,Lewis等对人类的研究发现30%的基因都受到miRNA的调控[11]。因而对于木豆的miRNA基因和靶基因识别,还需要进一步通过全基因组范围内进行生物信息学分析或通过小RNA测序等相关实验技术进行识别。

参考文献

[1]唐军,王文强,黄春琼,等.木豆育种及分子生物学研究进展[J].热带农业科学,2013,33(8):36-40.

[2]向锦,庞雯,王建红.木豆在中国的应用前景[J].四川草原,2003(4):38-40.

[3]Yang TW,Xue LG,An LZ. Functional diversity of miRNA in plants[J].Plant Science,2007,172(3):423-432.

[4]Milev I,Yahubyan G,Minkov I,et al.miRTour:Plant miRNA and target prediction tool[J].Bioinformation,2011,6(6):248-249.

[5]Dai X,Zhao PX.psRNATarget:a plant small RNA target analysis server[J].Nucleic Acids Res,2011,39:W155-159.

[6]罗晓燕,侍婷,蔡斌,等. 核果类果树中microRNAs的生物信息学预测及验证[J].林业科学,2012,(48)2:75-81.

[7]Vishwakarma NP,Jadeja VJ.Identification of miRNA encoded by Jatropha curcas from EST and GSS[J].Plant Signal Behav,2013,8(2):e23 152.

[8]Katiyar A,Smita S,Chinnusamy V,Pandey DM,Bansal K.Identification of miRNAs in sorghum by using bioinformatics approach[J].Plant Signal Behav,2012,7(2):246-259.

[9]李婧,熊莉丽,胡久梅,等.基于EST 和GSS 序列的玉米未知微RNA的数据挖掘[J].生物技术通报,2011,12:108-112.

[10]Bartel DP.MicroRNAs: Genomics,biogenesis,mechanism,and function[J].Cell,2004,116(2):281-297.

[11]Lewis BP,Burge CB,Bartel DP.Conserved seed pairing,often flanked by adenosines,indicates that thousands of human genes are microRNA targets[J].Cell,2005,120(1):15-20.

(责编:张宏民)

3 结论与讨论

EST序列,又称表达序列标签,是从随机选择的cDNA克隆进行5′端和3′端单一次测序获得的短的cDNA 部分序列。GSS序列,又称基因组勘测序列是基因组DNA克隆的一次性部分测序序列,包括随机的基因组勘测序列、cosmid/BAC/YAC末端序列、通过Exon trapped获得基因组序列、通过Alu PCR获得的序列以及转座子标记(transposon-tagged)序列等[6]。目前EST序列和GSS序列被广泛地应用于植物miRNA的预测分析,然而应用GSS序列识别植物miRNA的数量与其GSS序列数量密切相关。Vishwakarma和Jadeja[7]对麻风树的46 862条EST和1 569条GSS序列发现24个miRNA基因;Katiyar等[8]对高粱240 161条EST和799 504条GSS序列发现31个新miRNA基因,但在mirBase数据库中已有148个miRNA基因。罗晓燕等[6]对核果类作物107 982条EST和48 273条GSS分析发现11个miRNA。李婧等[9]对玉米中EST和GSS分析发现10个miRNA。本研究对木豆25 576条EST序列和90 109条GSS序列进行生物信息学分析后发现43个miRNA基因,其识别效率与其它基于GSS的研究相差不大。靶基因分析发现,木豆miRNA主要调控核因子、泛素降解蛋白途径参与蛋白、细胞信号转导通路蛋白等36条编码序列。然而Bartel等[10]认为每个物种的miRNA数量应该达到其基因数量的1%,Lewis等对人类的研究发现30%的基因都受到miRNA的调控[11]。因而对于木豆的miRNA基因和靶基因识别,还需要进一步通过全基因组范围内进行生物信息学分析或通过小RNA测序等相关实验技术进行识别。

参考文献

[1]唐军,王文强,黄春琼,等.木豆育种及分子生物学研究进展[J].热带农业科学,2013,33(8):36-40.

[2]向锦,庞雯,王建红.木豆在中国的应用前景[J].四川草原,2003(4):38-40.

[3]Yang TW,Xue LG,An LZ. Functional diversity of miRNA in plants[J].Plant Science,2007,172(3):423-432.

[4]Milev I,Yahubyan G,Minkov I,et al.miRTour:Plant miRNA and target prediction tool[J].Bioinformation,2011,6(6):248-249.

[5]Dai X,Zhao PX.psRNATarget:a plant small RNA target analysis server[J].Nucleic Acids Res,2011,39:W155-159.

[6]罗晓燕,侍婷,蔡斌,等. 核果类果树中microRNAs的生物信息学预测及验证[J].林业科学,2012,(48)2:75-81.

[7]Vishwakarma NP,Jadeja VJ.Identification of miRNA encoded by Jatropha curcas from EST and GSS[J].Plant Signal Behav,2013,8(2):e23 152.

[8]Katiyar A,Smita S,Chinnusamy V,Pandey DM,Bansal K.Identification of miRNAs in sorghum by using bioinformatics approach[J].Plant Signal Behav,2012,7(2):246-259.

[9]李婧,熊莉丽,胡久梅,等.基于EST 和GSS 序列的玉米未知微RNA的数据挖掘[J].生物技术通报,2011,12:108-112.

[10]Bartel DP.MicroRNAs: Genomics,biogenesis,mechanism,and function[J].Cell,2004,116(2):281-297.

[11]Lewis BP,Burge CB,Bartel DP.Conserved seed pairing,often flanked by adenosines,indicates that thousands of human genes are microRNA targets[J].Cell,2005,120(1):15-20.

(责编:张宏民)

3 结论与讨论

EST序列,又称表达序列标签,是从随机选择的cDNA克隆进行5′端和3′端单一次测序获得的短的cDNA 部分序列。GSS序列,又称基因组勘测序列是基因组DNA克隆的一次性部分测序序列,包括随机的基因组勘测序列、cosmid/BAC/YAC末端序列、通过Exon trapped获得基因组序列、通过Alu PCR获得的序列以及转座子标记(transposon-tagged)序列等[6]。目前EST序列和GSS序列被广泛地应用于植物miRNA的预测分析,然而应用GSS序列识别植物miRNA的数量与其GSS序列数量密切相关。Vishwakarma和Jadeja[7]对麻风树的46 862条EST和1 569条GSS序列发现24个miRNA基因;Katiyar等[8]对高粱240 161条EST和799 504条GSS序列发现31个新miRNA基因,但在mirBase数据库中已有148个miRNA基因。罗晓燕等[6]对核果类作物107 982条EST和48 273条GSS分析发现11个miRNA。李婧等[9]对玉米中EST和GSS分析发现10个miRNA。本研究对木豆25 576条EST序列和90 109条GSS序列进行生物信息学分析后发现43个miRNA基因,其识别效率与其它基于GSS的研究相差不大。靶基因分析发现,木豆miRNA主要调控核因子、泛素降解蛋白途径参与蛋白、细胞信号转导通路蛋白等36条编码序列。然而Bartel等[10]认为每个物种的miRNA数量应该达到其基因数量的1%,Lewis等对人类的研究发现30%的基因都受到miRNA的调控[11]。因而对于木豆的miRNA基因和靶基因识别,还需要进一步通过全基因组范围内进行生物信息学分析或通过小RNA测序等相关实验技术进行识别。

参考文献

[1]唐军,王文强,黄春琼,等.木豆育种及分子生物学研究进展[J].热带农业科学,2013,33(8):36-40.

[2]向锦,庞雯,王建红.木豆在中国的应用前景[J].四川草原,2003(4):38-40.

[3]Yang TW,Xue LG,An LZ. Functional diversity of miRNA in plants[J].Plant Science,2007,172(3):423-432.

[4]Milev I,Yahubyan G,Minkov I,et al.miRTour:Plant miRNA and target prediction tool[J].Bioinformation,2011,6(6):248-249.

[5]Dai X,Zhao PX.psRNATarget:a plant small RNA target analysis server[J].Nucleic Acids Res,2011,39:W155-159.

[6]罗晓燕,侍婷,蔡斌,等. 核果类果树中microRNAs的生物信息学预测及验证[J].林业科学,2012,(48)2:75-81.

[7]Vishwakarma NP,Jadeja VJ.Identification of miRNA encoded by Jatropha curcas from EST and GSS[J].Plant Signal Behav,2013,8(2):e23 152.

[8]Katiyar A,Smita S,Chinnusamy V,Pandey DM,Bansal K.Identification of miRNAs in sorghum by using bioinformatics approach[J].Plant Signal Behav,2012,7(2):246-259.

[9]李婧,熊莉丽,胡久梅,等.基于EST 和GSS 序列的玉米未知微RNA的数据挖掘[J].生物技术通报,2011,12:108-112.

[10]Bartel DP.MicroRNAs: Genomics,biogenesis,mechanism,and function[J].Cell,2004,116(2):281-297.

[11]Lewis BP,Burge CB,Bartel DP.Conserved seed pairing,often flanked by adenosines,indicates that thousands of human genes are microRNA targets[J].Cell,2005,120(1):15-20.

(责编:张宏民)