甜菜雄性不育系与保持系转录组学测序分析

2018-01-24 18:35刘天骄代翠红程大友罗成飞
中国甜菜糖业 2018年2期
关键词:保持系甜菜花蕾

刘天骄,代翠红,程大友,崔 杰,罗成飞

(哈尔滨工业大学 化工与化学学院,黑龙江 哈尔滨 150090)

0 引言

甜菜(Beta vulgaris ssp. vulgaris)是温带地区重要的产糖作物。据联合国粮食农业组织(FAO)统计,世界每年30%的植物糖产量均出自于甜菜。我国目前甜菜的种植面积每年维持在22.4万公顷左右,主要种植地区在黑龙江内蒙新疆等中国北方地区。糖是甜菜的主要产品,是人民生活不可缺少的营养物质,也是食品工业,饮料工业和医药工业的重要原料[1]。除生产蔗糖外,甜菜及其副产品还有广泛开发利用前景。鉴于甜菜广泛的应用性,培育高产稳产品种成为甜菜育种工作中的主要目标。

甜菜属于典型的利用杂种优势现象进行繁育的异花授粉作物,要获得更高的产量,必须利用杂种优势特性。提高杂交效率有三个途径:人工去雄、化学去雄以及细胞质雄性不育系的利用。但甜菜为雌雄同花且花器较小、无限花序的二年生作物[2]。人工去雄生产杂交种几乎不可能,因此要充分利用杂种优势必须选育不育系、保持系和授粉系。而三系的选育中,不育系和保持系的选育又是其工作的关键和核心[3]。收获时只收取母本上的种子,这样的种子杂交率高、纯度好,在田间的表现也趋于一致。因此如何快速选育甜菜保持系和不育系也一直是国内外甜菜育种科技工作者研究的重点[4,7]。

不育系育性分为细胞核雄性不育、细胞质雄性不育以及质核互作雄性不育。生产上使用的甜菜品种基本都是以细胞质雄性不育系为母本,优良授粉系作为父本杂交而成。细胞质雄性不育是核-质关系不协调导致的花粉败育[5]。细胞核和细胞质是细胞赖以生存的基础,失活细胞具有核遗传系统与细胞质遗传系统,其中胞质遗传系统包括叶绿体、线粒体遗传系统[6]。核-叶绿体-线粒体三者既相互独立,又相互联系、渗透、影响。在长期的系统进化中,植物形成了三者协调的关系,从而保证了植物正常生长发育。然而一旦协调被打破,花粉发育过程中核质之间正常的信息交流改变,导致花粉败育[8]。

近年来,分子辅助育种技术的研究与传统育种方法相结合使得作物育种工作和目标有了突飞猛进的发展,育种家也把研究重点放在植物的分子水平,从基因组、转录组与蛋白质组中探寻高产优质的种质资源[6,9,10,11,16]。因此,随着新一代高通量测序,包括denovo从头测序、转录组测序、基因组重测序等技术的推广,RNA测序技术这一新兴分子生物学与生物信息学相结合的技术凭借其信噪比高、分辨率高、应用范围广等优势,在基因表达和转录组学研究中成为重要的实验手段,在诸多基因组学相关的研究中均被广泛应用并为后基因组学研究提供了大量的数据支持[13,14,15]。本研究利用转录组测序技术对甜菜质核互作型雄性不育系及保持系花蕾发育的3个阶段基因差异表达进行研究,以期揭示Owen型甜菜不育系与保持系花蕾不同发育时期基因表达的差异.

1 材料方法

1.1 供试材料

所用材料来自本课题组自育的甜菜不育系DY5-CMS及其保持系DY5-O。经过春化处理的甜菜母根,种植在甜菜育种试验田,6月-7期间进行甜菜花期取样。甜菜花蕾发育分成3个时期;雄蕊原基分化期(I期)、四分体时期(II期)及单核时期(III期)。本实验分别选取甜菜dy5保持系O及雄性不育系CMS的I期、II期和III期花蕾作为实验样本,委托晶能生物技术(上海)有限公司,采用illumina Hiseq2000测序平台的双端100 bp测序模式分别对这6组样本进行高通量测序。原始数据经过引物与接头序列去除, 最终保留高测序质量的碱基片断。保留的测序序列(remained reads)片断用于后续RNA-Seq项目分析模块的分析。

1.2 测序分析

1.2.1 表达谱测序质量控制分析

深度转录组测序(RNA-seq)提供了探索基因组功能元件的技术平台。使用RNA-Seq 数据不仅可以获得基因表达谱机器改变,探索可变剪切事件,识别新转录本及其区域,探索异常转录本结构(例如基因融合)或编码区变异体。同时,RNA-Seq也可以探索低频率表达的转录本。RNA-Seq是一项复杂多步骤实验分析过程,其中涉及到样本制备,扩增,片段化,纯化以及测序过程,对RNA-Seq数据的质量的有效评估是进一步完成测序分析的关键。本项分析将针对项目内各个样本的RNA-Seq数据依次进行综合的质量评估。6个样本的测序结果分别得到了37~42 M的总reads数目,未出现质控失效和非匹配的reads,通过双端测序获得20 M数据深度。根据反馈的reads覆盖度分布图得出测序结果不存在5′/3′偏差,RNA-Seq测序实验质量很好,可用于后续的进一步数据分析。

1.2.2 测序数据分析

1.2.2.1 基因组比对

将样本预处理后序列与参考基因组序列进行全基因组序列比对,计算序列的全基因组覆盖情况和计算RNA的表达量。 序列比配考虑到RNA结构特点,采用Tophat软件完成基因组比对。比配参数和比配满足以下条件:允许2错配碱基匹配模式;允许每个read测序序列最多20个最优比配记录;考虑可变剪切情况,分割片段区域(segment) 的分段长度设定等于read长度的1/2;允许分段内错配碱基数目最多2 bp;最大插入和删除长度设定为3 bp;可变剪接位置匹配要求0错配,即保证完全比对;最小异构体比例系数设定为0.15;最小内含子长度设置为50 bp;最大内含子长度设置为50 kbp;对junction探测的比对条件允许最多40个最优比配记录,允许2 bp的错配。过滤掉较低质量比对reads后,6个样本分别获得20 M以上的有效下机数据总read数。保留下20 M的测序数据read总数目用于后续转录组分析。

1.2.2.2 已知基因表达量计算分析

编码RNA表达量计算采用将序列拼装比对在基因组序列上,并通过统计学方法估算其表达量,并用于后续样本差异表达量的比较分析。RNA表达量计算采用FPKM计算度量指标。数据分析结果得到甜菜mRNA编号及名称、基因ID、mRNA坐标及其表达量度量结果等。

1.2.2.3 已知基因差异表达分析

差异表达分析目的是对分组之间的表达谱进行差异分析。统计学显著性选择经过多重假设检验校正后的q value<=0.05。对甜菜dy5-O和dy5-CMS两种品系的3期花蕾进行表达差异分析,在所得结果中列出了甜菜mRNA编号名称及其坐标、基因ID、样本表达量差异、p/q值、转录本长度以及对象区域内reads覆盖度等。根据所获得的分析结果可进行已知基因差异表达分析及其后续研究。

1.2.2.4 差异表达基因GO功能分析

GO功能聚类常用于对目标组基因进行功能注释与分类。全部或差异mRNA/基因功能聚类(富集度)分析采用GO注释系统,功能注释针对全部差异mRNA结果展开。富集度分析采用超几何分布算法与Fisher检验完成,并采用多重假设检验校验超几何分布统计量的p值, 获得校正后的p值, 即q值。根据差异分析q value=0.05阈值筛选出差异基因,得到GO富集度分析后显著的GO各项分类内的条目优先的前30~50位GO子分类功能柱形图。根据所得的柱形图及GO注释总表可进行相应的差异表达基因的GO功能分析。

1.2.2.5 差异表达基因的qRT-PCR验证

按照说明书配制荧光定量PCR混合液。先根据所需PCR体系数,将除反转录产物以外的所有试剂按照上表的倍数由加入量从大到小的顺序加入1.5 mL离心管中,反复吹打混匀,低速、短时间离心后再分装,加入到荧光定量PCR专用的八连管中,最后加入相应稀释后的反转录产物,佩戴EP手套压盖,充分离心混合,放入ABI7300实时定量PCR仪,运行程序。反应程序设定:Stage 1:预变性 95℃ 30 s;Stage 2:PCR 反应40个循环,95℃ 5 s、60℃ 31 s;Dissociation Stage。

2 结果与分析

2.1 转录组测序结果

本实验分别选取甜菜dy5保持系O及雄性不育系CMS的I期、II期和III期花蕾作为实验样本,根据数据分析结果进行在线GO分析与BLAST比对分析已知,在I期花蕾中差异表达最高的是分子生物学功能中的氧化还原酶活性;在II期花蕾中差异表达最高的是细胞组件作用中的细胞外区域结构;在III期花蕾中差异表达最高的是分子生物学功能中的催化活性。I/II/III期共同的差异表达基因GO分类中,表达差异最高的分类中出现频率较多的几种分类分别为线粒体电子传递、有氧电子传递链、细胞膜光捕获复合物、亚油酸氧化物酶活性等。

2.2 育性相关差异基因筛选

转录组测序数据经生物信息学分析获得的不育系材料(CMS)与保持系材料(O)在不同花期(I/II/III)表达量。获得I期差异表达基因共有3 651个;II期差异表达基因共有4 408个;III期差异表达基因共有3 643个。筛选所得不育系材料(CMS)与保持系材料(O)在不同花期(I/II/III)表达量差异在1倍以上的基因分别为327、1 446和554个。分别对这些差异基因进行NCBI数据库BLAST比对,其基因功能涉及到转录因子基因、ATP合成基因、激酶合成基因、HIS组蛋白合成基因、酶及次级活性物质合成基因、孢子体形成基因、离子结合与调控基因等。

2.3 差异表达记忆实时荧光定量PCR验证

筛选出部分与育性相关基因进行实时荧光定量PCR实验,验证基因差异表达的时空特性,表达情况与测序结果基本一致。

3 讨论

在不同发育时期差异基因的上下调表达趋势与测序结果基本一致。育性相关的差异基因在CMS材料中均出现不同程度表达下调的现象,可能与雄性不育植株的花器官败育有一定的联系。获得的甜菜雄性不育性状转录组学测序数据,通过生物信息学分析完成影响育性基因表达情况的关键基因及其通路的研究,筛选出多个控制育性性状的标签基因并定位到响应区域并进行后续的表观研究。

组学数据庞大冗余,从中筛选相关的目的基因相对比较困难,与育性相关的通路繁杂,需要结合基因组注释与比对结果进行筛选。后期分子生物学与表观研究需精确的统计数据。

5 结论

(1)获得I期差异表达基因共有3 651个;II期差异表达基因共有4 408个;III期差异表达基因共有3 643个。

(2)筛选所得不育系与保持系在不同花期(I/II/III)表达量差异在1倍以上的基因分别为327、1 446和554个。经分析,其功能涉及到转录因子、ATP合成、激酶合成、HIS组蛋白合成、酶及次级活性物质合成、孢子体形成、离子结合与调控等。

猜你喜欢
保持系甜菜花蕾
高粱制种田存在的问题及对策研究
辣椒甜菜,各有所爱
当食物成为艺术创作的燃料
甜菜咋喂猪
大豆不育系及其同型保持系生殖生长期生理特性比较研究
甜菜丰收
我来了
Paper blossoms
我来了
杂交稻三系配套的原理及功能研究