厚皮甜瓜心部果肉蔗糖含量QTL定位及候选基因分析

2022-01-01 08:21张学军李寐华凌悦铭杨文莉张永兵伊鸿平
新疆农业科学 2022年10期
关键词:双亲甜瓜蔗糖

杨 永,范 蓉,张学军,李寐华,凌悦铭,张 红,杨文莉,姜 雪,张永兵,伊鸿平

(1.新疆农业科学院哈密瓜研究中心,乌鲁木齐 830091;2.伊犁师范大学生物与地理科学学院,新疆伊宁 835000)

0 引 言

【研究意义】甜味(糖含量)是衡量甜瓜品质的核心指标。由于间接反应可溶性糖总量的可溶性固形物含量测量简便易行,在育种材料创制过程中,心部果肉和边部果肉可溶性固形物含量是重要品质指标。而甜瓜果肉中可溶性糖可进一步分为葡萄糖、果糖和蔗糖三种组分,且以蔗糖为主,蔗糖含量和总糖含量呈极显著正相关[1],蔗糖含量的高低在很大程度上决定了果肉的甜味程度。厚皮甜瓜心部果肉可溶性糖主要包括蔗糖、葡萄糖和果糖,其中蔗糖含量占比最高。准确定位控制厚皮甜瓜果肉蔗糖含量的主效QTL,并挖掘相关候选基因,对于厚皮甜瓜果肉品质的分子遗传改良,创制高糖育种材料具有重要意义。【前人研究进展】甜瓜果实中3种可溶性糖含量随果实发育而变化,其中果糖、葡萄糖呈先增加后变平缓或降低的变化趋势,蔗糖呈持续增加的变化趋势[1-4]。在幼果期,果糖、葡萄糖和蔗糖经过一系列的酶促反应,主要参与糖酵解、磷酸戊糖途径和细胞壁物质合成等过程,为果实发育提供碳骨架和能量,蔗糖积累量很少或不积累;在果实发育后期,CmSPS1(蔗糖磷酸合成酶基因)和CmSPP1(蔗糖磷酸化酶基因)表达上调,引导糖代谢初始阶段的产物用于蔗糖合成和储存[3],使得蔗糖含量在果实库中迅速增加。QTL作图是基因精细定位和克隆的基础,是数量性状遗传研究的常用方法[5]。张宁等[6]认为蔗糖含量受一对加性主基因+加性-显性多基因模型控制(D-2),主基因在F2群体中具有较高的的遗传率,达83.76%;而吕律[7]认为蔗糖含量受2对加性-显性-上位性主基因+加性-显性多基因(MX2-ADI-AD 模型)控制。张宁等[8]基于F2群体在第3和第4号连锁群上,检测到与总糖和果糖相关的QTL各一个,解释遗传变异率分别为14.89%和13.02%,未检测到与蔗糖相关的QTL。Harel-Beja等[9]基于99个家系组成的重组自交系群体,在LG2、LG3、LG5、LG8四个连锁群上共定位到7个与蔗糖含量积累相关的QTL位点。Argyris等[10]发现一个控制蔗糖和可溶性固形物含量的位点SUCQSC5.1,可减少蔗糖积累量达到34%,并推测该位点上的MELO3C014519基因对甜瓜果肉中蔗糖积累起到了重要调控作用。邓冠聪[11]基于薄皮和厚皮甜瓜材料为双亲构建的重组自交系群体在春秋两季各定位到3个QTL,分别位于Chr_7、Chr_10 和 Chr_11 和 Chr_4、Chr_5 和 Chr_10 上。Elad Oren 等[12]综合前人研究结果认为蔗糖代谢和积累的遗传是复杂的,可能是受多个微效QTL控制的,而不是主基因的变异。【本研究切入点】目前,对调控甜瓜果实可溶性糖积累的关键基因还知之甚少。甜瓜可溶性糖含量是复杂的数量性状,受环境因素等影响较大。截至目前,虽在多个染色体上发现控制甜瓜果肉蔗糖含量的QTL,但挖掘到功能基因的研究鲜有报道,有关甜瓜可溶性糖含量QTL定位和基因挖掘的研究进展缓慢,限制了利用分子手段对该性状进行遗传改良。厚皮甜瓜果肉较厚,一般心部果肉含糖量与边部果肉具有明显差异,可能存在不同的调控机制,需逐步深入研究。【拟解决的关键问题】以高糖材料VZX(V醉仙)和低糖材料HP(高代自交系)为双亲,构建F2群体,利用高效液相色谱仪测定成熟果实赤道位置心部果肉蔗糖含量,挑选出蔗糖含量极端材料混池并联合双亲进行重测序,分析与厚皮甜瓜心部果肉蔗糖含量相关的主效QTL,并结合生物信息学分析,挖掘关键候选基因,为利用分子手段培育高蔗糖含量的厚皮甜瓜新品种奠定基础。

1 材料与方法

1.1 材 料

供试材料均由新疆农业科学院哈密瓜研究中心提供。以高糖材料VZX(V醉仙)和低糖材料HP(高代自交系)为双亲杂交获得F1,再自交1代获得F2种子。将双亲及F2群体于2020年3月2日育苗,3月20日移栽,种植于新疆农业科学院哈密瓜研究中心吐鲁番农科所基地。双亲各种植20株,F2群体共种植200株,吊蔓生长,单蔓整枝,每株留1果,坐果节位在8~10节,种植模式及水肥管理均一致。

1.2 方 法

1.2.1 样品采集及蔗糖含量

于果实成熟期,利用打孔器在每个果实赤道位置选取3个点采集圆柱状果肉,去除黏连的胎座,切取近种腔端1/3的果肉作为心部果肉,将3个取样点样品混合存放于冻存管中,置于液氮速冻,待萃取蔗糖。

蔗糖萃取及测定均参照杨永等[1]和朱勇等[13]提供的方法。

1.2.2 极端混池(BSA)及QTL定位

在幼果期,采集幼嫩叶片于冻存管中,液氮运回实验室,-80℃超低温冰箱保存,待CTAB法提取DNA。利用高效液相色谱仪测定F2群体心部果肉蔗糖含量后,将20株蔗糖含量极端高和20株蔗糖含量极端低的材料DNA分别提取,并等量混合,构建高蔗糖池和低蔗糖池。将2个混池和双亲DNA通过片段化试剂盒打断成长度为400 bp的片段进行文库制备,以Novaseq 6000测序平台 PE150测序模式进行全基因组重测序。对原始数据质控后获得的clean data与伽师瓜参考基因组进行比对(https://www.ncbi.nlm.nih.gov/assembly/ GCA_009760825.1),并根据比对结果进行SNP的检测和注释。计算混池之间基因型频率的显著差异,用SNP-index统计,标记SNP与性状关联度越强,SNP-index越接近于1,进而对目标性状区域定位;基于欧式距离(Euclidean Distance,ED)算法,利用混池间基因型存在差异的SNP位点,统计各个碱基在不同混池中的深度,并计算每个位点ED值,与目标性状相关联的基因所在的区域ED值会显著高于阈值。

基于SNP-index统计和欧式距离(Euclidean Distance,ED)算法计算混池间存在显著基因型频率差异的SNP位点,并与心部果肉蔗糖含量性状进行关联分析,ΔSNP-index 和ED值高于阈值的位点区域,被认为与目标性状紧密相关。研究将原始ED值的 2 次方作为关联值,然后采用局部线性回归 LOESS方法对ED值进行拟合,以消除背景噪音的影响。

杭州联川生物技术股份有限公司提供技术支持。

1.2.3 候选基因

基于参考基因组信息,挑选出BSA定位区间中的基因,利用GO富集分析和KEGG通路分析,挖掘潜在的与蔗糖含量相关的候选基因,并通过转录组数据(测定了VZX和HP授粉后20 d、30 d和40 d心部果肉转录组;由上海美吉生物医药科技有限公司提供技术支持)进行验证,利用IGV2.9.4软件对候选基因在双亲间的差异位点进行分析,为分子标记的开发及应用奠定基础。

2 结果与分析

2.1 双亲及F2群体心部果肉蔗糖含量表型分析

研究表明,高糖亲本VZX(V醉仙)心部果肉蔗糖含量为72.54 mg/g,而低糖亲本HP(高代自交系)心部果肉蔗糖含量为46.66 mg/g,两者之间具有极显著差异,平均相差25.88 mg/g。F2群体心部果肉蔗糖含量最低为2.2 mg/g,含量最高可达79.85 mg/g,平均为43.64 mg/g,差异较大,呈连续分布的特点。F2群体心部果肉蔗糖含量频次分布近似呈正太分布,符合数量性状的基本特征,可用于蔗糖含量性状BSA定位分析。图1,图2

图1 双亲心部果肉蔗糖含量差异Fig.1 Difference of sucrose content in center flesh of parents

图2 F2群体心部果肉蔗糖含量频次分布Fig.2 Frequency distribution of sucrose content among the F2 population

2.2 极端群体混池的构建及测序

研究表明,从F2群体中选择心部果肉蔗糖含量极端高和极端低单株各20个构建高蔗糖池和低蔗糖池,联同双亲进行全基因组重测序,获得有效测序数据共32.62 G,双亲及两个混池有效数据平均为8.16G,Q20在95%以上,Q30在89%以上,GC含量在36.16%~44.01%,比对到参考基因组上的总reads数目比例在98.72%~99.02%,平均覆盖深度为17.76。测序数据质量合格,与选择的参考基因组比对效率高,能够满足后续变异SNP位点的检测和心部果肉蔗糖含量的QTL定位。表1

表1 测序数据质量Table 1 Quality statistics of sequence data

2.3 厚皮甜瓜心部果肉蔗糖含量的QTL定位

研究表明,双亲及两个混池共检测到5 627 028个SNP变异位点,子代混池SNP位点数、转换类型SNP位点数、颠换类型的SNP位点数、转换颠换比均明显高于双亲;子代混池杂合SNP位点数明显高于纯合位点数,高蔗糖池和低蔗糖池杂合比分别为67.74%和69.03%,双亲杂合SNP位点数明显低于纯合位点数,高蔗糖亲本VZX和低蔗糖亲本HP杂合比分别为26.58%和23.09%。表2

表2 SNP变异位点统计Table 2 Statistics of SNP polymorphism site

基于ΔSNP-index和欧式距离均定位到8号染色体上18 980 000 ~22 270 000 bp共计3.29 Mb的区间。图3、图4

图3 基于SNP-index对厚皮甜瓜心部果肉蔗糖含量的QTL定位Fig. 3 QTL mapping of sucrose content in center flesh of muskmelon based on SNP-index

图4 基于欧式距离对厚皮甜瓜心部果肉蔗糖含量的QTL定位Fig.4 QTL mapping of sucrose content in center flesh of muskmelon based on Euclidean distance

2.4 厚皮甜瓜心部果肉蔗糖含量相关候选基因

研究表明,8号染色体上3.29 Mb区间共注释到108个基因,在GO、KEGG、SwissProt、NOG等数据库分别注释到88个、40个、72个和101个。71个基因参与生物学合成过程,133个基因参与细胞组分,17个基因参与分子功能;KEGG通路分析表明,参与有机体系统的基因有3个,参与代谢的基因有32个,参与遗传信息传递的基因有14个,参与环境信息传递的基因有6个,参与细胞过程的基因有1个。值得特别关注的是GO富集分析参与分子功能的部分,有4个基因(EVM0001419、EVM0004758、EVM0005074和EVM0013242)具有β-半乳糖苷酶活性,但进一步通过转录组数据发现4个基因在VZX和HP两份亲本材料果实发育过程中表达量均比较低,且差异较小,初定位区间中注释到的4个β-半乳糖苷酶基因很可能不是造成双亲蔗糖积累差异的关键基因;KEGG通路分析中显示参与碳水化合物代谢的基因有7个,除4个β-半乳糖苷酶基因外,还有三个基因分别为EVM0000647、EVM0008701和EVM0019814,其中EVM0008701和EVM0019814表达量相对较低,且双亲间差异不明显,而EVM0000647基因表达量较高,且双亲间具有明显差异。进一步分析发现,EVM0000647基因参与糖酵解和糖异生的代谢通路。在IGV软件上,显示为彩色的位置均表示与参考基因组碱基不同,该基因有8个内含子和9个外显子组成,仅在第8个外显子上存在一个同义突变(GTT/GTC),均编码缬氨酸,其它外显子均无有差异的SNP位点,该基因并非通过蛋白质序列差异影响蔗糖的积累,很可能通过基因表达量的差异,造成不同材料果实蔗糖积累的不同。双亲间在该基因启动子区域存在大量的变异位点。表3,表4,图5~7

表3 候选区间不同数据库注释基因数量Table 3 Number of annotated genes in different databases in the candidate interval

图6 KEGG通路分析Fig.6 KEGG enrichment analysis of candidate genes

注:A:基因EVM值0000647基本结构及双亲差异位点;B:双亲在基因EVM值0000647第8个外显子上的SNP差异位点;C:基因EVM值0000647在双亲间的差异表达

表4 与糖代谢相关的候选基因Table 4 Candidate genes involved in sugar metabolism

3 讨 论

新疆甜瓜地方品种资源果实含糖量,是最为迫切需要改良的性状之一[14, 15]。121份新疆农家品种资源可溶性固形物含量最低为5%,最高达18%,具有广泛的遗传变异[15]。可溶性固形物含量是果实可溶性糖含量的间接反应,甜瓜果实中可溶性糖主要包括蔗糖、葡萄糖和果糖,其中蔗糖含量一般为最主要的糖组分[3, 4, 9]。研究选择高糖材料VZX和低糖材料HP作为双亲构建了F2群体,并利用液相色谱仪测定了双亲及F2群体心部果肉蔗糖含量,显示双亲间具有极显著差异,F2群体内蔗糖含量最低为2.20 mg/g,最高可达79.85 mg/g,差异明显,其蔗糖含量分布基本呈正太分布,符合典型的数量性状遗传特征。张宁等[8]构建的F2群体中蔗糖含量最低为1.514 mg/g,最高为67.25 mg/g,与研究中F2群体表型测定结果类似。

极端混池测序(Bulked segregant analysis,简称BSA)是一种快速、简便有效、低成本的数量性状位点定位方法[16]。研究利用F2群体,构建了极端混池结合全基因组重测序对厚皮甜瓜心部果肉蔗糖含量进行了定位,在8号染色体上定位到一个大小为3.29 Mb的QTL位点。Harel-Beja等[9]利用PI414723和Dulce为双亲衍生的重组自交系群体,构建了一个包含668个DNA标记的遗传连锁图谱,2006年在LG2、LG3、LG5和LG8连锁群上共定位到与蔗糖含量相关的QTL位点6个,而2007年仅在LG3上定位到1个QTL位点,其中2006年8号连锁群上定位到的QTL可解释18.3%的表型遗传变异。张宁等[8]利用F2群体构建了SSR标记的遗传连锁图谱,在3号和4号连锁群上分别定位到与总糖和果糖含量相关的QTL位点各1个,未定位到与蔗糖相关的QTL。Argyris等[10]基于近等基因系群体,在2、3、4、5、7、8和11号染色体上共定位到11个与蔗糖含量相关的QTL;基于F2、BC1、BC2和IL等群体,在4、5和10号染色体上共定位到6个与蔗糖含量相关的QTL;在5号染色体上存在一个稳定的QTL即sucqsc5.1。综上可见,甜瓜果实蔗糖含量性状为多基因控制的复杂数量性状[10],在一定程度上阻碍了包括蔗糖在内的甜瓜果肉可溶性糖含量性状的QTL定位及功能基因挖掘。蔗糖含量表型的准确鉴定是影响其QTL定位的又一主要因素。蔗糖在果实发育前期基本无积累,在果实发育后期蔗糖积累迅速增加[1],果实完全成熟是影响蔗糖含量表型准确鉴定的关键;受栽培环境及管理措施的影响,植株的生长状况也会影响蔗糖含量表型的鉴定;蔗糖含量的准确测定一般需要利用高效液相色谱的方法,除遗传群体的种植管理外,还涉及到样品采集、可溶性糖萃取、测定等环节,限制了用于QTL定位的群体规模。

研究在3.29 Mb的定位区间内,利用伽师瓜参考基因组(HTTPS://WWW.NCBI.NLM.NIH.GOV/ASSEMBLY/GCA_009760825.1)共注释到108个基因。通过GO富集分析和KEGG通路分析,进一步聚焦到碳水化合物代谢通路上的7个基因,其中4个推测为β-半乳糖苷酶基因,但双亲不同果实发育时期的转录组数据显示,4个β-半乳糖苷酶基因在果实发育过程中基因表达量都非常低。Ren Yi 等[17]发现β-半乳糖苷酶基因在西瓜果实发育过程中表达量也非常低,而高表达的α-半乳糖甘酶ClAGA2基因被认为是西瓜果实蔗糖积累过程中的关键节点基因,同源比对甜瓜上的α-半乳糖甘酶基因也位于8号染色体,但并未在研究定位区间内,可能甜瓜和西瓜在蔗糖积累的分子调控上是存在一定差异的。蔗糖积累在甜瓜果实幼果期和成熟期有着明显的差异,幼果期可溶性糖主要被用于果实生长发育和提供能量,成熟期果实停止生长,主要以蔗糖的形式贮存起来[3]。在之前的研究中也发现[1],蔗糖积累的起始时间可能是造成不同材料间蔗糖含量差异的重要原因,MELO3C014519 基因被认为可能是通过其高表达延长了果实生长过程,而阻碍了蔗糖的积累,造成了双亲材料蔗糖含量的差异[10]。研究中参与碳水化合物代谢的另外3个基因(EVM0000647、EVM0008701和EVM0019814),EVM0008701和EVM0019814在VZX和HP两份材料果实发育过程中表达量相对较低,且差异不明显,而EVM0000647基因表达量较高,参与糖酵解和糖异生的生化过程,且双亲间具有明显差异,该基因在低糖亲本HP的表达量在果实3个不同发育时期均明显高于高糖亲本VZX。VZX和HP在该基因编码区仅存在一个同义突变,但在启动子区域存在大量的差异位点,该基因可能也通过表达量的差异负向调控厚皮甜瓜心部果肉蔗糖的积累,但还有待于进一步通过基因编辑等方法验证该基因的功能。

4 结 论

利用VZX和HP为双亲及其衍生的F2群体,在8号染色体上定位到1个影响厚皮甜瓜心部果肉蔗糖含量的QTL,大小为3.29 Mb;在参考基因组上共注释到108个基因,并结合转录组数据在初定位区间内获得一个参与糖酵解和糖异生生化过程、高表达且表达量在双亲间具有明显差异的候选基因EVM0000647;该基因可能通过表达量的差异负向调控厚皮甜瓜心部果肉蔗糖的积累。

猜你喜欢
双亲甜瓜蔗糖
甜瓜的重量
“0蔗糖”就是无糖?
蔗糖中红外光谱初步研究
蝶恋花·秋日忆双亲
红糖膏中蔗糖结晶抑制方法及展望
掺HRA 对蔗糖超缓凝水泥基材料性能的影响
举世无双
让老人重新动起来
我喜欢吃甜瓜
甜瓜有多重