全基因组关联分析在大豆遗传学上的研究进展

2019-06-22 05:34万何平陈禅友曹新华
关键词:农艺种质遗传

万何平,陈禅友,陈 高,曹新华,夏 明

(江汉大学 生命科学学院;湖北省豆类(蔬菜)植物工程技术研究中心,湖北 武汉 430056)

大豆(Glycine max)起源于我国,历经至少5 000年的驯化过程后,从野生大豆发展成为现在的大豆栽培品种[1]。大豆能提供优质蛋白质,同时也是重要的工业原料[2]。在我国主要的农作物中,大豆的蛋白质含量最高,平均含量在40% ~50%[3]。此外,大豆氨基酸组分比例十分接近人体所需的理想比例[4],因此食用大豆制品有利于保持人体的营养平衡。大豆是深受老百姓喜爱的蔬菜,在我国广泛种植[5]。

近年来,随着水稻[6]、玉米[7]、油菜[8]等主要农作物全基因组测序工作的完成,应用全基因组关联分析(genome-wide association study,GWAS)方法发掘农作物数量性状位点(QTL)和基因已成为目前国际作物基因组学研究的重要方向之一。自从大豆基因组公布后[9],运用生物信息学等技术手段,大豆基因组在驯化过程中的变异和进化规律逐渐被揭示[10],GWAS 技术在大豆遗传研究上的应用正呈现飞速发展,现已成功鉴定出了许多控制大豆重要农艺性状的遗传位点。笔者在介绍GWAS 技术的基础上,综述了近年来GWAS 在大豆重要农艺性状遗传学上的研究进展,探讨了其育种的应用前景,以期为大豆重要农艺性状的遗传改良以及大豆产业的发展提供参考。

1 全基因组关联分析

1.1 GWAS的理论基础

GWAS 是鉴定某一群体内目标性状与遗传标记或候选基因关系的分析方法,通常也被称为关联作图或者连锁不平衡分析,其遗传基础是连锁不平衡(linkage disequilibrium,LD)[11]。当遗传群体内部某个基因座位上的某个等位基因与其他基因座位上的某个等位基因同时出现的可能性大于理论值时,就认为这两个基因座位之间处于连锁不平衡的状态[12]。传统的QTL 定位方法的遗传基础是遗传连锁,而GWAS 的遗传基础是连锁不平衡,因此关联分析和连锁分析是两种截然不同的遗传分析方法。

LD因突变而产生,因重组而打破,因此突变和重组是影响不同物种的LD水平的最主要因素[13-14]。此外,不同的交配体系也会影响物种的LD 水平。目前普遍采取衰退距离来度量LD 的衰退速率。如水稻自交系的LD 衰退距离较小,仅为100 ~200 kb[15];在自交作物如油菜、小麦,表现出高水平的LD,其中油菜自交系的衰退距离达到8.5 Mb[16],小麦自交系衰退距离为4.3 Mb[17];作为异交作物,玉米的LD 衰退距离仅为1.5 kb[18]。此外,研究表明不同物种的LD 水平会随着农作物驯化程度的不同而存在差异[19]。

1.2 GWAS的优势

与基于连锁分析的QTL 相比,GWAS 在以下方面存在较大优势。1)大大缩短了研究时间。GWAS通常以自然群体为遗传材料,而常规作图群体的构建一般最少需要2年以上的时间,尤其是在构建用于精细定位的群体则需要数年的时间,因此利用GWAS 方法进行遗传学研究能极大地缩短研究时间。2)检测效率大。GWAS 所用到的自然群体可同步检测同一基因座位上的多个等位基因,而常规QTL 作图群体其同一基因座位仅涉及2 个等位基因,因此检测效率有限。3)检测的精度高。由于GWAS 利用自然群体在其长期进化过程中积累的大量重组遗传信息,因此利用GWAS 方法可实现对QTL 的精细定位;而常规QTL 连锁分析分辨率往往较低[20]。4)高通量、低成本。由于GWAS 研究多采用自然群体,自然群体在许多性状(如产量、品质和抗性等)都会存在丰富的遗传变异,因此利用同一套种质材料和基因型信息就可以对多个不同性状同时进行遗传学分析,极大地提升了遗传学研究的通量,同时也大幅度节约了由于重复构建群体和鉴定群体基因型所产生的成本。

1.3 GWAS的实施流程

GWAS 流程见图1,主要有遗传种质的收集和群体的组建,目标性状表型的精确考察、遗传群体基因型信息的鉴定,利用遗传模型对目标性状表型信息和遗传种质基因型进行关联分析,最终检测控制目标性状遗传特性的遗传位点。其中具有丰富遗传变异的遗传群体是关联分析的遗传基础,因此需尽可能多地收集不同地区来源的种质资源。为了尽可能减少试验误差,表型鉴定多在多年多点环境下进行。全基因组范围内分子标记的密度目前多采用覆盖全基因组的高密度的单核苷酸多态性(SNP)标记,可极大地提升关联分析遗传定位的精度。

2 GWAS在大豆遗传学上的应用

2.1 GWAS在大豆农艺性状上的应用

图1 GWAS 流程图Fig.1 Flow chart of GWAS

大豆农艺性状(agronomic traits)主要包括叶面积、株高、生育期、种子大小、质量等相关性状。大豆农艺性状很大程度上决定了大豆的产量,因此开展大豆农艺性状的遗传分析将有助于大豆高产育种。目前,已有众多大豆遗传学的研究者利用GWAS 技术对大豆农艺性状进行了研究。ZHANG 等[21]利用大豆SoySNP50K 芯片技术对309 份早熟大豆种质材料进行基因型鉴定,并利用GWAS 技术对大豆开花期、熟性和株高性状进行遗传研究,最终分别检测到27、6、27 个位点与开花期、成熟期和株高性状相关。张军等[22]以190 份具有丰富遗传变异的大豆种质为材料,对多个农艺性状(如产量等)进行GWAS。最后累计检测到136 个QTL 位点与目标性状显著关联,其中22 个QTL 位点与前人已发现的QTL 区域重合,且研究结果显示某些农艺性状间存在一因多效的现象[22-23]。魏世平[24]对大豆株高、主茎节数等农艺性状进行GWAS,分别检测到了177 个控制相关农艺性状的QTL 位点,根据此遗传信息对优异的水稻杂交组合进行了预测。NIU 等[25]以257 个大豆品种为遗传资源,利用GWAS 对大豆籽粒大小与形状性状进行遗传分析,最终成功检测到59 个控制大豆籽粒性状的主效QTL。范虎等[26]以从全国收集到的野生大豆种质为遗传材料,对百粒重、开花期、成熟期等农艺性状进行了GWAS,最终检测到51 个QTL 与目标性状显著相关,其中有16 个QTL 与前人利用连锁分析定位到的结果相一致。伍宝朵等[27]从国内外收集了167 份大豆种质,并利用GWAS 技术对其荚果相关性状进行了遗传分析,成功检测到了3 个与每荚粒数和叶的长宽比显著关联的遗传区域。杨胜先等[28]收集了257 个具有丰富遗传变异的栽培大豆品种,并通过多年多点田间试验考察了株高、分枝数等农艺性状,利用GWAS 共检测到116 个与目标性状显著相关的QTL,其中有18 个主效QTL 位点与已成功定位的QTL 位置相吻合,证明了GWAS 方法的可靠性。株高和主茎节数是影响大豆种子产量的主要植物结构性状,虽然已经报道了这两个性状的许多QTL,但它们在大豆不同发育阶段的遗传控制机制尚不清楚。CHANG 等[29]采用62 423 个SNP 标记对368 个大豆育种品系进行了基因分型,并对两个不同发育阶段的两个性状进行了表型分析,利用GWAS 技术共检测到11 个和13 个QTL 分别与株高和主茎节数相关。FANG 等[30]从世界范围内收集了809 种大豆种质,在3 个地点种植了2年,并对其进行了84 种农艺性状(包括产量相关性状、品质相关性状等)的表型分析;此外利用全基因组测序对809 份大豆种质进行了测序,共鉴定到了超过1 100 × 104个SNP 标记;最终关联分析结果共检测到245 个QTL;此项研究是目前大豆关联分析研究中大豆种质资源数量和SNP 标记数量最多的研究,此研究全面系统地揭示了大豆农艺性状遗传调控网络,为大豆遗传学研究提供了重要的参考。

2.2 GWAS在大豆蛋白质含量和含油量性状上的应用

目前,大豆的主要用途是提供蛋白质和油脂,因此开展大豆蛋白质含量和含油量的遗传学研究是进行大豆优质育种的遗传基础。JUN 等[31]以2 个自然群体为遗传材料进行大豆籽粒蛋白质含量相关性状的GWAS,共检测到11 个控制目标性状的QTL 位点,其中9 个与以往定位出的结果一致。SHI 等[32]以105 份来自亚洲和美国的大豆核心种质为材料,利用GWAS 共检测到12 个QTL 位点控制着大豆蛋白质含量和含油量。LI 等[33]以159 份大豆种质为遗传材料,利用GWAS 成功检测到6 个与高含油量显著关联的QTL 位点,5 个与高蛋白质含量显著相关的QTL 位点。简爽等[34]对蛋白质亚基相关性状进行GWAS,成功检测到在2年田间种植过程中稳定表达的 14 个 QTL。LI 等[35]利用1 536 个 SNP 标记对421 份中国大豆栽培品种进行基因型鉴定,并对该群体种子蛋白质含量和含油量进行GWAS,最终检测到6 个遗传位点与大豆种子蛋白质含量和含油量相关。HWANG 等[36]基于31 954 个SNP 标记对298 份大豆品种的蛋白质含量和含油量进行了GWAS,在全基因组范围内分别检测到40 和25 个与种子蛋白质含量和含油量相关的SNP 位点,这些位点中有一部分与前人研究中所定位到的位点相一致,但同时鉴定到了更多的微效位点,说明借助高密度的SNP 标记,大豆GWAS 技术具有十分强大的检测能力。为更好地了解大豆蛋白质含量和含油量的分子基础,同时为进行优质性状的分子标记辅助选择,LI 等[37]对185 份大豆种质资源进行了籽粒蛋白质含量和含油量相关的数量性状的GWAS,发现在20 条大豆染色体中,12 条上共有31 个SNP 位点与种子蛋白质含量和含油量相关,在与这两个目标性状相关的31 个SNP 中,发现了31 个有益的等位基因,这些有益的等位基因可能有助于大豆蛋白质和油脂特性的分子标记辅助选择。ZHANG 等[38]利用313 种不同的大豆种质,采用SNP 标记进行GWAS,包括蛋白质、油脂、脂肪酸和氨基酸特性,共鉴定到87 个染色体区域与种子组成有关,解释了8% ~89%的遗传变异。在主要作用位点上发现了功能已知的候选基因gmsat1、ak-hsdh、sacpd-c和fad3a,以及与固氮作用、氨基酸生物合成和脂肪酸代谢有关的MTN21 结节蛋白、FATB 和类固醇-5-α还原酶。进一步对附加种质资源的分析表明,这些主要效应位点已经进行了驯化或现代育种选择,等位基因的变异和分布与地理区域有关。LEAMY 等[39]采用GWAS 对570 份野生大豆种子中蛋白质、油脂和5 种脂肪酸含量进行了遗传学研究,在10 个不同的染色体上发现了29 个SNP 位点,这些位点与野生大豆样本中的7 个种子组成性状显著相关。

2.3 GWAS在大豆逆境抗性相关性状上的应用

随着全球环境的不断恶化,生物逆境(如病虫害)以及非生物逆境(干旱、土壤盐碱化等)已严重制约了世界农业的可持续发展。目前,开展大豆逆境抗性机制的研究是大豆遗传学研究的热点。DHANAPAL等[40]收集了373 份大豆品种,并对其耐干旱相关性状进行了表型鉴定,基于12 347 个SNP 标记进行GWAS,共鉴定出39 个SNP 标记,其中15 个SNP 标记位于功能基因内,此研究体现了高密度SNP 分子标记的优势,利用覆盖全基因组的高密度的标记可直接将候选区域锁定到候选基因附近,甚至是基因内部,极大地提升了遗传定位的精度。KAN 等[41]利用1 142 个SNP 标记对191 份大豆种质材料进行萌发期耐盐能力相关性状的GWAS,最终检测到8 个与大豆萌发期耐盐能力相关的遗传位点,并在这些位点附近找到了与大豆耐盐能力相关的候选基因。ZENG 等[42]利用大豆芯片[43](SoySNP50K)对283 份大豆种质资源进行基因分型,最终获得33 009 个高质量的SNP 标记,利用这些标记对大豆耐盐性状进行关联分析,共检测到45 个与大豆耐盐性状相关的SNP 标记位点。大豆猝死综合征病菌(SDS)对大豆生产造成严重威胁,为了解大豆抗病性的遗传结构,LALLY 等[44]对由392 个和300 个大豆种质组成的2 个独立群体进行了SDS 抗性评价,并分别用52 041 和5 361 个SNP 标记进行群体的基因分型,最后利用GWAS 检测到20 个与大豆SDS 抗性相关的遗传位点。光合作用是植物生长发育的基础,会受到低磷胁迫的严重影响,然而很少有研究报道大豆对低磷胁迫的光合反应的遗传基础。为了解决这个问题,LU 等[45]以219 个大豆品种为试验材料,结合292 035 个SNP 标记进行基因分型,并在正常和低磷条件下进行表型分析,对光合作用相关性状进行GWAS。结果表明,在不同磷胁迫条件下,31 个基因组区159 个遗传位点与4 个光合作用相关性状相关。这些结果为大豆标记辅助育种提供了重要信息,进一步明确了耐磷性在光合作用中的应用基础。

BASTIEN 等[46]采用棉垫法对130 个大豆品系进行接种,并采用简化基因组测序(GBS)对大豆品系进行基因分型,最终获得7 864 个SNP 标记,利用GWAS 和LD 对大豆核盘菌抗性进行遗传学研究,共检测到Gm01、Gm15、Gm19 和Gm20 等与大豆核盘菌显著相关的遗传位点。WEN 等[47]对大豆抗白霉病性状进行了GWAS,结合转录组分析最终筛选得到了与大豆抗白霉病有关的候选基因。南方根结线虫是严重危害大豆的寄生线虫,PASSIANOTTO 等[48]利用简化基因组测序技术对188 份大豆种质进行了基因型鉴定,成功鉴定到了46 196 个SNP 标记,利用分子标记信息结合大豆南方根结线虫的抗性表型进行GWAS,最终成功检测到5 个区域与大豆南方根结线虫抗性显著相关。LI 等[35]以159 份大豆种质为遗传材料,对抗胞囊线虫和抗大豆花叶病毒相关性状进行GWAS,共检测到6 个与抗胞囊线虫关联的QTL,3 个与抗大豆花叶病毒关联的QTL。

3 GWAS在大豆遗传学研究上的应用前景

近年来,GWAS 在大豆遗传学研究上取得了很大进展,但主要集中在对产量、含油量、蛋白质含量和抗逆性等重要农艺性状的研究上[49]。关于大豆菜用性状和加工性状的遗传学研究还处于较低水平[50]。对于大豆豆乳率、蛋白质利用率、蛋白质凝固率、干湿豆腐产量等加工性状的研究大多只是从遗传多样性的层面进行了初步分析,较少深入到分子水平[51-52]。因此,利用GWAS 技术对大豆菜用性状、加工性状和特殊营养成分等进行遗传学分析具有很大的应用前景。

对于在大豆中应用GWAS 技术,笔者从以下几方面给出建议。首先,GWAS 方法中常使用大豆自然群体,而传统自然群体中往往会存在群体结构。由于群体结构的存在会引起假阳性问题,因此在进行GWAS 时需要设计不同的群体结构分析模型。其次,GWAS 对群体内部低频率的等位基因位点检测效力有限,而传统的连锁作图对于检测罕见变异十分有效,为了弥补关联分析群体的不足,遗传学家开发出 NAM(nested association mapping)群体[53]和 MAGIC(multiparent advanced generation intercross)群体[54],综合了连锁作图和关联分析作图的优点。第三,保证目标性状考察的准确性。目标性状表型的准确性是能否准确定位到与目标性状相关的遗传位点的关键。因此,研究者需要在多个环境下科学合理地对目标性状进行考察。最后,需将关联分析的结果逐步应用到育种之中。在进行大豆NAM 群体和MAGIC 群体构建的过程中,应根据育种目标来选择大豆亲本,保证关联群体内部尽可能多地包含优异遗传变异。

GWAS 技术应用于大豆重要性状的遗传学研究才起步不久,研究的具体方法和策略还处于不断探索和改进的阶段。随着大豆基因组研究的不断发展和关联分析方法的不断进步,GWAS 方法将会被更多地应用于大豆重要性状的遗传学研究。

猜你喜欢
农艺种质遗传
非遗传承
华南地区最大农作物种质资源保护库建成
华南地区最大农作物种质资源保护库建成
农机需要农艺“标准”,农艺需要农机“灵活”——2021国际农机展不容错过的果蔬茶机械化论坛
水稻主要农艺性状与产量的相关性分析
四川省桑树种质资源保存与应用
还有什么会遗传?
还有什么会遗传
还有什么会遗传?
亚麻抗白粉病种质资源的鉴定与筛选