基于共词分析的国内茶树种质资源研究热点分析

2018-07-26 09:54章细英孔祥瑞
茶叶学报 2018年2期
关键词:共词茶树种质

章细英,孔祥瑞

(福建省农业科学院茶叶研究所,福建 福安 355015)

茶树种质资源作为开展茶树种质创制、育种和新产品开发的重要基础,是茶叶科技创新和产业可持续发展的重要依托[1]。所以,茶树种质资源的研究始终是茶学研究的重要组成部分。早期的研究基于茶树生长的复杂生态环境、长期演化及自然选择等明确了茶树种质资源的涵盖范围。之后,研究的重点则集中于收集、保存与保护方面[2]。随着分析手段的不断发展,围绕茶树种质逐渐形成了茶树种质评价鉴定、核心种质构建等的细化研究方向[3,4]。尤其是近几年,各大组学和交叉学科的飞速发展更对茶树种质资源的研究起到了积极的推动作用。

共词分析作为一种新的文献评价方法,可以定量化探讨特定学科领域的研究现状,通过不同词对之间的关系来反映各主题之间的内在联系[5]。本文应用共词分析对近20年我国国内茶树种质资源研究主题进行归纳分析,以期揭示该领域的主题结构及热点领域,不仅有助于了解茶树种质资源的最新研究进展,也可为该领域的深入研究提供参考。

1 材料与方法

1.1 数据获取

从CNKI的全部文献中,以主题“茶树”,词频并含“种质资源”为检索条件进行高级检索,时间范围设定为1997年-2017年,并以Refworks格式导出TXT格式题录,及文献来源为学术期刊,共获得相关研究文献记录218条。

1.2 数据处理

所有数据统计分析均在R3.4及SPSS 19中完成。

2 结果与分析

2.1 关键词共词分析

利用R软件文本处理函数写成用于生成关键词共词矩阵的脚本,根据齐普夫第二定律T=[-1+(1+8I1)0.5]/2及经验判断(其中I1为出现1次的词的数量)[6],凡是词频大于3(T=3)的都选入,利用这一方法可以得到22个关键词(表1)。

表1 国内茶树种质资源研究论文高频关键词

2.2 构建相异矩阵

2.3 聚类分析

将相异矩阵导入SPSS 19进行聚类分析,选择Ward法、Phi方度量计数、Z得分标准化,聚类结果见图1,近20年茶树种质资源领域的研究可分为4个类团。各类间的距离映射到0~25之间,反映这些关键词之间的亲疏程度,将“亲缘关系”较近的关键词重新组合起来,能反映出这些关键词所代表的主题结构,从而获得目前茶树种质资源研究的热点。

2.4 多维尺度分析

多维尺度分析是将多维空间的研究对象简化到低维空间(通常为二维)进行定位、分析和归类,同时保留对象间原始关系的分析方法[9]。关键词的多维尺度分析,其实质是利用关键词之间平面“距离”的紧密程度对研究问题进行聚类,可全面反映某一研究领域主要研究方向与热点,并以直观的视觉距离来找到本研究领域内客观存在的通用属性。将上述相异矩阵通过SPSS统计软件的Scale-多维尺度分析功能(multidimensional scale,ALSCAL),选取平面对称的图形(square symmetric)描述茶树种质资源研究关键词的数据结构,用序数数值(ordinal)作为数据测度水平的指标,进行二维尺度分析,得到可视化结果(图2)。

表2 国内茶树种质资源研究论文高频关键词相异矩阵(局部)

图1 高频词Ward法聚类结果树状图Fig.1 High frequency word clustering results treeusing Ward method

图2 多维尺度分析结果Fig.2 Derived stimulus configuration using Euclidean distance model

由图2可知,EST-SSR、RAPD、ISSR与遗传多样性、亲缘关系聚在一起,核心种质、鉴定、筛选、多样性与生化成分聚在一起,这与聚类分析结果相似。

3 讨论

通过聚类分析和多维尺度分析,可将国内茶树种质资源研究热点分为4个方面,即应用EST-SSR、RAPD、ISSR分子标记技术进行遗传多样性和亲缘关系分析,分析方法涉及到聚类分析和主成分分析;野生茶树种质资源的开发利用;基于生化成分进行种质的多样性分析,并实现筛选鉴定,从而获得核心种质;涉及到分子标记技术的抗寒与功能性成分育种。

3.1 茶树种质资源的遗传多样性及亲缘关系分析

茶树种质资源的遗传多样性分析是种质资源遗传利用的基础,一方面对资源的保存起指导作用,同时也是杂交育种亲本选择的重要依据。目前在茶树种质资源遗传多样性分析中常用的分子标记主要是EST-SSR、RAPD和ISSR,其中SSR类标记应用最多[9-11],但不足之处是鉴定结果会因使用的标记数量不同而有较大变幅,使得不同研究间很难获得高度吻合的研究结论。而亲缘关系分析面临的最大难题也与此类同。

分析方法方面,常见的就是应用PowerMarker等软件进行Nei’s多样性指数、等位位点频率等的简单统计[12-14],及基于欧氏遗传距离和主成分分析的聚类分析,一方面分析结果无法得到进一步科学合理的验证,另一方面,这些研究结果大多在理论指导上很难有实际的应用价值,使得现有研究很难深入进行。

3.2 野生茶树种质资源的开发利用

我国作为茶树(camelliasinensis)的物种起源中心[15],占有茶树种质资源的丰富程度在世界范围内具有绝对优势。依据茶树种质资源描述规范,茶树种质主要分为野生资源、地方品种、选育品种、品系和遗传材料等[16]。其中,野生资源属未知程度最高,且极具深入挖掘价值的重要茶树种质组成部分。虽然在本研究中可以推断出野生资源开发利用是国内茶树种质资源研究中的热点领域,但是详细查阅近20年来的研究资料之后,发现实际上这方面取得的研究进展十分有限,甚至很少见到有系统开发利用的报道。

3.3 基于生化成分的分析

茶叶生化与品质相关分析的研究已经有很多报道,随着分析技术的不断发展,GC-MS、LC-MS等的大量使用,使得茶叶生化成分分析逐渐向高通量方向发展,所以相应地出现了基于生化成分的茶树种质资源多样性分析,这在资源筛选鉴定方面已经有大量的报道和成功应用案例[17-19]。特别是功能性成分成为育种目标之后,基于生化成分的种质资源多样性分析变得更受重视,也就成了除基于分子标记的遗传多样性分析之后筛选核心种质的不二选择。随着组学联合分析方法的不断完善,这一技术将会在种质筛选鉴定和品种选育中发挥更为重要的作用。

3.4 茶树育种

作为种质资源研究的最终回归点,茶树育种对茶树种质资源研究起决定作用,所以在共词分析中会显示为种质研究的热点,这完全符合实际情况。就该分析结果而言,儿茶素、花青素显然已经成为茶学研究的热点,且品种选育已经涉及到分子标记技术,表明功能性成分品种的选育已经成为我国茶树育种的重要研究方向[20,21],且分子标记作为辅助选择手段也已开始被加以重视利用。

3.5 共词分析的不足

共词聚类分析的方法可以定量化探讨特定学科领域的研究现状,通过不同词对之间的关系来反映各主题之间的内在联系,但是,这种方法由于存在关键词标引的限制,只能抽取文献自拟的关键词进行分析,且国内有多数报道都发表在国外的期刊上,容易出现词汇离散问题,致使无法反映全部主题内容。因此,共词聚类方法用于分析某一领域研究热点仍需进一步完善。

猜你喜欢
共词茶树种质
华南地区最大农作物种质资源保护库建成
华南地区最大农作物种质资源保护库建成
茶树吸收营养物质的特性
徐纪英:呼之欲出的“茶树花挂面”
山茶树变身摇钱树
基于突变检测与共词分析的深阅读新兴趋势分析
亚麻抗白粉病种质资源的鉴定与筛选
基于Matlab的共词矩阵构造
两个推荐茶树品种
红锥种质早期生长表现