基于CiteSpace的茶叶领域中高光谱成像技术应用的文献计量分析

2022-08-24 13:14余孜孜任锡蓉林民尧黄玉旺吴贤奇刘少群孙彬妹郑鹏
中国茶叶 2022年8期
关键词:发文光谱茶叶

余孜孜,任锡蓉,林民尧,黄玉旺,吴贤奇,刘少群,孙彬妹,郑鹏

华南农业大学,广东 广州 510642

茶叶中丰富的营养成分及其保健功效相继被发现证实,促进了茶叶的消费和需求。成品茶品质受茶叶生产和流通各环节影响,从茶鲜叶到加工,再到成品茶的贮藏等环节都需要进行监测来确保茶叶品质。传统的检测手段应用范围有限且耗时、耗材,无法满足快速、无损的精细化技术要求,因此拉曼光谱技术、近红外光谱检测技术、高光谱成像技术等日新月异的信息化无损检测技术表现出极大的优越性。其中,高光谱成像技术以融合图像与光谱来获取物质空间信息的突出特点被引入至茶叶领域进行研究应用。高光谱成像技术能保持样品的完整性、减少样品前处理,实现快速、无损检测,因此该技术在茶叶领域具有巨大的发展潜力,被引入后茶叶的种类识别、等级判别、成分及生理参数测定等检测获得突破。随着技术的逐步发展,高光谱成像技术在茶叶领域的相关应用研究不断推进,但对其研究进展少有系统梳理。

本文以中国知网(CNKI)和Web of Science(WOS)核心数据库收录的相关文献为数据来源,采用文献分析软件CiteSpace对有关高光谱在茶叶领域的研究应用文献进行国家、作者和关键词分析,获得可视化知识图谱,梳理高光谱在茶叶中的研究进程,归纳其研究方向及热点,预测未来可能的研究趋势,以期对后续高光谱在茶叶领域应用的深入发展提供理论参考。

1 数据来源及方法

1.1 数据来源

以CNKI 和WOS 检索平台作为文献数据来源。采用高级检索,在CNKI 中以主题/关键词=“高光谱”AND“茶叶/茶”的方式进行检索;在WOS 中的检索公式为TS=(hyperspectral) AND TS=(tea)。CNKI和WOS数据库的检索时间范围分别为1999年1月1日至2022年2月28日、1985年1月1日至2022年2月28日,手动筛选检索结果,剔除不相关文献,最终分别获得69 篇中文(CNKI)和71篇英文(WOS)有效文献,将选择的有效文献分别以“Refworks”和纯文本文件格式导出保存作为数据样本。

1.2 方法

首先运用CNKI 和WOS 数据库的可视化分析检索功能统计文献年发表量,发现CNKI中相关文献最早出现在2008年,WOS中则最早出现于2009年。之后将上述保存的CNKI 和WOS 文献数据分别导入至CiteSpace5.8.R3 软件,进行以下设置:CNKI 数据库时间范围为2008年1月—2022年2月,WOS数据库时间范围为2009年1月—2022年2月;Node Tpyes(节点类型)均先后选择Keyword(关键词)、Country(国家)、Author(作者)分别作图,Pruning(网络裁剪区)均选择Pathfinder(路径找寻)、Pruning the merged network(修剪合并的网络),其余为默认参数。运行软件得到统计数据,生成并绘制共现图谱和Timeline view(时间线视图)。

在图谱中,国家、作者和关键词的节点越大则频次越高;节点的圈层表示中心性,是对节点影响力的标识,其宽度越宽则中心性越强,当中心性≥0.1时可被视为关键转折点。在时间线知识图谱中,聚类模块值Modularity(Q值)与聚类平均轮廓值Mean Silhouette(S值)两个聚类参数用于判断聚类效果,Q>0.3 认为聚类结构显著,S>0.5认为聚类合理。

为进一步细化高光谱成像技术在茶叶中的研究领域,对CiteSpace统计的CNKI和WOS数据库的所有关键词进行内容分析和阶段性领域归类,若关键词涉及到多个领域,则按照比例计算频次和中心性。

2 CiteSpace结果分析

2.1 发文国家分析

高光谱成像技术在茶叶领域应用研究的国家合作网络图谱显示,共有10个国家参与研究该项内容,包括中国、日本、美国、比利时、苏格兰、印度、英国、爱尔兰、荷兰、韩国。按发文量排列,中国、日本、美国位居前三,且中国发文量达53篇;其中,比利时的中心性超过0.1,中国的中心性为0.06。可见,比利时发表的研究论文对高光谱成像技术在茶叶中的应用研究贡献最高,而中国作为茶叶原产地对相关内容的研究数量最多,贡献率居于第二位。

2.2 作者合作分析

作者合作网络图谱能够呈现某一研究领域的核心作者以及作者间合作联系紧密程度,而核心作者是基于最高发文量作者的发文数,可通过普赖斯定律计算,公式为=0.749(),其中代表核心作者最低发文量,代表该时间段内最高产作者的发文量。

对中英文文献进行作者合作网络分析后发现,CNKI 文献的作者合作网络显示节点数161个,连线352 条。CiteSpace 数据统计得到论文发表最多篇数是4 篇,作者是吴瑞梅。代入上述公式计算得出=1.498,取整数2,即发文量≥2 的作者为核心作者。依照统计数据,核心作者共有34 位,发文数量3 篇及以上的作者有吴瑞梅(4篇)、李姝寰(3篇)、宁井铭(3篇)、艾施荣(3篇)、王化(3 篇)、刘仲华(3 篇)。此研究领域形成以吴瑞梅、刘仲华为核心的作者群,并且核心作者中吴瑞梅与艾施荣、李姝寰与宁井铭各自组成了合作团队,此外还有其他合作小团体以及较多孤立的作者。

英文文献作者节点数165个,连线394条。统计结果显示,学者NING JINGMING(宁井铭)发表论文数最高,达14篇,代入计算得到=2.802,取整数3,表明发文量3篇及以上的作者为核心作者。按照此标准共计20位核心作者,发文量前八的作者是NING JINGMING、ZHANG ZHENGZHU(张正竹)、SUN JUN(孙俊)、WANG YUJIE(王玉洁)、CHEN QUANSHENG (陈全胜)、LI LUQING (李露青)、WU XIAOHONG (武小红)、REI SONOBE,分别对应发表论文14 篇、10 篇、9 篇、8 篇、7 篇、7 篇、6 篇、6 篇。英文文献核心作者之间交流相对较多,以NING JINGMING 为首,与ZHANG ZHENGZHU、WANG YUJIE、LI LUQING 等核心作者组成了联系紧密的较大研究群体,SUN JUN 与WU XIAOHONG也交流甚多,此外还有分别以核心作者CHEN QUANSHENG、REI SONOBE、HE YONG (何勇)带领的合作团队。可以看出在该研究领域发表英文论文的作者多以团队合作的形式开展研究,人数大多超过3人。

2.3 发文量分析

发文量的时间分布统计可以反映某研究的发展阶段与趋势,基于CiteSpace中时间切片后各年份的文献数量统计数据,CNKI、WOS 的年发文量以及累计发文总量汇总如图1。2008—2021年间,总体上茶叶领域高光谱成像技术研究的相关文章发文总量呈持续上升趋势,而中英文文献的年发文量变化波动较大,可大致分为两个阶段。2008—2016年为缓慢发展阶段,文献发表分别始于2008年(CNKI)和2009年(WOS)。此阶段文献增量总体较低,但中文文献的数量多数时间高于英文文献的数量,特别是在2014年中文文献发表量出现1个小高峰,年发文量为8篇,除此之外国内外年发文量≤5篇,说明在此期间高光谱成像技术在茶叶领域的应用开始逐渐走入学者的视野,但没有受到显著关注。

图1 茶叶领域高光谱研究文献发文趋势

2017年至今则是快速发展阶段,该时期的累计发文量约占总量的68%。中文文献又一次达到小高峰后回落,增速放缓;而英文文献在2017年之后增长速度加快,2019年开始年发文量明显高于中文文献,并于2020年达到顶峰(17 篇),2022年前两月已有2 篇英文文献发表,表明茶叶领域的高光谱成像技术研究在国内外反响愈来愈强烈。以科技力量提高茶业质量效益和市场竞争力越来越成为全球性趋势,因此随着技术的发展和茶叶领域科技需求的增加,可以预测之后高光谱的相关研究热度仍会持续。

2.4 研究进程及方向分析

CiteSpace 的时间线视图和关键词突显图谱能进一步梳理高光谱成像技术在茶叶领域的研究脉络。时间线视图既能对关键词进行聚类分析,反映该研究领域的焦点内容,又可以呈现不同时间段的关键词变化趋势,展现聚类中的文献历史跨度。突显图谱则展示某时间段内数量激增且联系较强的关键词,以此确认前沿动态,预测未来研究趋势。

对CNKI的中文文献进行时间线视图和关键词突显图谱绘制,结果共显示出9 个聚类集,可以大致划分成以下两类:4个有关高光谱成像技术的研究内容和5 个在茶叶中的应用方向,其中作物和无损检测聚类集的研究时间贯穿整个演进过程。在时间线视图基础上分析突现词,得到2008—2021年的14个关键词。经计算有关高光谱成像技术发展研究的累计频次和平均频次分别为85 次和1.85 次,累计中心性和平均中心性分别为1.69、0.037。在茶叶中的研究应用范围分为茶叶栽培和茶叶加工两大领域,统计得到表1。结合时间视图、突显图谱和表1,可将CNKI文献中茶叶领域中高光谱成像技术应用领域的研究分为以下几个阶段。

表1 CNKI文献中高光谱成像技术在茶叶中的主要应用领域和方向

缓慢发展阶段(2008—2016年),在茶叶栽培领域,高光谱以植物营养信息获取、病虫害检测和农药残留检测的应用为主。在茶叶加工领域,种类识别、品质鉴别为主要的应用方向,其中,品质鉴别包含等级评判、制茶工艺评价(萎凋)等不同研究内容。突显图谱显示,栽培与加工领域的“等级”“茶多酚”“萎凋”关键词在此阶段突显,“等级”的突显强度较强(1.08),且持续研究的时间长度最长。

快速发展阶段(2017—2021年),主要应用范围继续扩展。除病害检测外,茶园分布识别以及茶园生产管理为栽培领域的主要方向。对于加工领域,储藏年份判别是近年来新增的研究方向,且此阶段的品质鉴别中同样含有在制茶工艺评价中的应用,但具体内容从萎凋工艺发展到拼配、发酵的工艺。

综上,中文文献的有关高光谱成像技术在茶叶领域的应用方向主要有植物营养信息获取、病虫害检测、农药残留检测、茶园分布识别、茶园生产管理、种类识别、品质鉴别。从整体的频次和中心性来看,茶叶加工领域均高于茶叶栽培领域,并且两个领域总和的累计值(111 次和1.85)均高于有关高光谱成像技术发展研究的累计值,但其平均值较低,分别为1.35次和0.022。

WOS 文献聚类共显示8 个聚类集,聚类集的分类标准与CNKI聚集的分类标准一致,其中feature selection (特征选择)、convolutional neural networks(卷积神经网络)、modeling(建模)为高光谱成像技术发展研究,而tea leaves(茶叶)、discriminant analysis(判别分析)、fine tea powder(细微的茶粉)、tea quality(茶叶品质)和shadegrown tea(遮阴茶)则属于茶叶领域的应用研究方向。此外,生成的突显图谱共显示10 个突显词,时间段为2009—2022年。WOS中计算得到有关高光谱成像技术发展研究的累计频次和平均频次分别为123 次和1.86 次,累计中心性和平均中心性分别为2.56、0.039。将国际文献中有关高光谱成像技术在茶叶领域的主要应用方向归类整理如表2,并归纳出WOS 文献中阶段性茶叶研究方向内容如下。

表2 WOS文献中高光谱成像技术在茶叶中的主要应用领域和方向

2009—2016年,国际上对高光谱成像技术在茶叶中的应用研究关注度低,关键词分布稀疏。在茶叶栽培领域主要是获取茶叶生长的营养信息,在加工上主要有对制茶工艺中的茶叶如干燥叶进行品质鉴别。“tea quality”“tea leave”“discriminant analysis”以及“water content”为此阶段两个领域的突显词。

2016年之后,高光谱成像技术在茶叶领域的应用快速发展,特别是2019年前后,关键词分布变得密集。栽培领域方向由植物营养信息获取发展至病虫害检测、茶园分布识别等,而加工领域增加种类识别,并且品质鉴别内容拓展,新增储藏年份判别和茶深加工产品品质判别。突显图谱显示这一阶段两个领域的突显词有“monitoring photosynthetic pigment”和“fine tea powder”,对“fine tea powder”的研究持续至今。

英文文献中高光谱成像技术在茶叶领域的研究方向主要为植物营养信息获取、病虫害检测、茶园分布识别、种类识别、品质鉴别,茶叶加工领域整体关注度高于栽培领域。而两个领域总和的频次累计值和中心性累计值(76 次和2.07)虽然低于高光谱技术发展领域的累计值,但平均值要更高,分别为1.90次和0.052。

3 在茶叶领域的研究热点与展望

3.1 研究态势

高光谱成像技术在茶叶领域的研究自2017年进入快速发展阶段,发文量的翻倍增加表明该技术在国内外的关注度迅速提升,茶业信息技术化进程正加速推进。其中,中国学者的英文文献发文量远超其他国家,占比高达78%,我国学者作出巨大的贡献。

但是从国家、国内外作者的合作网络可以看出,国家以及科研工作者之间联系强度较弱,特别是国内核心作者交集较少,而且国际性交流合作不足,因此未来国内外研究者之间的团队合作强度有待增强,望能出现更多的引领者进一步拓展该领域的学术成果。

3.2 研究热点

通过对关键词分析总结,得到高光谱成像技术主要在茶叶栽培与加工领域逐渐扩大深入,茶叶加工受到学者的更多关注。加工领域的品质鉴别、种类识别和栽培领域的茶叶营养成分监测、病虫害预测鉴定是当前热点应用方向。

品质鉴别是高光谱成像技术最早研究的方向,包括等级评判、制茶工艺评价等内容。在等级评判中已应用的检测手段如感官审评、近红外光谱等均未能兼顾茶叶内外综合信息,2008年开始学者利用高光谱成像技术的图像信息,进行一系列图像处理来研究绿茶等级评判,以达到同时检测茶叶内外品质的目的,因而利用此技术综合高效判别茶叶等级成为学者关注的热点,之后研究对象从绿茶又发展至乌龙茶、红茶。

数字农业中的精细化要求,使得生产者通过科技的融入将品质特征数字化,从而更精确把控各道加工工艺。在高光谱成像技术应用于制茶工艺的研究上,CNKI 文献以探究红茶的萎凋、发酵程度,以及拼配效果为主,通过生化成分含量或生产信息建立预测模型进行量化判别;WOS文献除关注红茶萎凋程度的判别研究外,还涉及茶叶品质检测等方面。

传统的茶叶种类识别多依靠一定经验积累的人工判别,且同样需要结合外部特征与内部品质信息,因此采用高光谱成像技术已建立针对不同茶类识别的预测模型,但在建模过程中存在提取特征信息困难等问题。随着技术的不断深入应用,研究者改进数据处理和建模方法,通过联合低秩自动编码器、高光谱遥感等技术提升准确率和效率。因此,该技术还被应用于茶叶特别是名优茶的真伪识别和地理起源保护,如碧螺春、铁观音真伪判别和龙井茶、庐山云雾茶产地鉴别等。

光合色素是茶树光合作用中的重要功能物质,其包含的叶绿素能反映植物的生长态势和营养状况,并且影响茶叶外观及品质形成;此外,有学者提出总叶绿素与类胡萝卜素的比例可能是评估植物环境压力的良好指标,因而国内外学者重点关注高光谱成像技术无损监测叶绿素、类胡萝卜素含量,这对茶树健康状况、抗逆能力等方面的及时准确判断具有指导意义。值得注意的是,日本的茶树栽培通常经过遮光处理,即承受低光胁迫的环境压力,所以日本采用高光谱成像技术监测色素含量变化以研究遮阴茶树生长条件。

氮、磷、钾是茶树生长发育中必需的3 种养分,传统方法检测茶叶氮、磷、钾的含量不仅耗时且会破坏茶叶,鉴于此,高光谱成像技术因能无损估算营养成分含量而得到运用。而且,如今茶农为追求茶叶品质常大量施肥,有研究将高光谱成像技术应用于茶树氮肥水平判别,利于指导合理施肥。通过高光谱成像技术建立光合色素(叶绿素、类胡萝卜素)和氮、磷、钾等植物营养成分含量与茶树生长态势之间的检测模型,可高效实时监测茶树健康状况,为优化施肥管理和提高茶叶品质提供了数据基础。

茶树遭受病虫害初期,受害叶片的外观特征并不显著,随着受害程度的加深,为害特征通过叶片颜色、形态等方面逐渐显现,因此对茶叶病虫害进行早期诊断十分重要。在使用科技采集信息之前,人工观察鉴别存在不及时、易误判等问题,而高光谱成像技术通过获取影像和光谱信息,能实时、客观地分析茶叶特征,预测识别灾害类型及损害程度。目前,该技术在茶园常见的炭疽病、赤叶斑病、茶白星病、红叶病以及小绿叶蝉等病虫害识别中得到应用,有助于茶叶病虫害的综合防治。

3.3 未来趋势

品质鉴别是茶叶加工最核心的研究内容,中国六大茶类(绿茶、红茶、白茶、黄茶、黑茶、青茶)具有不同品质特征,各茶类品质评判标准不尽相同,因而上述品质鉴别中各研究内容还有较大研究空间,如继续利用高光谱成像技术进行更多的茶类及其等级评判,以及绿茶杀青、白茶萎凋、黄茶闷黄、黑茶渥堆等关键工艺评价。同时,技术的深入应用也受到市场的影响。市场上随着人们对茶叶“越陈越香”的品质追求,出现白茶、普洱茶等茶叶储藏年份造假以哄抬价格等乱象,使得利用高光谱成像技术快速无损判别茶叶储藏年份的应用受到关注,陈书媛等发现建立标准正态变换预处理结合支持向量机模型对寿眉的储藏年份判别效果最佳。因此,通过高光谱成像技术建立茶叶储藏年份与茶叶品质的关系,帮助消费者快速、准确识别茶叶储藏年份是今后研究的一个重要方向。

此外,研究人员还利用高光谱成像技术对抹茶进行质量评估、物化特性检测的研究,但仍需在特征提取和建模手段中提高模型预测能力。随着茶产品的开发利用,相关产品的品质鉴别会是未来高光谱成像技术新的研究内容。

对茶园进行精细化管理,可为茶叶品质提升提供良好基础。先前有学者利用高光谱遥感基于茶树冠层光谱检测生长时期的茶叶质量,但是高光谱遥感技术在茶叶栽培领域的研究较少涉及整体茶园的生态及生产管理。现阶段已有关注数字化对茶园生产模式创新的影响,将高光谱遥感技术运用于安吉白茶产量估算,使得数字化进一步在茶园管理深入应用。高光谱遥感技术多应用于生态系统的生物参量精确分析检测,在茶园精准生产管理中仍有广阔的实践空间,如植被多样性检测、土壤生化参量反演、大气污染物监测等茶园精细化管理是未来继续努力的方向。

猜你喜欢
发文光谱茶叶
《茶叶通讯》简介
基于三维Saab变换的高光谱图像压缩方法
高光谱遥感成像技术的发展与展望
藏族对茶叶情有独钟
10条具体举措! 山东发文做好返乡留乡农民工就地就近就业
香喷喷的茶叶
基于GPU的高光谱遥感图像PPI并行优化
苦味酸与牛血清蛋白相互作用的光谱研究
便携式茶叶