红外光谱和逐步判别分析法应用于油菜籽的研究

2016-07-12 12:43杨春艳谢建新
光谱学与光谱分析 2016年5期
关键词:油菜籽产地红外

刘 飞,杨春艳,谢建新

1.玉溪师范学院物理系,云南 玉溪 653100 2.玉溪师范学院化学系,云南 玉溪 653100

红外光谱和逐步判别分析法应用于油菜籽的研究

刘 飞1,杨春艳1,谢建新2

1.玉溪师范学院物理系,云南 玉溪 653100 2.玉溪师范学院化学系,云南 玉溪 653100

用傅里叶变换红外光谱(FTIR)和逐步判别分析法对油菜籽的品种和产地进行鉴别研究。测试了来自5个产地17个油菜籽品种188份油菜籽皮样品的红外光谱,按产地和品种选择训练样本,每个品种选择5份为训练样本,剩下的作为测试样本,选择1 800~950 cm-1范围的光谱信息,在SPSS20.0的判别分析模块中采用逐步法,Fisher线性判别准则,分别建立油菜籽品种和产地的鉴别模型来判别样品的品种和产地; 比较了逐步判别分析中五种筛选建模信息的算法所建立的模型对实验样品品种和产地的鉴别效果。基于油菜籽皮红外光谱信息的品种判别分析,五种筛选变量的算法所建立的模型都能较好的识别油菜籽的品种,“Wilks’ Lambda”法所建模型的识别效果最好,判别正确率为97.9%。基于油菜籽皮红外光谱信息的产地判别分析,五种筛选变量的算法所建立的产地判别模型也都能较好的识别油菜籽的产地,“Unexplained variance”法所建模型的识别效果最好,判别正确率为98.4%。研究结果表明,基于油菜籽皮中红外光谱信息的品种和产地判别分析,有望成为油菜籽品种和产地鉴别的方法。

红外光谱; 逐步判别分析; 油菜籽; 研究

引 言

油菜籽是我国最重要的食用油料来源,富含蛋白质、脂肪、维生素、矿物质等营养物质。蛋白质含量为21%~30%,粗脂肪含量为30%~50%; 含有的维生素包括维生素E、维生素B1、维生素B2、烟酸、叶酸、泛酸等; 含有的氨基酸组成平衡合理,人体必需的氨基酸如赖氨酸和含硫氨基酸等含量高; 另外还含有钙、镁、磷、硒、锰、锌、铁、铜、碘等营养元素。我国是世界油菜生产的第一大国,年均种植面积1.1亿~1.2亿亩,总产1 050万吨左右[1]。油菜产业的发展,不仅能保障我国13亿人口的食用植物油来源,也可为养殖业提供优质的蛋白饲料来源,同时由于和水稻等主要粮食作物轮作,有利于培肥土壤。另外,油菜产业的发展对现代工业、食品、医药保健、生物能源以及生态景观等方面也有重要意义。油菜籽的品质受品种、产地、种植技术等因素的影响,美国和欧盟等都要求食品能够进行跟踪和溯源[2-3],我国也要求进口的食品需载明原产地[4]。因此,对油菜籽的品种及产地进行鉴别研究具有实际意义。

油菜籽品种和产地的传统鉴别方法主要是形态法和化学成分分析法。形态法主要根据油菜籽外形和油菜生长过程中的形态变化来进行判别,耗时长且主观性强; 化学成分分析法需对样品分离提取,复杂和繁琐,耗时长,不适合大批量快速鉴别。通过现代分子技术进行鉴别,也要分离提取,而且专业性强,费用昂贵[5]; 通过近红外光谱技术进行鉴别,需要建模,模型对仪器的专属性强,不稳定[5]。傅里叶变换红外光谱(FTIR)技术具有灵敏度高、重复性好,样品用量少、无需提取分离,仪器操作简便、快速等优点。样品的光谱信息中能反映样品的品种、产地、种植和加工等方面的综合信息,已广泛应用于真菌和细菌菌株[6-7]、中药[8]、农副产品[9]等多方面的鉴别与分析,但红外光谱对油菜籽产地的鉴别研究尚未见报道。油菜籽包含皮和仁两部分,以往虽然用仁的红外光谱结合光谱检索方法直观的鉴别了油菜籽的不同品种[10],但该方法还不够直接,且由于仁的光谱中脂类物质和蛋白质类物质的光谱信息较强,可能掩盖了能较好反映油菜籽产地和品种的一些弱信息,因此需要用皮的光谱来继续研究鉴别油菜籽的方法。判别分析是一种实用、有监督的分类方法[11],已广泛应用于经济、医学、烟草等方面[12-14],基于红外光谱信息的判别分析应用于油菜籽品种和产地的研究尚未发现。本实验以油菜籽皮的红外光谱为观测量,采用逐步判别分析法分别建立模型对油菜籽品种和产地进行鉴别研究,以期能为油菜籽的品种和产地鉴别提供实用方法。

1 实验部分

1.1 仪器与测试条件

傅里叶变换红外光谱仪,由美国PE公司生产、Frontier型,装备DTGS检测器; 选择4 cm-1的光谱分辨率,4 000~400 cm-1为光谱扫描范围,重复扫描16次。在Omnic8.0软件中进行光谱数据处理,在SPSS20.0软件的判别分析模块中进行逐步判别分析。

1.2 样品制备

实验油菜籽样品来自5个产地,涉及17个品种,其中9个品种产自云南玉溪,由玉溪市农业科学研究院提供; 有5个品种产自云南罗平,由罗平县的种业部门提供; 浙江绍兴品种有3个,在绍兴的种业部门购得; 四川成都品种有2个,在成都的种业部门购得; 湖南长沙品种有2个,在长沙的种业部门购得。分离各产地各品种油菜籽样品的皮和仁,按每份样品由约20粒油菜籽的皮组成,每个品种制作5到15份样品,共制作188份样品。将每份样品放入玛瑙研钵磨为细粉,并加入溴化钾粉末研磨均匀,然后压片测定光谱。表1为各实验样品的品种名称、产地及其编号。

表1 实验样品的品种名称、产地及编号

2 结果与讨论

2.1 油菜籽皮的红外光谱

图1 各品种油菜籽第1份皮样品的红外光谱

2.2 红外光谱与逐步判别分析法对油菜籽品种和产地的研究

红外光谱能够反映油菜籽皮中所有组分的整体信息,这些信息中隐含着油菜籽的品种、产地和种植技术等信息,光谱的每一个数据点代表一个信息变量, 通过基于油菜籽皮红外光谱的模式识别分析,可建立能够对油菜籽的品种和产地进行鉴别的快速方法。判别分析是一种有监督的分类识别方法,先通过已知分类情况的样本及其特征信息来建立分类模型,再用未知分类样本的同种信息来进行分类预测[11]。逐步判别法是判别分析中的一种,能够按照规定算法对提供的样本信息进行计算判断,筛选对分类影响大的信息来建立分类判别模型。在SPSS20.0的逐步判别分析中,筛选样本信息来建立分类模型的算法共设置有五种,即“Wilks’ Lambda”,“Unexplained variance”,“Mahalanobis distance”,“Smallest F ratio”和“Rao’s V”。实验以油菜籽皮的红外光谱信息为样本特征,采用逐步判别分析法来对油菜籽的品种和产地进行鉴别研究,同时比较了筛选信息变量采用不同方法所建判别模型的鉴别效果。

2.2.1 基于油菜籽皮红外光谱信息的品种判别分析

以油菜籽皮在1 800~950 cm-1范围的425个光谱变量为样本特征,对全部188个样品17个品种按产地和品种选择训练样本,每个品种选择5份为训练样本,其余的作为测试样本,依据Fisher线性判别准则,用逐步判别分析中的不同算法来筛选样本信息变量分别建立分类模型,进行油菜籽品种的鉴别比较。表2为挑选信息变量的不同算法所挑选的变量情况。由表2知,逐步判别分析中挑选样本信息的不同算法从425个信息变量中挑选的变量和变量个数存在明显差异,说明不同算法所建立的品种判别模型不相同。表3为不同算法所建立的判别分析模型对油菜籽样本进行品种鉴别的情况。表3反映,五种不同算法所建立的判别分类模型,对实验油菜籽样品的品种判别分类结果都比较好。分类正确率最高的是“Wilks’ Lambda”法所建立的模型,训练样本回判全部正确,测试样本预测95.2%的正确,总的判别正确率为97.9%; 分类正确率最低的是“Smallest F ratio”法所建立的模型,训练样本回判有98.1%的正确,测试样本预测有84.3%的正确,总的判别正确率为92.0%。说明基于油菜籽皮红外光谱信息的逐步判别分析能很好的识别油菜籽的品种,采用“Wilks’ Lambda”法来挑选信息变量,建立油菜籽品种判别分类模型的鉴别效果最好。

表2 品种鉴别中不同算法选择的变量情况

表3 品种鉴别中不同算法的模型对样品的鉴别情况

2.2.2 基于油菜籽皮红外光谱信息的产地判别分析

按照2.2.1中的方法,用逐步判别分析中筛选变量的不同算法来筛选样本信息,分别建立产地的鉴别模型对样品的产地进行鉴别研究。表4和表5为逐步判别分析中不同算法的模型对样本进行产地鉴别的情况。图2为逐步判别分析的不同算法对训练样本的分类图,图中横坐标是各训练样本在分类函数1中的得分,纵坐标是各训练样本在分类函数2中的得分。由表4知,产地判别分析中,筛选样本信息的不同算法从425个信息变量中筛选的变量是不同的,各种算法建立的判别分类模型也是不同的。图2直观地反映了各种算法所建立的分类模型对训练样本的汇聚情况,也反映了在不同算法下各类样本间的关系。由图2知,各类训练样本在不同算法的分类模型下,整体分类效果都较好,说明油菜籽皮中含有比较明显的产地信息; 罗平产的油菜籽与其他4个类别的界限相对更清晰,说明罗平产的油菜籽皮中产地特征最强。表4和图2还表明,油菜籽皮的红外光谱中有一系列变量含有产地信息,逐步判别分析法能按不同的算法挑选出合适的信息变量,来建立分类效果较好的产地识别模型。由表5知,五种算法所建立的产地判别分类模型,正确率最高的是“Unexplained variance”法建立的模型,总的判别正确率达到了98.4%; 正确率最低的是“Rao’s V”法建立的模型,总的判别正确率为89.4%。上述实验结果表明,基于油菜籽皮红外光谱信息的逐步判别分析同样也能很好的识别油菜籽的产地,采用“Unexplained variance”法来筛挑建模信息变量,建立油菜籽产地判别分类模型的鉴别效果最好。

表4 产地鉴别中不同算法选择的变量情况

表5 产地鉴别中不同算法的模型对样品的鉴别情况

油菜籽皮是一种天然产物,样品的红外光谱是所有组成成分红外光谱的叠加光谱,不同品种、不同产地油菜籽皮的组成成分及含量虽然有差异,但由于差异不大,使得不同油菜籽皮中不同的成分及含量差异的光谱信息被主要成分的光谱所掩盖,因此不同品种及产地油菜籽皮的红外光谱外观很相似,通过光谱来直接鉴别不同品种或不同产地的油菜籽很困难。可是不同油菜籽皮的成分差异信息毕竟包含在光谱中,这些信息受遗传因素的影响,也受生长环境和种植技术的影响,通过模式识别的统计方法能把这些信息挖掘出来,用于品种、产地、栽培方式等的鉴别。判别分析是一种模式识别的统计分类方法,需要先掌握一批已知分类情况的样本及样本信息来建立判别分类模型,用未知分类情况样本的同种信息来进行分类判别。红外光谱技术具有仪器通用,操作简单,重复性好等优点,本实验的研究结果说明,基于油菜籽皮红外光谱信息的判别分析对品种和产地的判别,鉴别效果好,具有方便快捷的优点。

在本实验的研究中,表2和表4以及图2反映了样品的品种及产地等信息,在红外光谱中都是由一系列的信息变量来体现; 筛选变量的不同算法按不同规则来选择特征较强的光谱信息,建立判别模型来鉴别样品的品种及产地,由于筛选的变量不同,建立的模型也不同,但鉴别结果差异不太显著,都能较好的识别样本的品种或产地,表明红外光谱中品种或产地等信息具有统计规律。因此,以红外光谱为信息变量,采用逐步判别法建立模型,鉴别样本的品种或产地时,建立模型的样本要有足够的数量及覆盖面。本实验的样本,用在品种鉴别方面,同一品种的油菜籽产地还比较单一,还需增加不同产地的同一品种样本进行研究; 用在产地鉴别方面,同一产地不同品种的油菜籽样本也较少,同样也需要增加样本进行研究。另外,种内不同生长年份对油菜籽皮的成分含量也有影响,不同生长年份的光照、温度、降水等因素不同,会导致同一产地同一品种的油菜籽皮样品的成分及含量有差异,本实验的样本在种内生长年份都相同,因此也需要增加不同生长年份的样品进行研究。尽管如此,本实验的结果仍能初步说明,以油菜籽皮的红外光谱为样本信息的逐步判别分析,有望成为油菜籽品种和产地鉴别的一种实用方法。

图2 产地鉴别中不同算法的模型对训练样本的分类情况

3 结 论

利用傅里叶变换红外光谱(FTIR)技术测试了来自5个不同产地、17个油菜籽品种,188份油菜籽皮样品的光谱。选择1 800~950 cm-1范围的425个光谱变量来反映各样品的特征,按产地及品种划分样品,每个品种选择5份样品为训练样本,其余为测试样本,在统计分析软件SPSS20.0的判别分析模块中,采用逐步法、Fisher线性判别准则,分别建立油菜籽品种和产地的鉴别模型,对油菜籽品种和产地进行鉴别分析。结果表明,以油菜籽皮的红外光谱为样品信息,通过逐步判别分析法来鉴别油菜籽的品种和产地,有望成为油菜籽品种和产地鉴别的一种实用方法,具有方便快捷的优点。

[1] LIU Jian(刘 建).Cultivation Technique for High Yield and Benefit of Quality Rapes(优质油菜高产高效栽培技术).Beijing: China Agricultural Science and Technology Press(北京: 中国农业科学技术出版社), 2011.

[2] 32002R0178(EC 178/2002),Regulation(Ec) No 178/2002 of the European Parliament and of the Council of 28 January 2002 Laying Down the General Principles and Requirements of Food Law, Establishing the European Food Safety Authority and Laying Down Procedures in Matters of Food Safety.

[3] H.R.2749 RFS,Food Safety Enhancement Act of 2009.

[4] Article 9 of a Presidential Order of the People’s Republic of China(中华人民共和国主席令第 9号).Food safety of the People’S Republic of China(中华人民共和国食品安全法).

[5] CHEN Shi-lin, GUO Bao-lin, ZHANG Gui-qun, et al(陈士林,郭宝林,张贵群,等).Advances of Studies on New Technology and Method for Identifying Traditional Chinese Medicinal Materials(中药鉴定学新技术新方法研究进展).China Journal of Chinese Material Medica(中国中药杂志), 2012, 37(8): 1043.

[6] Al-Qadiri H M, Lin M, Cavinato A G, et al.International Journal of Food Microbiology, 2006, 111(1): 73.

[7] Erukhimovitch V, Tsror L Lahkim, Hazanovsky M, et al.Applied Spectroscopy, 2007, 61(10): 1052.

[8] SUN Su-qin, ZHOU Qun, CHEN Jian-bo(孙素琴,周 群,陈建波).Analysis of Traditional Chinese Medicine by Infrared Spectroscopy(中药红外光谱分析与鉴定).Beijing: Chemical Industry Press(北京:化学工业出版社), 2010.

[9] Duarte I F, Barros A, Delgadillo I, et al.J.Agric.Food Chem., 2002, 50(11): 3104.

[10] LIU Fei, YANG Chun-yan, LIU Gang(刘 飞, 杨春艳, 刘 刚).Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2013, 33 (11): 3036.

[11] WANG Dong-hua(汪冬华).Multivariate Statistical Analysis and SPSS Application(多元统计分析与SPSS应用).Shanghai: East China University of Science and Technology Press(上海: 华东理工大学出版社),2010.

[12] ZHANG Xin-xin, LI Yu, JI Yu-jia, et al(张新新,李 雨,纪玉佳,等).Journal of Shandong University(Health Sciences)(山东大学学报·医学版), 2012, 50(1): 143.

[13] ZHU Li-jun, WANG Peng, SHI Feng-cheng, et al(朱立军,王 鹏,施丰成,等).Journal of Southwest University·Natural Science Edition(西南大学学报·自然科学版), 2012, 34(3): 9.

[14] ZHAO Hai-yan, GUO Bo-li, WEI Yi-min, et al(赵海燕,郭波莉,魏益民, 等).Scientia Agricultura Sinica(中国农业科学), 2011, 44(7): 1451.

(Received Sep.25, 2014; accepted Jan.21, 2015)

Identification of Planting Area and Varieties of Rapeseeds by Infrared Spectroscopy Combing with Stepwise Discriminatory Analysis

LIU Fei1, YANG Chun-yan1, XIE Jian-xin2

1.Department of Physics, Yuxi Normal University, Yuxi 653100, 2.Department of Chemistry, Yuxi Normal University, Yuxi 653100, China

The planting area and varieties of rapeseeds were studied based on Fourier transform infrared spectroscopy (FTIR) combining with stepwise discriminatory analysis.The FTIR of 188 rapeseed skin samples of 17 varieties from 5 planting areas was obtained and processed by OMINC 8.0 software.In order to distinguish their planting area and variety, 5 spectra in the range of 1 800~950 cm-1for each variety from each producing area were selected as training samples arbitrarily with Fisher linear discriminatory criterion which was used to build model by means of stepwise discriminatory analysis by SPSS20.0 software.All the five discriminatory models based on Wilks’Lambda, Unexplained variance, Mahalanobis distance, Smallest F value and Rao’s v can distinguish variety and planting area well, and the best one for identifying variety was on the base of Wilks’Lambda, which yielded correct rate of 97.9%, and the best one for distinguishing planting area was on the base of Unexplained variance with a correct rate of 98.4%.The results showed that discriminatory analysis based on the infrared spectrum of rapeseed skin is an efficient method for identification of rapeseed variety and planting area.

Infrared spectroscopy; Stepwise discriminatory analysis; Rapeseed; Study

2014-09-25,

2015-01-21

国家自然科学基金项目(21465024)资助

刘 飞, 1974年生, 玉溪师范学院物理系副教授 e-mail: yxtclf@163.com

O657.3

A

10.3964/j.issn.1000-0593(2016)05-1363-06

猜你喜欢
油菜籽产地红外
网红外卖
闪亮的中国红外『芯』
油菜籽价格有望继续上涨
警惕“洗产地”暗礁
TS系列红外传感器在嵌入式控制系统中的应用
筒仓中油菜籽堆高安全域的研究
食物离产地越远越好
测定不同产地宽筋藤中5种重金属
RP-HPLC法同时测定7个产地天麻中5种成分
基于快速递推模糊2-划分熵图割的红外图像分割