基于表面增强拉曼光谱的毒品鉴别方法

2022-04-06 03:45杨志超
光谱学与光谱分析 2022年4期
关键词:互信息曼光谱拉曼

杨志超,蔡 竞,张 辉,石 璐

1. 浙江警察学院刑事科学技术系,浙江 杭州 310053 2. 毒品防控技术浙江省重点实验室,浙江 杭州 310053

引 言

2019年,我国破获毒品相关案件6.2万起,缴获毒品达49.1吨,抓获犯罪嫌疑人9万名。 214.8万名现有吸毒人员中,滥用冰毒人员占55.2%,滥用海洛因占37.5%,滥用氯胺酮占2.3%[1]。 毒品检测技术是发现毒品、固定证据的重要手段,传统的毒品检测方法主要有气相色谱质谱法[2-3]、高效液相色谱法[4-5]、毛细管电泳[6]等,此类检测方法过程复杂,耗时长,需要专门的实验环境和实验人员。 拉曼光谱技术具有“指纹”光谱、无需前处理、分析速度快等优势,适合犯罪现场检测[7]。 通过分析样品的拉曼谱图就可以得到样品的结构信息。 但是,绝大多数分子的拉曼散射截面非常小,拉曼光谱强度较低,使得拉曼很难有较低的检出限。 对于类似于毒品之类的痕量物质检测,因为样品浓度低,常规拉曼光谱无法被检测出来。 表面增强拉曼散射(surface-enhanced Raman spectroscopy, SERS)利用金、银等贵金属颗粒制作的溶胶与备件样品混合后,拉曼信号显著增强几个数量级,表面增强拉曼技术因其灵敏度高、操作简单方便等优势受到检测技术人员的普遍关注,并逐步实现特定应用场景的痕量检测[8-11]。

2011年,Farquharson等[12]使用固相萃取和SERS技术检测唾液中的药物,该方法成功检测了唾液中1 ppm的苯丙胺,地西泮,美沙酮和哌啶,可卡因的检测灵敏度高达50 ppb。 董荣录等[13]在模拟交易或吸毒现场使用印刷的纸质基材检测毒品。 同时,使用金纳米棒来检测人类尿液中的药物。 在支持向量机(SVM)的帮助下,该方法成功地检测了真实吸毒者尿液样本中的药物,准确率达92%以上。 2018年,Haddad等[14]使用银纳米粒子浸渍的纸质基底作为衬底,用于检测痕量芬太尼或是作为海洛因的掺杂物。 同时,与每种物质相关的特征峰的强度比符合Langmuir等温线校正模型,可以用于海洛因混合物中芬太尼的定量分析。 此外,用这些纸质SERS基底有助于从表面擦拭回收芬太尼,证明这是一种非常适用于犯罪现场调查的检测技术。 2020年,颜文杰等[15]分别获取了海洛因、甲基苯丙胺与其他物质的90组毒品混合物光谱数据,建立基于支持向量机与多层感知器神经网络的融合分类模型。 结果表明,基于高斯核函数、线性核函数、多项式核函数的SVM模型能够实现对不同质量分数海洛因混合品样本97.8%,97.8%和95.6%的准确分类,多层感知器能够对甲基苯丙胺混合品样本实现96.5%的准确分类。

既往研究都是基于拉曼光谱的全光谱数据,由于数据量较大,一方面影响运算速度,另一方面由于冗余波段信息影响,可能造成分类准确率降低。 通过光谱数据降维可以实现数据的压缩,更加节约运算资源。 本文利用主成分分析法、方差阈值法、遗传选择算法和互信息法四种降维算法,将六种毒品拉曼光谱数据降维,利用最近邻(KNN)、支持向量机(SVM)、人工神经网络(ANN)和随机森林(RF)四种分类器对降维后的拉曼数据进行分类,讨论不同的降维方法及分类器对准确率的影响。

1 实验部分

1.1 样品

实验所用苯丙胺(Amphetamine, AM)、海洛因(Heroin)、可卡因(Cocaine)、氯胺酮(Ketamine, KET)、甲基苯丙胺(Methamphetamine, METH)、芬太尼(Fentanyl)均由上海物证鉴定中心提供。 制作1 μg·mL-1六类毒品的水溶液,并加入纳米金增强试剂和5% NaCl溶液,毒品溶液、金溶胶增强试剂、NaCl溶液的体积比为20∶6∶5。 取30 μL混合溶液滴在载玻片表面,在空气中自然挥干后检测。 每类毒品溶液各制作5个样本,每个样本采集10个拉曼光谱。 6种毒品溶液拉曼光谱数据共300组,随机选择60组拉曼数据作为训练集,其余240组数据作为测试集。

1.2 仪器与试剂

实验采用美国Thermo Fisher公司生产的DXR2xi显微激光拉曼成像光谱仪,拉曼光谱仪具有超低暗噪声,单光子信号探测器等优势。 计算机环境为Intel(R)Core(TM)i5-5200U CPU @ 2.2GHz,RAM: 12.0 GB,64位操作系统。 实验采用柠檬酸钠还原法制备的金纳米颗粒(Au NPs)作为拉曼增强试剂,采购自厦门普识纳米科技公司,金纳米颗粒尺寸在50 nm左右,其电子显微图像如图1。

1.3 拉曼光谱数据的获取与校正

利用拉曼光谱仪获取血痕的拉曼光谱,实验考查了不同的激发波长、物镜倍数、激光强度、曝光时间、扫描次数等采集参数,综合比较对样本的破坏、荧光干扰、拉曼信号信噪比、实验效率等方面。 实验选择波长为785 nm激光作为激发光源,采用50×物镜,激光强度为0.7 mW,曝光时间为0.2 s,扫描次数为1 000次。 实验采用迭代自适应加权惩罚最小二乘法校正基线,使用S-G平滑滤波实现平滑处理,选取400~1 700 cm-1波段测试研究。

图1 金纳米颗粒的电子显微图像Fig.1 Electron microscopic image of Au NPs

1.4 毒品的拉曼光谱特征

图2 六类毒品溶液的拉曼光谱曲线Fig.2 Raman spectral curves of six drug solutions

2 结果与讨论

拉曼光谱数据特征较多,且大部分特征是冗余信息。 这些冗余信息不仅对分类没有帮助,而且会浪费计算资源,降低分类效率,所以需要对拉曼光谱数据进行降维。 降维算法主要分为两种,一种是基于数学变换的方法,比如主成分分析。 另一种是基于波段选择的方法,其特点在于保留了原来波段的物理特性,可解释性强。 比如方差阈值法、遗传选择算法和互信息法。 方差阈值法(Variance Threshold),是一种通过特征的方差值过滤方差的方法,计算每一个特征的方差,选择方差值最大的前N个波段,形成波段子集。 遗传选择算法(genetic algorithm, GA),模拟了生物种群的迭代进化原理,从一组随机的波段组合开始,通过交叉和变异过程,逐步迭代出最适合的波段组合。 本实验中遗传选择算法主要参数: 变异概率2%,迭代次数100次,种群个体数为200。 互信息(mutual information, MI),通过计算每个波段的强度值与类别标签之间的互信息值,互信息值表示了两者之间的相关程度,选择互信息值最大的前N个波段,形成波段组合。

实验采用主成分分析法、方差阈值法、遗传选择算法和互信息法四种降维算法,将六种毒品拉曼光谱数据降维至30个特征以内。 利用最近邻、支持向量机、人工神经网络和随机森林四种分类器对降维后的拉曼数据完成分类,讨论不同的降维方法及分类器的准确率。

2.1 毒品拉曼光谱主成分分析

主成分分析的前3主成分空间分布如图3所示。 从拉曼光谱数据的前3主成分在空间的分布可知,六类毒品样本的分离性较好。 前K个主成分特征的方差贡献率如图4所示,可知前5个主成分的方差贡献率已达80%,取前5个主成分即应得到较好的分类准确率表现。

图3 六类毒品溶液的前三个主成分分布图Fig.3 Principal components analysis score plot of samples

图4 主成分特征方差贡献率Fig.4 Principal component feature explainedvariance contribution ratio

2.2 降维与建模结果

利用4种降维方法压缩特征数量后,分别采用KNN, SVM, ANN, RF分类器重复10遍,其准确率表现如图5所示。 其中,拉曼光谱数据经过PCA方法降维后,各分类器的准确率均较高。 在选取的主成分为5时,各分类器准确率都在95%以上。 这主要是由于PCA算法是一种基于数学变换的降维算法,变换后的每一个主成分特征包含了所有波段的组合信息,所以PCA降维后的分类效果好。 在三种波段选择方法中,遗传选择算法得到的波段组合准确率相对较高。 结合SVM分类器,遗传选择算法筛选出的5个拉曼波段的组合,分类准确率已达到95%以上,在选择的波段数达到30时,准确率达到99.5%。 在取25个以上的波段时,方差阈值法准确率达到95%以上。 互信息法确定的波段子集的分类准确率较低,特别是在波段数量大于15后,准确率还有下降。 可能是由于,在波段数量大于15后,互信息法选择了无价值的冗余波段,致使准确率下降。

3 结 论

在表面拉曼光谱技术区分毒品种类方面,将拉曼光谱数据降维后再进行分类,依然保持了较高的分类准确率,降维方法在毒品拉曼光谱分类上体现出有效性。 在主成分分析法、方差阈值法、遗传选择算法和互信息法四种降维算法中,基于数学变换的主成分分析降维方法效果最好,在降维至5个特征时,各分类算法的准确率依然能达到95%以上。 其他三种波段选择算法中,遗传选择算法筛选特征的效果最好,在波段数为20, 25, 30时,SVM算法的分类准确率分别达到98.5%, 99.1%, 99.5%。 遗传选择算法作为波段选择算法,不仅可以降低拉曼光谱采集数据的维度,而且可解释性更强,有更重要的意义。

猜你喜欢
互信息曼光谱拉曼
馆藏高句丽铁器的显微共聚焦激光拉曼光谱分析
Preoperative maximal voluntary ventilation, hemoglobin, albumin, lymphocytes and platelets predict postoperative survival in esophageal squamous cell carcinoma
黑磷的多声子共振拉曼散射*
基于拉曼光谱的面团冻结过程中水分分布的在线监测
基于改进互信息和邻接熵的微博新词发现方法
吹奏千年的巴拉曼
基于互信息的图像分割算法研究与设计
基于互信息的贝叶斯网络结构学习
基于增量式互信息的图像快速匹配方法
实用拉曼光谱引论