基于小波变换的便携式质谱重叠峰解析方法研究

2015-04-18 02:15李宝强李翠萍黄启斌张众垚郭春涛
质谱学报 2015年3期
关键词:小峰质谱仪小波

李宝强,李翠萍,黄启斌,张众垚,徐 智,张 琳,郭春涛

(1.国民核生化灾害防护国家重点实验室,北京 102205;2.北京普析通用仪器有限责任公司,北京 100081)



基于小波变换的便携式质谱重叠峰解析方法研究

李宝强1,李翠萍1,黄启斌1,张众垚1,徐 智1,张 琳1,郭春涛2

(1.国民核生化灾害防护国家重点实验室,北京 102205;2.北京普析通用仪器有限责任公司,北京 100081)

针对便携式质谱重叠峰导致无法准确识别待测物质特征峰的问题,研究了基于小波变换的重叠峰解析方法,并对使用该方法处理重叠峰时存在的小波函数的选择、小波分解层数的确定、信号经小波变换后细节部分的选取,以及细节部分放大倍数的确定等问题进行了研究。选用仿真的大峰与大峰重叠数据、大峰与小峰重叠数据和便携质谱仪实测的DMMP重叠峰数据进行实验。结果表明,应用该方法解析重叠峰后,与原始数据的分离度相比,仿真的大峰与大峰的分离度提高了128.57%,大峰与小峰的分离度提高了52.0%,实测DMMP数据的分离度提高了至少33.75%。

便携式质谱;重叠峰解析;小波变换

便携式质谱仪处于单质谱工作模式并对复杂物质进行分析,或处于色质联用工作模式受到色谱共流出物的碎片峰影响时,由于仪器的分辨率不够高,在质谱图中会出现重叠峰的现象,导致不能准确地寻找特征峰位置,从而影响待测物质的识别。

针对重叠峰解析的问题,国内外进行了深入研究并提出了很多方法。Kauppinen等[1-4]提出的基于傅里叶变换的自去卷积技术,已广泛应用于以光谱信号为主的多种重叠信号的解析,它是在频域中通过对分析信号除以去卷积函数减小分析信号的半峰宽,从而实现对重叠峰的分离,但是去卷积过程使噪音呈指数增加,在提高分辨率的同时也降低了信噪比,易产生负旁瓣效应。小波变换是Fourier变换方法的扩展,Serrai等[5]将小波变换应用于核磁共振谱参数的确定和重叠峰的分辨,根据小波变换的时频局部性,将各组分从混合信号中分离出来;Alsberg等[6]将小波变换的多尺度分析用于重叠光谱峰的识别和分辨,有效地提高了分辨率;莫金垣等[7]提出了样条小波分辨器技术,并将其应用于重叠伏安峰的分辨,既可使峰形变窄且保持峰位置相对误差小于3%和峰面积相对误差小于5%,但是峰强会有所改变;邵学广等[8]提出了利用小波离散细节解析重叠峰,并将其用于重叠色谱峰的分辨,该方法存在的问题是重构过程中用到的高频信号如果含有噪声成分,将其带回重构,则会将噪声引入到处理后的信号;王佩佩等[9]提出基于小波特征提取的径向基函数神经网络模型解析色谱的重叠峰,利用小波变换奇异性检测原理从原始色谱信号中提取特征点,来确定RBF网络的隐节点数目和网络参数的初值,并用该网络拟合原始重叠色谱信号,梯度下降法训练后获得解析结果,实现重叠色谱峰的分离,但是该方法实现过程较为复杂,需要较长的时间,不适合现场实时检测的需要;郑建斌等[10]提出了小波傅里叶自去卷积方法,用小波函数作为傅里叶自去卷积的截止函数,并将其用于重叠示波计时电位信号的分辨,该方法能够有效地解析重叠电位信号,但是小波函数的选取具有很强的主观性;刘伟等[11]利用小波与神经网络相结合的方法解析可见重叠光谱峰,其实质是在小波特征空间中寻找到一组合适的小波基,通过小波参数的迭代计算使其能量函数最小化来实现,但是计算比较复杂。曲线拟合[12]是根据最小二乘法原理,将重叠信号模拟为两个或两个以上单组分信号之和,使合成信号与实际测定的重叠信号之间的误差平方和达到最小,从而将重叠信号解析为几个单组分信号,该方法需要建立相适应的数学模型和确定独立谱带的准确数目[13-14],且在实际应用中的运算比较复杂。上述重叠峰解析方法是在研究光谱重叠峰、伏安或电位重叠峰或色谱重叠峰等问题时提出的,并不能直接应用于质谱重叠峰的解析,因为使用小波变换解析重叠峰时需要结合质谱仪器的性能和质谱信号,来确定选用的小波函数、小波的分解层数等问题。

在质谱图的重叠峰处理中,一般是通过色质联用法或使用高分辨率的仪器来实现的,而通过信号处理的方式来解析重叠峰的方法则较少。便携质谱仪可用于环境污染、公共安全、过程监测以及突发事故等现场检测时快速、准确地鉴别未知物质,但由于进样样品一般为混合物且分辨率比实验室质谱仪低,即使在选择离子扫描模式下,也可能受到干扰物质的碎片峰影响,产生完全重叠或部分重叠的谱峰,导致样品的质谱峰比例改变,从而影响物质的识别。为了能在现场快速、准确地识别待测物质,研究采用信号处理方式来实现对重叠峰的解析是很有必要的。基于小波变换处理重叠峰的方法在光谱和色谱应用中具有原理简单、分离效果好、运算速度快等优点,本工作将研究基于小波变换解析质谱重叠峰的方法,并对在质谱中使用该方法需要解决的4个主要问题,即小波函数的选择、小波分解层数的确定、小波分解后细节部分的选取以及细节部分放大倍数等进行分析和实验,同时验证该方法在实测便携式质谱重叠峰解析中的有效性。

1 小波变换分离重叠峰理论

信号经小波变换后,不同尺度下的近似部分和细节部分代表着信号中不同的频率成分,处理这些不同的频率成分可以实现信号的时频局部化分析。由于质谱峰信号峰顶处的频率较高,而峰的其他位置的频率较低,利用小波变换把重叠信号分解为不同的频率成分,细节部分对应着信号的高频成分,即峰顶处的信息;近似部分则对应着低频成分,即背景等信息。本质上,小波变换是一种积分变换,根据积分变换的线性关系,多个信号在时域的叠加,其相应的频域也叠加,并不会改变原有信号的线性关系[15]。因此,可以根据小波变换的细节部分对信号的高频成分进行处理,从而实现重叠峰的解析。

设某化合物的质谱信号由M个高斯峰组成:

(1)

其中,f(t)是仪器的实测信号,t是质荷比(m/z)的时间序列,Am是第m个谱峰信号的峰面积,cm是峰中心,wm是半峰宽,n(t)是噪声。

利用小波变换解析重叠峰的方法如下[8]:

1) 对重叠谱峰信号f(t)进行小波变换,得到小波系数{cj,dj,dj-1,……d1},其中,cj为小波系数的近似部分,di(i=j,j—1,…,1)为小波系数的细节部分;

2) 选取表示谱峰信号的较高频率的离散细节di;

3) 合理地确定离散细节di的放大倍数;

4) 将放大后的细节部分与近似部分进行小波逆变换,得到新的质谱峰信号,即为小波变换解析重叠峰的结果。

在该方法中,要研究解决4个问题:一是小波函数的选取,信号经不同的小波函数变换后获得的小波系数不同,重叠峰的分离效果也不相同;二是小波分解层数的确定,为了准确地提取峰位所对应的频率成分,同时使经过小波变换后的信号既具有较高的信噪比,又有较好的分辨率,必须选择合适的分解层数;三是合理选取细节部分,细节部分选取的正确与否直接影响峰位的准确性;四是细节部分放大倍数的选择,如果选择的倍数较大,虽然分离效果提高了,但是经逆变换后得到的新信号强度严重失真,如果倍数较小,则达不到分离的效果。

2 实验部分

2.1 仪器及试剂

便携式质谱仪:普析通用仪器有限责任公司,北分仪器技术有限责任公司产品。

甲基磷酸二甲酯(DMMP,浓度5 mg/m3)。

2.2 质谱条件

离子化能量70 eV;分辨率:半峰宽0.5;扫描速度:低速扫描;质量范围m/z45~300;质量分析器:双曲面四极杆;使用Matlab7.8.0编写程序进行实验。

2.3 小波解析重叠峰

采用仿真重叠峰数据和便携式质谱仪实测的DMMP重叠峰数据研究小波变换解析重叠峰理论的4个主要问题。仿真数据是在便携式质谱仪实际应用的基础上设计的,便携式质谱仪的分辨率用半峰宽表示为ΔM<1 u,对每个峰的采样点数为:大峰(相对丰度>30的峰,如基峰或特征峰等)一般含有13~15个采样点,小峰(相对丰度<10的峰,如同位素峰等)一般为4个采样点。本实验按大峰14个点,小峰4个点进行采样,发生重叠峰的情况主要有两类:大峰与大峰,重叠的采样点数可以为1~12,峰重叠情况示于图1,两个峰的峰位分别为99、100(峰重叠的采样点数为7);大峰与小峰,重叠的采样点数可以为1~4,存在大峰完全覆盖小峰的情况,示于图2,两个峰的峰位分别为102、103(峰重叠的采样点数为3)。便携式质谱仪实测的DMMP重叠峰数据示于图3,两个峰的峰位分别为93、94。

图1 大峰与大峰重叠仿真数据Fig.1 Simulative large-large overlap peak

2.3.1 小波函数的选取 小波函数的选取是根据小波基函数选择的标准[16]:能量和Shannon熵。信号的能量值与信号本身有着特定的关系,如果一个对应于某尺度s的主要频率成分存在于信号中,则这个主要频率成分所对应该尺度的小波系数将有较高的幅值,即最适合小波函数应可以从待测信号中提取最大能量值。能量的定义示于式(2):

(2)

图2 大峰与小峰重叠仿真数据Fig.2 Simulative large-small overlap peak

图3 便携质谱仪实测DMMP重叠峰数据Fig.3 Measured DMMP overlap peak by portable mass spectrometer

同时,小波系数的能量分布可由Shannon熵定量描述为[12]:

(3)

式中,pi为小波系数的能量分布概率,定义为:

(4)

根据上述标准的特点,一个合适的小波函数应该有最大化的能量和最小化的熵。为了平衡这些标准,提出了一个综合的优化指标,能量-Shannon熵比,即最适合的小波函数应获得能量-Shannon熵比的最大值,其定义示于式(5):

(5)

选择进行比较的小波函数包括:haar、db2、db4、db6、db8、db10、coif1、coif2、coif3、coif4、coif5、sym2、sym3、sym4、sym6、sym8、bior1.3、bior2.2、bior2.4、bior2.6、bior3.3、bior4.4、bior5.5、bior6.8。以仿真大峰与大峰的重叠数据和实测的DMMP重叠峰数据为例,通过计算经每个小波函数变换后的能量、Shannon熵和能量-Shannon熵比,选取最适合的小波函数,结果示于图4和图5。

图4 各个小波函数处理仿真信号后 获得的能量、Shannon熵和能量-Shannon熵比Fig.4 The energy, Shannon entropy and Energy-Shannon entropy ratio of wavelet functions of simulative signal

图5 各个小波函数处理实测DMMP后 获得的能量、Shannon熵和能量-Shannon熵比Fig.5 The energy, Shannon entropy and Energy-Shannon entropy ratio of wavelet functions of measured DMMP

根据最大能量值、最小Shannon熵值和最大能量-Shannon熵比(图4和图5中标注18的三角形标记点)的综合分析,选择bior2.2小波函数对仿真和实测重叠峰数据进行解析。

2.3.2 小波分解层数的确定 小波变换的分解层数N与尺度a的关系为:

(6)

小波变换的窗函数为[17]:

(7)

从式(7)可知,当进行多尺度分析时,频窗宽度变为原始频宽的a倍[18],即:

(8)

由于恒Q性质=带宽/中心频率[19],设fc为小波变换的中心频率,fa为小波在相应尺度上的实际频率,多尺度变换后fc与fa的关系可表示为:

fa=a·fc

(9)

理论上,可将原始谱图信号进行无限层次的分解,但在进行分解的同时,要结合质谱仪的分辨率特性,并考虑实际过程的应用情况,即小波细节部分的分解截止频率fa应与质谱峰的半峰宽w存在如下关系:

(10)

其中,β为分解截止系数。综合式(6)、(9)和(10),谱图信号的分解层数N应满足:

(11)

式(11)中的各参数值为:bior2.2小波中心频率fc=1.008。根据实际经验,β取值一般应不大于3,则N值为:

N≥log23wfc

(12)

不同质谱仪的半峰宽w不同,则小波分解层数也不同,小波分解层次越多,提取的细节部分越多,从而可以获得更加详细的信号高频信息。便携式质谱仪分辨率一般为ΔM<1 u(半峰宽),由此确定小波分解层数N≥ 2。

2.3.3 细节部分的选取 信号经小波变换后,不同分解层次的细节部分反映不同的频率,也反映了原始信号的信息。在实际应用中,当信号峰较窄且峰变化频率较高时,要选择尽可能多的细节部分;当信号峰较宽且峰变化频率较低时,可以有选择地选取细节部分。信号经过N层小波分解后,获得了不同层次、不同尺度的小波系数。在本工作中,由于仿真重叠峰数据峰较窄,所以选择所有的细节部分进行处理,即D(N,n),n=1,2,3,…,2N—1;由于实测的DMMP重叠峰数据峰较宽,选择的数据为细节中的一部分高频,即D(N,n),n=1,3,5,…,2N—1。

2.3.4 放大倍数的选择 信号经过小波变换后的细节部分反映了原始信号高频的成分,通过将细节部分放大,使信号的高频成分频率增大,相应的时域变化也会增大,即信号在时域较宽的峰形变窄,从而达到解析重叠峰的目的。如果放大倍数太大,会导致分离后信号强度严重失真;放大倍数太小,不能达到解析重叠峰的效果。经过实验,选取的放大倍数T在2~10之间,T> 10时,重叠峰解析的效果不会增加,反而导致信号强度失真;T< 2时,达不到重叠峰解析的效果。

3 实验结果

为了评价小波变换解析重叠峰的效果,引入色谱中分离度的概念[20],结合质谱理论,将质谱峰的分离度定义为:

(13)

其中,c1和c2分别为两个谱峰的峰位置;W1和W2分别为两个谱峰10%峰强处的宽度;R为分离度,该值越大,两个谱峰的重叠度越小,该值越小,两个谱峰的重叠度越大。仿真的大峰与大峰重叠数据的分离度为0.437 5,大峰与小峰的分离度为0.625;实测DMMP数据两个峰的峰位和峰宽无法确定,依据质谱仪性能,其分离度应小于0.8。

对于仿真大峰与大峰的重叠峰,采用bior2.2小波,2层小波分解,对所有的细节部分进行放大,放大倍数为8,分离结果示于图6,寻峰后的峰位分别为99.12, 99.87(原始峰位为99,100);对于仿真大峰与小峰的重叠峰,采用bior2.2小波,2层小波分解,对所有的细节部分进行放大,放大倍数为4,分离结果示于图7,寻峰后的峰位分别为102.21,102.84(原始峰位为102, 103)。从图6、图7可以看出,由于仿真重叠峰的峰起始处和结束处较为尖锐,进行小波分离后,在其附近存在旁瓣效应,且峰位有一定的偏差,一部分原因是由解析算法所导致的,另一部分原因是由所采用的最大值寻峰算法所导致的,但不影响特征峰的识别。

图6 大峰与大峰重叠峰分离图Fig.6 The resolution of large-large overlap peak

图7 大峰与小峰重叠峰分离图Fig.7 The resolution of large-small overlap peak

对于实测DMMP重叠峰,采用bior2.2小波,4层小波分解,对细节中的部分高频进行放大,放大倍数为4,分离结果示于图8,寻找到的峰位分别为93.085和93.979,与NIST标准谱库的峰位93和94相比,误差<±0.1;分离后的峰强与原始峰强相比有所增大,峰宽变窄,这都是由小波高频系数放大后进行重构导致的,通过质谱图识别物质主要看峰位和各峰丰度之间的相对比例,而峰的绝对丰度对谱图查询影响不大。分离后的棒图示于图9,两个峰分别为(93.085,32.8)、(93.979,100),与NIST标准谱库中(93,31.4)、(94,100)的比例基本一致。

上述谱峰的分离度列于表1。从表中可以看出,采用小波变换分离重叠峰后,与原始分离度相比,大峰与大峰的分离度提高了128.57%,大峰与小峰的分离度提高了52.0%,实测DMMP数据的分离度至少提高了33.75%。

图8 实测DMMP重叠峰的分离图Fig.8 The resolution of measured DMMP overlap peak

图9 实测DMMP重叠峰分离后棒图Fig.9 The bar graph of resolved DMMP overlap peak表1 重叠谱峰的分离度Table 1 The resolution of overlap spectrometry peak

谱图原始分离度解析后分离度提高幅度/%大峰与大峰043751012857大峰与小峰0625095520实测DMMP<08107>3375

4 结论

本工作研究了基于小波变换的便携式质谱重叠峰解析的理论和方法,采用能量-Shannon熵的标准选择小波函数,利用小波变换的中心频率和质谱仪分辨率的关系确定小波分解层数,合理选取了小波分解后细节部分以及细节部分的放大倍数,并采用该方法对仿真的大峰与大峰重叠数据、大峰与小峰重叠数据以及便携式质谱实测的甲基磷酸二甲酯重叠峰数据进行了处理,获得了较好的谱峰分离效果。结果表明,基于小波变换的重叠峰解析方法能够应用于便携式质谱重叠谱峰的处理,可以提高便携式质谱仪在复杂环境下的现场快速实时检测能力。

[1] KAUPPINEN J K, MOFFATT D J, MANTSH H H. Fourier self-deconvolution:A method for resolving intrinsically overlapped bands[J]. Appl Specrosco, 1981, 35: 271-276.

[2] KAUPPINEN J K, MOFFATT D J, CAMERON D G. Fourier self-deconvolution: A method for resolving intrinsically overlapped bands[J]. Appl Opt, 1981, (35): 271-276.

[3] YANG W J, GROFFTHS P R, BYLER D M. Protein conformation by infrared spectroscopy: Resolution enhancement by Fourier self-deconvolution[J]. Applied Spectroscopy,1985, (39): 282-287.

[4] YANG W J, GROFFTHS P R, BYLER D M. Optimization of parameters for Fourier self-deconvolution[J]. Comput Enhanced Spectrom,1984, (2): 59-74.

[5] HACENE S, LOTFI S, JACQUES D, et al. Time-Domain quantification of amplitude, chemical shift, apparent relaxation time, and phase by wavelet-transform analysis[J]. Journal of Magnetic Resonance, 1997, 124(1): 20-34.

[6] ALSBERG B K. Multiscale cluster analysis[J]. Anal Chem, 1999, 71(15): 3 092-3 100.

[7] 郑小萍,莫金垣,蔡沛祥. 样条小波变换用于分辨重叠伏安峰的研究[J]. 中国科学B辑,1999,29(2):141-147.

ZHENG Xiaoping, MO Jinyuan, CAI Peixiang. Research of spline wavelet used to the resolution of overlapping voltammetric peaks[J]. Science in China(Series B), 1999, 29(2): 141-147(in Chinese).

[8] 邵学广,蔡文生. 化学信息学[M]. 2版. 北京:科学出版社,2005:329.

[9] 王佩佩,宋晓峰,杨平. 利用基于小波特征提取的网络模型解析色谱重叠峰[J]. 计算机与应用化学,2007,24(5):673-677.

WANG Peipei, SONG Xiaofeng, YANG Ping. The application of network model based on wavelet feature extraction in resolution of overlapped chromatographic peaks[J]. Computers and Applied Chemistry, 2007, 24(5): 673-677(in Chinese).

[10]郑建斌,张红权,高鸿. 小波Fourier自去卷积法[J]. 中国科学B辑,2000,30(1):21-27.

ZHENG Jianbin, ZHANG Hongquan, GAO Hong. Wavelet and Fourier self-deconvolution method[J]. Science in China(Series B), 2000, 30(1): 21-27(in Chinese).

[11]刘伟,王勇明,潘忠孝, 等. 小波神经网络用于钼和钨的同时测定[J]. 分析化学,1997,25(10):1 189-1 191.

LIU Wei, WANG Yongmin, PAN Zhongxiao etl. Simultaneous determination of Molybdemum and Tungsten using wavelet neural network[J]. Chinese Journal of Analytical Chemistry, 1997, 25(10): 1 189-1 191(in Chinese).

[12]MADDAMS W F. The scope and limitations of curve fitting[J]. Applied Spectroscopy, 1980, 34(3): 245-266.

[13]VANDEGINSTE B G M. DE GALAN L. Critical evaluation of curve fitting in infrared spectrometry[J]. Anal Chem, 1975, 47(13): 2 124-2 132.

[14]ANDERSON A H, GIBB TC, LITTLEWOOD A B. Computer analysis of unresolved nonGaussian gas chromatograms by curve-fitting[J]. Anal Chem, 1970, 42(4): 434-440.

[15]徐长发,李国宽. 实用小波方法[M]. 3版. 武汉:华中科技大学出版社,2009:47-51.

[16]李翔. 基于小波分析的测量信号处理技术研究[D]. 哈尔滨:哈尔滨工业大学,2009.

[17]MALLAT S, HWANG W L. Singularity detection and processing with wavelets[J]. IEEE Trans Information Theory, 1992, 38(2): 617-643.

[18]MEYER Y. Proceedings of the international conference marseille[C]. France(1989), RMA20. 1992.

[19]胡广书. 现代信号处理教程[M]. 北京:清华大学出版社,2004.

[20]林树昌,曾泳淮. 分析化学(仪器分析部分)[M]. 北京:高等教育出版社,1993:359-365.

Research of Portable Mass Spectrometer Overlapped Peak Resolution Method Based on Wavelet Transform

LI Bao-qiang1, LI Cui-ping1, HUANG Qi-bin1, ZHANG Zhong-yao1, XU Zhi1,ZHANG Lin1, GUO Chun-tao2

(1.StateKeyLaboratoryofNBCProtectionforCivilian,Beijing102205,China;2.BeijingPurkinjeGeneralInstrumentCo.,Ltd,Beijng100081,China)

Aiming to the portable mass spectra existing overlapped peaks that impacted the identification of the analyte, the method of overlapped peak resolution based on wavelet transform was researched. The wavelet function selecting, confirming the wavelet decomposition level, selecting the detail portion of wavelet coefficients and the magnification of the details were studied when this method was used to process the overlapped peaks. It used the simulative overlapped large-large peaks, large-small peaks and the measured DMMP overlapped peaks in the experiment. The results show that using the presented method to distinguish the overlapped peaks, the resolution of large-large peak is improved by 128.57%, the large-small peak is 52.0%, and the measured DMMP data is improved by 33.75% at least, compared with the resolution of original data.

portable mass spectrometer; overlap peak resolve; wavelet transform

2014-04-18;

2014-07-07

国家重点基础研究发展计划(973计划)项目(2011CB706900)资助

李宝强(1986—),男(汉族),河北石家庄人,助理工程师,从事信号处理研究。E-mail: andylee0512012@sina.com

李翠萍(1966—),女(汉族),山西五寨人,高级工程师,从事质谱仪及信号处理研究。E-mail: cuipingli86@126.com

时间:2014-12-02;

http:∥www.cnki.net/kcms/doi/10.7538/zpxb.youxian.2014.0067.html

O657.63

A

1004-2997(2015)03-0199-07

10.7538/zpxb.youxian.2014.0067

猜你喜欢
小峰质谱仪小波
基于多小波变换和奇异值分解的声发射信号降噪方法
构造Daubechies小波的一些注记
龟兔赛跑
中国鱼
基于MATLAB的小波降噪研究
捏捏冻耳朵
酶法制备血红素对湘式腊肠色泽和挥发性风味的影响
基于改进的G-SVS LMS 与冗余提升小波的滚动轴承故障诊断
一种“称量”微小带电粒子的方法
构建模型,解决质谱仪问题