基于GMM的心音信号生物识别方法研究

2013-11-12 07:21钟丽莎万江中黄志伟郭兴明段赟

中国医疗器械杂志 2013年2期

关键词：心音特征参数识别率

钟丽莎，万江中，黄志伟，郭兴明，段赟

1 泸州医学院生物医学工程系，泸州市，646000

2 重庆大学生物工程学院，重庆市，400044

3 第四军医大学唐都医院，西安市，710000

0 引言

随着社会的发展，安全问题日趋重要。用人类生物特征并结合计算机技术进行安全验证的生物特征识别技术已成为当今的热门课题。近年来，生物识别技术得到国内外研究学者的探索和认可，出现了各种各样的生物识别技术并逐步推广应用，如声纹识别、指纹识别、DNA识别、虹膜识别、人脸识别等[1]。目前尽管这些识别技术已经应用到许多领域，但都存在着一个共同的问题，很容易被伪造和复制，不能够达到较高的安全性。

人体的一些重要生理信号具有唯一性，代表了个体独一无二的特性，其最大的优点是很难被伪造或者复制，因此作为身份识别的特征信号具有更高的安全性。目前已经出现将诱发脑电信号和心电信号用于身份识别的研究，并取得了较好的成果[2-4]。然而脑电和心电的采集需要放置较多的电极，尤其是脑电，对采集条件要求较高，一般很难准确采集。心音信号只需要一个心音传感器便可采集，相对心电和脑电等生理信号应用于身份识别来说，硬件实现容易，操作简单易行。国内外也有利用心音信号进行身份识别的研究。Francesco等[5-6]对心音主要成分第一心音（S1）和第二心音（S2）进行频谱分析，证明心音信号可以表征独一无二的生理特性，初步探索心音信号生物识别，但该方法只适用小样本的情况，不能满足实际应用的要求。Koksoon等[7]提取心音信号的线性频带倒谱系数，实现了心音信号的身份识别。但实验样本量较少，仅采用10个人的心音信号，并且在预处理中仅使用带通滤波器对心音信号进行滤波处理，影响了识别的效果。

本文针对以上研究的不足，利用近年来广泛用于模式识别领域的高斯混合模型对心音信号进行建模和识别，采集50名受试者的心音信号进行测试，实验结果表明该算法能有效提高心音生物识别系统的识别性能。

1 心音信号的预处理

在进行实验前需要对心音信号进行预处理，图1所示为预处理结构图。

图1 预处理结构图Fig.1 Pretreatment structure diagram

1.1 预加重

在实际信号分析中常采用预加重技术，即在对信号取样之后，插入一个一阶的高通滤波器，以滤除低频干扰，突出更为有用的高频部分的频谱。本实验将心音信号通过数字滤波器，其系统函数为H(z)=1-az-1，其中a为预加重因子，典型值范围是0.94～0.97。

1.2 小波去噪

心音信号是利用仪器通过体表采集到的生理信号，不可避免地引入噪声，包括环境噪声、工频干扰噪声、仪器工作自身的噪声等。为了更好地避免噪声信号对实验的影响，在提取心音信号的特征参数前首先对信号进行去噪[8]。

心音信号是短时非平稳信号，有用成分在低频段约200 Hz以内，而噪声信号则通常表现为高频信号。因此，可以利用小波变换把心音信号的能量集中到较低频段的频带上，再将较高频段的小波系数置零，便能有效抑制噪声。具体步骤是先对原始信号进行小波分解：

其中S是原始信号，cAi为分解的低频成分，cDi为分解的高频成分，i是分解层数。噪声通常在高频成分cDi中，通过设置门限阈值对小波系数处理，重构信号后便可实现去噪的目的[9]。

小波去噪的关键是选择合适的小波基和阈值。本文通过反复实验，选取了对心音信号去噪效果较好的coif3小波和heursure阈值方法。

1.3 分帧和加窗

心音信号是一种短时非平稳信号，要对其进行短时分析，需要对信号进行分帧处理，本文取帧长20 ms，帧移10 ms，在这段时间内可以认为心音信号是平稳的，非时变的。分帧使用滑动的窗口进行加权来实现的。实验中使用的是哈明窗（hamming）。

1.4 端点检测

为了在复杂环境下的信号流中提取心音信号，定位其主要成分第一心音（S1）和第二心音（S2）的起止位置，进行信号端点检测。端点检测的精确性直接关系到特征参数提取的有效性，将影响整个识别系统的鲁棒性，同时还可以减少后面识别处理的数据量，降低系统运行时间。本文采用两级判断法VUS（Voice Unvoice Silence）算法进行端点检测，该算法实现简单，运算量小。

通过小波去噪的方法和端点检测可以只提取心音中的有用信号部分，这样虽然无法保证得到的特征参数长度一致，但却大大降低了运算量，节省了训练时间，并提高了识别率。

2 特征参数提取

特征参数提取是本文提出的识别系统中的一个重要模块。心音信号中含有个体的丰富信息，特征提取就是对心音信号进行分析处理，获取影响识别效果的重要信息。通过提取每帧信号的特征参数，利用GMM模型进行训练和识别。本文采用了常用LPCC和MFCC作为识别的特征参数，对比实验表明，LPCC能比MFCC更好地提高系统的识别率。

2.1 线性预测倒谱系数（Prediction Cepstral Coefficients,LPCC）

倒谱是信号Z变换的对数模函数的反Z变换，一般通过信号的傅里叶变换取模的对数，再求反傅里叶变换得到。本文LPCC参数是通过全极点模型对线性预测系数（LPC）递推所得到的[10]。LPCC求解的递推公式如下：

式中，a1,a2,...ap为p阶LPC的特征向量。c1,c2,...cp为倒谱系数的前p个值。LPCC的阶数不超过p，用第②式计算；如果LPCC阶数大于p，则用第③式计算。LPCC系数的提取过程如图2所示。

图2 LPCC的提取过程Fig.2 The extraction process of LPCC

2.2 Mel频率倒谱系数(hidden Markov model,MFCC)

MFCC是目前广泛应用于语音相关识别中的特征参数，它利用了人耳听觉频率非线性特性，在噪声环境中具有其它特征参数无可比拟的优势。MFCC与线性频率的转换关系如下：

MFCC按帧进行计算，其提取过程如图3所示。

图3 MFCC的提取过程Fig.3 The extraction process of MFCC

3 高斯混合模型

高斯混合模型（Gaussian Mixture Model，GMM）是近年来生物识别采用的主流的技术，它是单一高斯概率密度函数的延伸[11]，由于GMM能够平滑地近似任意形状的密度分布，因此在语音识别中得到广泛的应用。

基于高斯混合模型的心音识别系统的基本原理就是对每一个受试者的心音建立一个概率模型（高斯混合模型），该概率模型中的参数是由心音信号的特征参数分布决定的，表征了受试者的身份。识别时，将待识别心音信号的特征参数与训练的模板进行匹配，计算得到的最大似然函数值对应的就是识别结果。基于心音信号的生物识别系统流程图如图4所示。

图4 基于心音的生物识别系统流程图Fig.4 System flowchart based on heart sounds biometric

3.1 GMM的训练算法

G M M 参数的训练采用最大似然估计(Expectation maximization,EM)算法。设心音信号的训练特征矢量序列为X={xt,t=1,2,...,T}，它对于模型λ的似然度为：

训练的目的就是找到一组使P(X|λ)最大的参数λ：

P(X|λ)最大参数估计可以利用EM算法迭代计算得到。EM算法的基本思想是从初始模型参数λ来训练估计出新的参数满足如下条件：

再以新的模型参数作为当前参数来训练，以此迭代运算直至模型收敛。

3.2 GMM的识别算法

在本文设计的识别系统中，设有S个识别对象，每个识别对象用一个GMM模型来代表，分别为λk，k=1,2…S。在对其进行身份识别时，目的就是对一个观测序列X，找到使之有最大后验概率的模型所对应的受试者λk，即：

假定Pγ(λk)=1/S，每个受试者等概率，P(X)对每个受试者而言是相同的，因此，上式可以简化为：

如果使用对数得分，且按式（5）假定，心音身份识别的任务就是计算下式：

4 仿真实验及结果分析

心音信号采集的仪器是由重庆博精医学信息研究所生产的“运动心力监测仪”。该仪器的采样频率是11025 Hz，所采集的信号以wav文件的格式保存。心音信号采集时注意，心音脉搏传感器必须放置在心前区心尖搏动最明显处。实验受试者为50个健康人，无任何心血管疾病。在记录受试者心音图时，要求受试者处于静息状态。每位受试者均采集两段心音信号，共100个心音信号，且两次采集的时间间隔大于24 h。

4.1 心音信号预处理

本文采用双门限端点检测算法，在开始端点检测前，先要分别为短时能量和过零率确定两个门限。如果信号的能量或过零率超过了低门限，就开始标记起始点，进入过渡段。在过渡段中，由于心音信号的参数数值比较小，不能确定是否进入了有用信号段，只要两个参数的数值都回落到低门限以下，就将当前状态认为是无用信号段，而如果在过渡段中两个参数中的任一个超过了高门限，就可以确信进入了有用信号段。检测结果如图5所示。

图5 心音信号的端点检测结果Fig.5 Heart sound signal endpoint detection results

4.2 小波去噪对识别结果的影响

本文选择coif3小波对心音信号进行5层小波分解和重构，实验结果表明能够去除噪声分量，有效地保留了信号的有用成分，对比结果如图6所示。

图6 小波去噪前后的信号对比Fig.6 The signal contrast before and after wavelet denoising

从图6可以看出，小波去噪除去心音信号中很多干扰和噪声等无用的成分，保留信号的有用成分。提取去噪后的心音信号的特征参数，能够更好地保留表征个体的身份特征有用信息。GMM模型进行样本训练时采用EM算法，最大迭代次数设置为40次，训练时间大约(3～4) min。然后进行样本识别，GMM模型识别时间在(0.3～0.5) s。心音信号小波去噪前后系统识别性能对比如表1所示：

表1 小波去噪前后的识别性能对比Tab.1 Identify performance comparison before and after wavelet denoising

从表1可以看出经过小波去噪，系统识别率明显的提高从76.5%提高到89.0%，并大大缩短了训练时间。

4.3 特征参数对识别结果的影响

GMM模型进行心音身份识别时，选择LPCC和MFCC两种特征参数进行对比实验。这两种特征参数对于GMM模型识别率和训练时间影响的结果对比如表2所示。

表2 LPCC和MFCC对模型识别性能的影响Tab.2 LPCC and MFCC impact on model identification

通过对比实验发现，对于心音信号来说，选用LPCC参数可以得到比MFCC参数更高的识别率，而且训练时间更短些，更能满足一些场合对实时性的要求。

5 结论

本文采用GMM的方法实现了基于心音信号的身份识别，并通过实验验证了该方法的有效性。实验主要分为以下两部分：通过在预处理中加入小波去噪提高心音信号的信噪比，显著提高了系统的识别率。通过对比LPCC和MFCC两种特征参数，发现LPCC更适合用于基于心音信号的生物识别中，不仅取得了更高的识别率，训练和识别的时间也比较短，在一些实时性要求较高的场合可以得到更广泛的使用。本文研究尚处于初步阶段，鉴于异常心音和心脏杂音出现的病理信号的复杂性，只进行了将正常的心音信号应用于身份识别，下一步将探索异常心音信号的识别，进一步完善该系统。

[1]Jain A K,Ross A,Prabhakar S.An introduction to biometric recognition[J].IEEE Trans Circuits Syst Video Technol,2004,14(1):4-20.

[2]Saechia S,Koseeyaporn J,Wardkein P.Human identification system based ECG signal[C].TENCON 2005:1-4.

[3] Israel SA,Irvine JM,Cheng A,et al.ECG to identify individuals [J].Pattern Recogn,2005,38(1):133-142.

[4] Das K,Zhang Sheng,Giesbrecht B,et al.Using rapid visually evoked EEG activity for person identificatioin[J].EMBS 2009(13):2490-2493.

[5] Beritelli F,Serrano S.Biometric identification based on frequency analysis of cardiac sounds[J].IEEE T Inf Foren Sec,2007,2(3):596-604.

[6] Beritelli F,Spadaccini A.Human identity verification based on Mel frequency analysis of digital heart sounds[C].DSP 2009:765-769.

[7]Phua K,Chen JF,Dat TH,et al.Heart sound as a biometric[J].Pattern Recogn,2008,4(3):906-919.

[8] 郭兴明,吴玉春,肖守中.自适应提升小波变换在心音信号预处理中的应用[J].仪器仪表学报,2009,30(4):802-806.

[9] 薛年喜.MATLAB在数字信号处理中的应用[M].北京:清华大学出版社,2008.

[10]Biswas S,Ahmad S.Speaker identification using cepstral based features and Discrete Hidden Markov ModelC].IETICT,2007:303-306.

[11]Liu Minghui,Xie Yanlu,Yao Zhiqiang,et al.A new hybrid GMM/SVM for speaker verification[C].ICPR,2006.

[12]Thomas F Quatieri .离散时间语音信号处理——原理与应用[M].赵胜辉,刘家康,谢湘[译].北京:电子工业出版社,2004.