多声源定位的关联模糊消除方法研究

2023-06-30 12:22刘海涛陈永华周家盛程贤福肖乾
振动工程学报 2023年1期

刘海涛 陈永华 周家盛 程贤福 肖乾

摘要 基于到达时差(Time Difference of Arrival, TDOA)的多声源定位中,由于麦克风阵列对测量的TDOA值无法与目标声源进行关联,声源定位过程会产生关联模糊,从而影响多声源定位结果的精度。针对这一问题,提出基于阵列重构的多声源关联模糊消除方法。通过广义互相关(Generialized Cross?Correlation, GCC)算法估计麦克风阵列的TDOA值,再利用排序算法获得定位麦克风阵列所有可能的TDOAs序列,并基于Chan算法估计所有可能的声源。通过轮换定位麦克风阵列的参考麦克风,构造多组校验子阵列,利用真实声源与阵列麦克风的相对位置关系来滤除虚假声源。对于不同校验子阵列筛选出的所有声源位置,以出现频数最大化原则再次进行冗余校验,从而提升最终筛选真实声源的准确性。仿真及实验结果表明,该方法能够以最少数量常规麦克风有效消除多声源定位中的虚假声源。在同等麦克风数量的情况下,该方法的定位精度及定位鲁棒性高于对比方法。

关键词 多声源定位; 到达时差(TDOA); 关联模糊; 互相关算法; Chan算法

引 言

声源定位在人机交互、噪声源识别和应急响应等领域得到广泛的应用。到达时差(TDOA)[1?4]是一种经典的声源定位方法,其数学模型实质是一组非线性多元方程组,通过求解非线性多元方程组来确定目标声源位置。非线性方程组的求解方法主要有迭代方法[5?6]和闭式方法[7?8],迭代的方法需要设定初始值,而闭式求解不需要设定初始值且计算效率高。闭式求解方法在传感器误差较小的情况下,能实现克拉美罗下界(CRLB)[8]。

近些年来,多声源定位引起较多研究者的关注,Wu等[9]采用TDOA方法进行了两个声源的定位。Yang等[10]提出一种基于TDOA的多声源定位算法,该算法是将单声源定位方法直接扩展来实现多声源定位,然而,在实际场景中往往不成立。对于多声源定位,TDOA序列可通过观察两路信号的互相关函数获得,TDOA的行向量元素是根据互功率谱中峰值的幅值递减依次排列。实际定位场景中确定TDOA的估计值与相应声源之间的唯一映射十分困难,会出现时差错序[11],即TDOA方法对多声源定位会产生关联模糊[12]问题。

目前,有研究人员提出了一些消除关联模糊的方法。Simon等[13]利用测量信号值和麦克风位置构造一致性函数,通过快速搜索算法可以找到该函数的最大值,函数最大值对应的位置为估计目标位置,但该方法计算效率低,且没有直接处理关联模糊问题,导致位置估计不准确。Stotts等[14]基于结构分析对多声源定位,在定位区域上构建搜索网格,利用射线模型获得到达时间(TOA),以实际到达时间与假设模型到达时间误差的最小值来确定声源位置,该方法的计算时间随着监测区域的增大而增加,定位精度在很大程度上取决于网格大小。Shen等[15]基于凸优化方法来消除多声源定位关联模糊问题,该方法的本质是同种声源中对应到达时间(TOA)向量的每列测量值相同或者近似相同。Venkateswaran等[16]采用并行和分层的方法来解决多声源关联模糊问题,但此种多声源定位方法的精度会受到传播距离的影响,且计算效率较低。以上消除关联模糊定位方法都存在定位精度不高和计算效率低等问题。但佳壁[17]提出利用冗余TDOA信息消除定位模糊,即将阵列分成两个子集合:第一个集合选取5个传声器估计TDOA,并用于定位计算;而另外一个集合中的麦克风阵列用于TDOA的排序和校验。此方法利用真实声源与阵列麦克风的相对位置关系来对虚假声源进行滤除,并对筛选的结果进行聚类处理,获得真实声源位置,可以较好地消除关联模糊,但是在定位精度、鲁棒性方面还有改进空间。

本文提出基于阵列重构的多声源关联模糊消除方法。通过轮换定位麦克风阵列的参考麦克风,构造了多组校验子阵列。基于定位麦克风阵列TDOA矩阵及任一校验子阵列TDOA矩阵构造可信度评价函数,利用可信度评价函数最小化原则筛选出声源位置,对于不同校验子阵列筛选的所有声源位置,以出现频数最大化原则筛选出最后的声源。本文方法最大化利用麦克风数量,并利用冗余校验筛选真实声源,使筛选结果更加稳定。

1 多声源定位模型

首先构建多声源定位模型。定位模型中,Nm个麦克风分布于三维空间区域,并由列向量mj=[xjm,yjm,zjm]T, j∈[1,Nm]表示其坐标位置。待定位声源共Ns个,坐标位置由si=[xi,yi,zi]T,i∈[1,Ns]表示。多声源定位场景如图1所示。

不同的声源到各个麦克风的距离差向量为:

式中 c为声速;τ(i)j1为第i个声源到mj和m1两个麦克风的到达时差;ri为第i个声源到任意两个麦克风的距离差;r0i为第i个声源到任意两个麦克风的真实距离差; r0i,Nm1=r0i,Nm?r0i,1;ni是一个具有协方差矩阵的零均值高斯随机噪声向量。

声源到麦克风阵列的TDOA主要通过广义互相关(GCC)[18]算法获得。TDOA定位测量过程中受到的噪聲干扰通常可由高斯白噪声模型描述。本文中为方便检验定位算法,在仿真过程中通过距离差与声速的比值来获取TDOA序列,同时采用零均值高斯噪声来模拟实际测量中产生的各类随机噪声。

空间声源定位模型由一组非线性多元方程组成,通常是将其转化为线性多元方程组来求解。对式r0i,Nm1=r0i,Nm?r0i,1的两边进行平方处理,得到:

式中 Kj=x2jm+y2jm+z2jm,  K1=x21m+y21m+z21m, xj1=xjm?x1m,  yj1=yjm?y1m,  zj1=zjm?z1m,j∈[1,Nm]。

式(4)可写成矩阵形式:

Chan等[7]提出了一种精度合理的、有效的求解算法,该算法使用两次加权最小二乘法给出较准确的声源位置。因此,本文采用文献[7]的方法求解来获取声源位置。由式(1)每一行选择一个元素获得的时差矩阵用T?P来表示:

式中 NP=NsNm?1。

基于文献[7]的算法求解出的所有声源位置用集合SP来表示:

式中 sP表示声源坐标;SP表示所有声源坐标的集合,包括真实声源和虚假声源。

2 多声源关联模糊消除方法

本文提出的多声源定位关联模糊消除方法具体实施可分解为如下三个步骤:

步骤一:基于GCC?PHAT算法估计TDOAs和声源数量,获得消除关联模糊过程中需要的声源数量先验知识。

步骤二:基于阵列重构,构建不同的校验子阵列。不同麦克风阵列定位的真实声源的估计位置存在特定的信赖域,而虚假声源的估计位置是不确定的,此原理可用来滤除虚假声源。

步骤三:将不同校验子阵列各自所获得的定位结果以频数最大化作为筛选原则,获得最终的真实声源定位结果。

2.1 基于GCC?PHAT算法估计TDOAs和声源数量

理想情况下,可以通过检测两个混合信号的互相关函数来获得声源的TDOA。然而,GCC方法容易受到混响和背景噪声的干扰,从而影响TDOA估计的准确性。在實际应用中提出了多种GCC估计方法,其中GCC?PHAT算法[18]经过归一化处理,可从两个混合声信号中估计声源个数和TDOA值。GCC的一般表达式如下:

式中 Xi(ω)X*j(ω)为混合声信号xi(t)和xj(t)的交叉功率谱密度;Ψi,j(ω)为加权函数;F?1[?]表示傅里叶逆变换。

对于GCC?PHAT算法,加权函数Ψi,j(ω)的表达式如下:

式(9)结果中的显著峰值代表声源,从而可以估计声源的数量,即峰值的数量等于声源的数量。有效峰值对应的横坐标是TDOA的估计值,表达式如下:

2.2 基于阵列重构和冗余校验消除关联模糊

为了消除多声源定位中产生的虚假声源,通过轮换定位麦克风阵列的参考麦克风来构造多组校验子阵列。根据声源与阵列麦克风的空间位置关系,可以计算出所有可能声源SP到校验子阵列的TDOA序列,同时校验子阵列采集的声信号经过GCC?PHAT和时差错序处理,可以获得校验子阵列关联真实声源的另一组TDOA序列。基于此两组TDOA序列,构造关于校验子阵列的可信度评价函数,同时根据可信度评价函数最小化的原则确定真实声源。图2为定位麦克风阵列和多组校验子阵列的结构示意图。

选取阵列2为校验子阵列,使用GCC?PHAT算法估计出的目标声源到阵列2的TDOAs由矩阵T?C表示:

从矩阵T?C的每一行中选择一个元素,可以得到一个新的矩阵T?C,如下式所示:

式中 向量?的前Ns个最小的元素包含真实声源信息。通过按从小到大排序,选择前Ns个元素,索引计算这些元素相对应T? C矩阵的列数作为下标号放入集合U2rs中,阵列2在集合SP中获得的真实声源位置为S2rs。

式中 S2rs为基于阵列2的真实声源集合;U2rs为基于阵列2所筛选的真实声源相关的下标数字。

在信噪比较低的定位场景,仅选择一个校验子阵列筛选出的真实声源会有很高的出错率。为了使消除虚假声源的过程更加稳定,可以使用其他校验子阵列重复上述过程来筛选真实声源。所有校验子阵列可以得出一个真实声源集合Snrs:

式中 Snrs是校验子阵列n所对应的真实声源集合;Unrs是基于校验子阵列n所筛选出的真实声源相关的下标数字。

对集合Snrs,可以将所有声源出现的频数作为筛选原则,按声源位置出现频数由大到小排列,选择前Ns个频数对应的声源位置即为最终真实声源。通过对多个校验子阵列的可信度评估,可以显著提高虚假声源滤除的稳定性。

3 仿真分析

分析本文方法在三种定位场景的有效性,同时,将本文方法与文献[17]方法在不同信噪比下的定位精度、定位鲁棒性进行对比分析。

3.1 阵列结构和定位场景

文献[7]算法求解三维空间分布的声源,定位过程至少要用5个麦克风。在文献[17]校验子阵列中至少需要4个麦克风,可共用一个参考麦克风,则至少需要8个麦克风,而本文方法针对三维空间分布的声源至少需要5个麦克风。仿真过程中麦克风位置如表1所示。表2给出了三种定位场景,其中包括声源数、空间位置及其频率信息。

3.2 本文方法有效性分析

构造不同频带的声源信号,使得本文提出的方法具有频率适用性。声源定位过程噪声干扰的来源有许多,而GCC估计误差为影响因素之一。仿真实验中,设置采样频率fs=80000 Hz,麦克风阵列的最大间距为0.5 m。图3为Nm=5,对场景3利用GCC?PHAT算法估计定位麦克风阵列的TDOAs。同时基于GCC?PHAT算法估计校验子阵列的TDOAs,再利用本文方法获得定位结果如图4所示,其中图4(a),(c),(e)为所有可能的声源位置;图4(b),(d),(f)为本文方法估计的真实声源结果。

将m1作为参考麦克风,其他麦克风mj,j=2~5与m1可以组成麦克风对,每个麦克风对(mj,m1)可以估计出4个TDOA值,如图3所示。每个麦克风对估计的TDOA值的个数与场景3的声源数量相等。从图4中可以看出,本文方法仅用最少麦克风数即可消除虚假声源,估计出的声源定位效果良好,误差合理。

3.3 定位精度对比

将本文方法与对比方法在不同信噪比(SNR)下的定位精度对比分析。多声源定位精度评价函数表达式如下:

式中 ea为均方误差;si为目标声源位置;s?i为估计的真实声源位置;Ns为声源数。

为了消除随机噪声对单次定位结果的影响,仿真过程采用蒙特卡罗循环处理。经蒙特卡罗过程可以表示为:

式中 MLE为经蒙特卡罗处理后的多声源定位误差;q为仿真实验过程中蒙特卡罗次数,仿真过程令q=1000。

定位精度可用MLE来表示,MLE越小,定位精度越高。将本文方法与文献[17]提出的方法在不同信噪比进行定位精度对比。文献[17]中提出的方法是通过循环定位麦克风阵列的参考麦克风,构成多种定位子阵列,将最后的定位结果进行聚类处理,通过增加计算量来提升定位精度。不同信噪比下的多声源定位误差对比结果如图5所示。

由图5可以看出,在三种定位场景下,随着信噪比的增加,不同定位方法的定位精度将逐渐提升。在高信噪比条件下,如SNR>0时,不同定位方法的定位精度均处于同一水平。当SNR<0时,在同等麦克风数量的情况下,本文方法相比对比方法的定位精度有所提升;一共用5个麦克风数量的本文方法的定位精度比一共用8个麦克风数量的对比方法稍差些。在信噪比较低情况下,如SNR<0时,关联过程可能会出错,筛选出的所有真实声源中可能存在虚假声源。对比方法通过聚类来获得最终的声源,这些可能的虚假声源将会影响聚类结果。而本文方法引入频数筛选,通过冗余校验可有效减少出错率。另外,本文方法充分利用定位麦克风数,定位麦克风数相比对比方法更多,通过增加定位麦克风数量来提升定位精度。

3.4 定位魯棒性对比

定位鲁棒性的评价函数表达式如下:

式中 er表示仅运行一次的多声源定位鲁性;RM表示经蒙特卡罗循环后的多声源定位鲁棒性;仿真过程令q=1000。

RM越小,定位鲁棒性越好。将本文方法与对比方法在不同信噪比下进行定位鲁棒性对比,三种定位场景对比结果如图6所示。

从图6中可以看出,定位鲁棒性与定位精度的变化总体趋势大体相同,定位鲁棒性也随着SNR的增加而增加。在低信噪比和较多声源数量的定位场景中,某一信噪比区间段的定位鲁棒性存在幅度较小的上下波动,如场景3中?10 dB5 dB时,在不同的定位场景下,本文方法与对比方法定位鲁棒性处在同一水平。当SNR<5 dB时,本文方法仅用最少数量的麦克风获得定位鲁棒性比对比方法稍差些,原因是对比方法通过增加计算量来提升定位鲁棒性;而在同等麦克风数的情况下,本文方法的定位鲁棒性明显高于对比方法。

4 实验分析

为了验证本文提出的多声源定位方法,在空旷的运动场上搭建实验测试系统对算法进行验证。实验与仿真的麦克风位置及声源位置不变,阵列间距不变,采样频率改为fs=100 kHz。实验场景如图7所示。对三种定位场景,利用最少数量常规麦克风验证本文方法的定位效果,另外在设置同样的麦克风数的情况下,对本文方法与对比方法进行定位精度和鲁棒性对比。图8是在Nm=5的情况下,对每个通道经傅里叶变换获得的频谱图。图9是在同等麦克风数下,本文方法与文献[17]方法在三种定位场景下的实验定位精度和定位鲁棒性的对比结果。

由图8可以看出,测试采集的声信号主频带在300~1650 Hz之间,与仿真过程构造的声信号频带相同。然而,声信号中也出现了一些其他频率成分,说明测试环境存在背景噪声。从图9中可以看出,在同等麦克风数的情况下,本文方法的定位精度比对比方法性能更好,实验与仿真结论一致。从评估定位鲁棒性的RM值大小可以发现,当声源数量较少时,本文方法定位鲁棒性与对比方法接近,如场景1;当增加声源的数量,本文方法的定位精度和定位鲁棒性相比对比方法性能更好,如场景2和3。从实验结果中可以看出,本文提出的多声源定位方法比对比方法具有更好的定位精度和定位鲁棒性,且在声源数量增多时表现更为显著。

5 结 论

针对基于TDOA多声源定位中存在的关联模糊问题,本文提出基于阵列重构的多声源关联模糊消除方法。通过构造多组校验子阵列,利用声源与阵列麦克风之间的空间位置关系来消除虚假声源,同时利用冗余校验来提升筛选真实声源过程的稳定性。通过仿真及实验获得以下结论:

(1)本文方法以最少数量的常规麦克风消除多声源定位的关联模糊,获得真实声源位置;

(2)在同等麦克风情况下,本文方法比对比方法的定位精度和定位鲁棒性均有所提升;

(3)在低信噪比和较多声源数量的定位场景下,本文方法的定位精度和定位鲁棒性的性能优势更明显。

参考文献

1Zhu N, Wu S F. Sound source localization in three-dimensional space in real time with redundancy checks[J]. Journal of Computational Acoustics, 2012, 20(1): 1250007.

2Wang Y, Ho K C. TDOA positioning irrespective of source range[J]. IEEE Transactions on Signal Processing, 2017, 65(6): 1447-1460.

3Yin J H, Wan Q, Yang S W, et al. A simple and accurate TDOA-AOA localization method using two stations[J]. IEEE Signal Processing Letters, 2016, 23(1):144-148.

4Ho K C. Bias reduction for an explicit solution of source localization using TDOA[J]. IEEE Transactions on Signal Processing, 2012, 60(5): 2101-2114.

5Torrieri D J. Statistical theory of passive location systems[J]. IEEE Transactions on Aerospace & Electronic Systems, 1984, 20(2): 183?198.

6Carevic D. Automatic estimation of multiple target positions and velocities using passive TDOA measurements of transients[J].IEEE Transactions on Signal Processing, 2007, 55(2): 424-436.

7Chan Y T, Ho K C. A simple and efficient estimator for hyperbolic location[J]. IEEE Transactions on Signal Processing, 1994, 42(8): 1905-1915.

8Ho K C, Lu X N, Kovavisaruch L. Source localization using TDOA and FDOA measurements in the presence of receiver location errors: analysis and solution[J]. IEEE Transactions on Signal Processing, 2007, 55(2): 684-696.

9Wu S F, Zhu N. Locating arbitrarily time-dependent sound sources in three dimensional space in real time[J]. The Journal of the Acoustical Society of America, 2010, 128(2): 728-739.

10Yang L, Ho K C. An approximately efficient TDOA localization algorithm in closed-form for locating multiple disjoint sources with erroneous sensor positions[J]. IEEE Transactions on Signal Processing, 2009, 57(12): 4598-4615.

11Mazur R, Mertins A. An approach for solving the permutation problem of convolutive blind source separation based on statistical signal models[J]. IEEE Transactions on Audio, Speech and Language Processing, 2009, 17(1): 117-126.

12Ma W K, Vo B N, Singh S S, et al. Tracking an unknown time-varying number of speakers using TDOA measurements: a random finite set approach[J]. IEEE Transactions on Signal Processing, 2006, 54(9): 3291-3304.

13Simon G, Maróti M, Lédeczi ?, et al. Sensor network-based countersniper system[A].Proceedings of the 2nd International Conference of Embedded Networked Sensor System[C]. Baltimore, USA, 2004: 1?12.

14Stotts S A, Martin J L. Multiple-source localization using GPS technology and received arrival time structure analysis in an air-deployed system[J]. IEEE Journal of Oceanic Engineering, 1997, 22(3): 576-582.

15Shen H, Ding Z, Dasgupta S, et al. Multiple source localization in wireless sensor networks based on time of arrival measurement[J]. IEEE Transactions on Signal Processing, 2014, 62(8): 1938-1949.

16Venkateswaran S, Madhow U. Localizing multiple events using times of arrival: a parallelized, hierarchical approach to the association problem[J]. IEEE Transactions on Signal Processing, 2012, 60(10): 5464-5477.

17但佳壁. 汽车排气外声场可视化方法研究[D]. 北京:清华大学,2017.

DAN Jiabi. Visualization techniques on exterior acoustic field of vehicle tailpipe[D]. Beijing: Tsinghua University, 2017.

18Knapp C, Carter G. The generalized correlation method for estimation of time delay[J]. IEEE Transactions on Acoustics, Speech and Signal Processing, 1976, 24(4): 320-327.

Method of association ambiguity elimination for multi-source localization

LIU Hai-tao 1,2 ?CHEN Yong-hua 1,3ZHOU Jia-sheng 1CHENG Xian-fu 1XIAO Qian 1

1. School of Mechanotronics and Vehicle Engineering, East China Jiaotong University, Nanchang 330013, China;

2. Tsinghua University Suzhou Automotive Research Institute, Suzhou 215131, China;

3. School of Civil Engineering and Transportation, South China University of Technology, Guangzhou 510640, China

Abstract For the multi-source localization based on TDOA, because the measured TDOA values from the microphone array cannot associate with the target sources, the process of source localization will produce association ambiguity, thus affecting the accuracy of multi-source localization results. The GCC algorithm is used to estimate TDOA values of microphone array. Then all possible TDOAs sequences of microphone array are obtained by permutation algorithm, and all possible sound sources can be estimated based on Chan algorithm. A group of check sub-arrays is constructed by switching the reference microphone in the array, and the phantom sound sources are filtered out by the relative position relationship between the true sound sources and the array microphones. For all sound source locations screened by different check sub-arrays, redundancy check is carried out again according to the principle of maximum occurrence frequency, so as to improve the accuracy of the final real sound sources. The simulation and experiment results show that the proposed method can effectively eliminate the phantom sound sources in multi-sources localization by using the least number of conventional microphones. The localization accuracy and localization robustness of the proposed method are higher than that of the comparison method with the same number of array microphones.

Keywords multi-source location; time difference of arrival (TDOA); association ambiguity; GCC algorithm; Chan algorithm