双频-时频信道联合指纹优化室内定位方法

2022-05-13 03:01袁杨鹏郭贤生何袁虎
信号处理 2022年4期
关键词:幅度频段指纹

袁杨鹏 郭贤生 何袁虎 李 林 黄 健

(1.电子科技大学长三角研究院(衢州),浙江衢州 324000;2.电子科技大学信息与通信工程学院,四川成都 611731)

1 引言

随着物联网的高速发展,基于位置的服务(Location Based Service,LBS)已经成为人们日常生活中不可或缺的部分[1]。尽管全球导航卫星系统(Global Navigation Satellite System,GNSS)已经被广泛应用于室外定位,但室内复杂的环境阻碍了卫星信号和设备的连接,导致GNSS 无法满足室内定位的需求。近年来,可见光[2]、WiFi[3-4]和UWB[5]等被广泛应用于室内定位研究中。

在众多室内定位技术中,WiFi定位技术因室内环境中普遍存在基础路由和终端设备的优点而具有很好的应用前景。基于WiFi 的室内定位技术常使用指纹定位方法,传统的指纹定位方法使用接收信号强度(Received Signal Strength,RSS)作为一个位置的指纹,只能提供粗粒度的功率信息,无法精确刻画信道的传播环境,从而限制了指纹定位的精度。Halperin 等人[6]推出的CSI Tool 首次从商业网卡中提取出了更加细粒度的物理层的信道状态信息(Channel State Information,CSI)。相比于RSS,CSI 更细粒度地刻画了无线信号在空间传播中经历的反射、散射、衰落和路径损耗等信息,对传播环境的解译更加全面[7]。

近年来,由于CSI 为更高精度的指纹定位提供了可能,正成为定位领域的研究热点。Xiao 等人[8]提出了FIFS 系统,首次实现了基于CSI 的指纹定位系统。该系统利用信道响应的空间和频率多样性进行指纹定位。此外,FIFS 使用所有独立子载波的功率和作为指纹,然后利用一个概率模型进行位置估计,得到了比使用RSS作为指纹的Horus[9]系统更高定位精度。Song 等人[10]利用CSI 数据构造CSI 幅度指纹,然后通过多维尺度分析方法计算目标点和参考点之间的欧氏距离和时间反转强度,最后使用K 邻近算法估计位置。Chen 等人[11]提出了EntLoc系统,通过计算CSI幅度信息的自回归熵作为指纹,然后利用概率模型进行最终位置估计。David 等人[12]提出了CSI 和RSS 融合的定位算法,得到了比只使用单个指纹更好的定位结果。Dang 等人[13]提出一个无设备的被动定位方式。在离线阶段,算法通过计算相位差来校正通信链路中的随机时间和相移。然后,他们采用PCA 方法降低数据的维度,以产生一个稳健的指纹数据库。最后,利用反向传播神经网络建立采样信号与物理位置的对应关系。在在线阶段,利用反向传播神经网络对实时测量的CSI 值进行分类。Chapre 等人[14]提出了CSI-MIMO系统,首先聚集整个MIMO 每个子载波的CSI 值,然后对相邻子载波的幅度和相位做差分提取指纹信息,对比验证了确定型算法和概率型算法在动态和静态两种环境下定位效果。Wang 等人[15]提出了DeepFi 系统,一个基于CSI 的深度学习指纹定位系统。DeepFi 提出了一种基于概率的受限玻尔兹曼机模型进行网络训练和位置估计。Wang 等人[16]还提出了BiLoc系统,利用消除相位误差后的CSI数据构造平均CSI 幅度指纹和信号到达角度,然后将其输入到深度学习模型得到位置估计结果。Li 等人[17]通过融合CSI幅度指纹和地磁信息获得了比单指纹更好的定位效果。对于现有的CSI指纹定位系统,研究者们从采集的2.4 GHz 或5 GHz 频段的CSI数据中提取指纹,然后使用深度学习或机器学习算法来提高指纹定位的精度。

现有CSI指纹定位方法存在以下缺陷:首先,现有方法仅考虑单个频段和单域的CSI 信息,即仅考虑了2.4 GHz 或5 GHz 的频域信息作为定位指纹,使得指纹的维度损失较大,指纹解译能力差。随着IEEE 802.11 协议的完善,越来越多的设备同时支持双频WiFi 信号,例如:目前绝大多数路由器都能同时释放2.4 GHz和5 GHz频段的WiFi信号,此外,OPPO 和VIVO 已经生产出能同时连接2.4 GHz 和5 GHz WiFi 的终端设备,双频WiFi 技术在通信质量、防碰撞、探测能力等方面较现有单频WiFi 技术优势明显,已成为无线通信领域未来的发展趋势,如何在室内定位中充分利用双频段的CSI信息至关重要。现有方法只使用了频域的信息作为指纹,没有考虑到时域的信道冲激响应(Channel Impulse Response,CIR)幅度包含的丰富信道特征。其次,通过分析硬件电路中802.11 协议的信号处理流程可以发现,原始CSI 数据中包含了接收端自动增益控制器(Automatic Gain Control,AGC)带来的幅度误差以及由时钟同步等引起的各种相位误差。但现有方法仅消除了相位误差的影响而没有考虑幅度误差,AGC 的影响将严重影响CSI 幅度指纹的质量,降低定位精度。

为了解决以上问题,本文提出双频-时频信道联合指纹优化室内定位方法,首先优化双频段的CSI幅度和相位,然后从优化后的CSI 中提取双频-时频信道联合指纹,即一个样本多种指纹,把多指纹多样本(Multiple Fingerprint Multiple Sample,MFMS)分别输入到对应的定位模型中输出得到多个候选位置。最后,根据MFMS的位置估计,提出一种可信位置选择算法(Trustworthy Position Selection,TPS)联合优化各个估计位置的核密度函数和权重,选出值得信任的位置进行加权融合,得到最终位置的最优估计。在室内复杂的环境中,如人员走动和开关门等将影响指纹的质量。使用多个样本可以很好的减小异常样本对定位结果的影响。指纹定位中,信息融合的方式可以提高定位的精度,如多传感器融合[17-19]、多分类器融合[20]等,本文提出利用多频段多域指纹融合来提高定位精度。

2 CSI的基本原理

对于正交频分复用无线通信系统,CSI 描述了通信链路的信道特性,它包含了信号从发射端到接收端经历的反射、散射、衰落和路径损耗等信息。多径信道模型在频域可以建模为:

其中,Y和X表示接收信号和发射信号,Z表示加性高斯白噪声,H表示CSI 矩阵,对于单天线发单天线收的系统,CSI矩阵可以表示为:

其中,N为正交频分复用系统中子载波的个数,在MIMO 系统中,接收端和发射端有多根天线用于通信,H可以表示一个维度为T×R×N的矩阵,其中,T表示发射天线数,R表示接收天线数。CSI 的每个子载波由幅度和相位组成,即:

其中,|H(k)|和∠H(k)分别表示第k个子载波的幅度和相位,L为多径数目,fk为载波频率,αl和τl分别为第l条路径的衰减系数和时延。

通常,获取CSI 数据需要矢量信号分析器等专用设备,但是目前可以利用CSI Tool[6]和Nexmon[21]等工具从商业网卡中采集CSI 数据。图1 为802.11协议接收端信号处理流程的框图,可以发现,接收信号先经过接收天线,然后经过AGC 进行放大,且放大倍数随接收信号的强度而改变,因此,AGC 将影响CSI幅度而影响定位结果。虽然接收天线的增益也会对信号进行放大,但该增益为固定值,即对所有CSI 数据放大相同倍数,该增益不会影响指纹定位的结果。此外,CSI 相位测量值中包含IQ 解调过程中载波频率偏移引起的相位误差、收发端的初始相位偏差、ADC 采样过程中采样频率偏移导致的相位误差和包检测时延引起的相位误差使得相位失真[22-23]。因此,必须先消除原始CSI 数据中的相位误差,再构建CIR 幅度指纹。第3 节将详细介绍如何消除这些误差来优化指纹。

3 定位框架与算法

3.1 定位框架

图2 为所提方法的框架图,由离线阶段和在线阶段两部分组成。

离线阶段:CSI 采集模块和预处理模块是离线阶段的重要组成模块。对于数据采集模块,将待定位区域划分为网格,使用双频网卡在每个格点采集2.4 GHz 和5 GHz 频段的CSI 数据。对于预处理模块,首先通过一种CSI 幅度优化方法消除AGC 的影响,然后消除频域的各种相位误差,最后通过时频域指纹提取模块,从消除幅度和相位误差后两个频段的CSI 数据中提取2.4 GHz 和5 GHz 的频域CSI幅度指纹以及时域CIR 幅度指纹,从而构造多指纹数据库。

在线阶段:将待定位点接收到的两个频段的多条CSI 数据做离线阶段一样的预处理,利用多条样本提取到的多指纹构造MFMS。将MFMS 分别输入到定位模型中进行位置候选集构造,利用TPS 算法加权融合值得信任的侯选位置得到最终位置估计结果。

3.2 CSI幅度指纹优化

从接收端采集的原始CSI数据中提取的频域幅度指纹不能直接用来定位,如图1所示,在实际无线通信系统中,接收端的AGC 会对CSI 数据产生影响,导致CSI幅度指纹失真。具体而言,当输入信号较强时,AGC 自动降低信号放大器的增益,而当输入信号较弱时,AGC 自动增加信号放大器的增益,从而保证在AGC 作用范围内信号的输出电压比较稳定,使得放大器后级电路对于接收到的信号有较好的处理。因此,发射端发送一个固定功率的信号,该信号经过空间传播到达接收端后,接收端根据接收信号的强弱对该信号进行一定倍数的放大,导致经过后级电路处理得到的CSI 数据中引入了AGC 误差,使得原始CSI 数据中提取的CSI 幅度指纹将不满足路径损耗模型,最终导致CSI 幅度指纹的定位精度严重下降。AGC 引起的幅度误差可以表示为:

其中,αAGC为幅度误差因子。

为了解决这个问题,本文提出一种CSI 幅度优化方法,该方法能够消除AGC 的影响而获取到真实的CSI 幅度指纹。在无线通信中,AGC 的放大倍数通常能够使用底层程序获取,如:利用CSI Tool采集的每包CSI 数据中都报告了该CSI 数据的AGC 放大倍数。因此,可以通过下式消除AGC的影响。

其中,A为AGC 的放大倍数,单位为dB。由图1 可知,公式(5)消除了AGC 模块对CSI 幅度的影响,该方法虽然简单但是十分有效。注意,子载波的实部和虚部应同时消除该误差。此外,如果CSI 采集工具没有获取到AGC 放大倍数,还可以通过RSS 的值rss间接消除AGC的影响,因为估计RSS值的接收信号在AGC处理之前[24],消除公式为:

其中,*代表共轭转置。

利用公式(5)或(6)消除AGC 的影响,然后计算每条CSI信号的幅度指纹,具体公式如下:

CSI幅度指纹优化前后的效果如图3所示,这里画出了图7 所示场景中CSI 幅度优化前后每根接收天线所有子载波的平均相对CSI 幅度图,接收机在坐标(0.4,7)处。可以看出,优化前的CSI幅度不满足路径损耗模型,而优化后的CSI 幅度符合路径损耗模型,即随着收发端之间的距离增加而CSI 幅度减小。

3.3 CIR幅度指纹优化

CSI 是频域信息,对多径效应表现为频率选择性衰落,在室内定位中,CSI 幅度最先被用作定位指纹。CIR幅度是时域信息,在直角坐标系中,纵轴表示不同时延下多径信号的能量,横轴表示相应的多径时延值,因此CIR 幅度也可以很好的作为定位指纹。许多已有工作使用仿真数据或者专用仪器提取的CIR 幅度作为定位指纹取得了较好的定位结果[25-26]。但从商业设备中获取的原始CSI 数据包含各种相位误差[22-23],这些误差会导致对原始CSI 数据做逆傅里叶变换提取的CIR幅度指纹失真。

为了观察相位误差对CIR 幅度的影响,使用长度为1 m的屏蔽线缆和50 dB的衰减器连接收发端,衰减器的作用是保护接收端过饱和,在该条件下,信号只通过一条直达路径到达接收端,排除了多径效应的干扰。图4 展示了连续3 包只优化了CSI 幅度后提取的CIR 幅度指纹。对于指纹定位系统,需要保证同一位置的指纹数据分布更加一致,不同位置之间的指纹分布有差异,才能更好的训练定位模型使其能准确的将信号特征映射到对应的位置。对于同一信道环境,即信号的传播路径没有改变,不同接收数据包的CIR 的多径能量应该相同,即多径能量分布一致。由图4 可以看出,同一信道环境下不同数据包的CIR 多径能量分布并不一致,这是因为相位误差导致了CIR 幅度失真,完全改变了信道特征[22-23]。因此,需要消除相位误差,减小其对CIR幅度的影响。

根据文献[22]、[23]的介绍,对于任意第k个子载波的相位测量值可以表示为式(8):

对于线性误差,根据文献[23],利用公式(9)可以估算出线性误差的斜率和截距。

其中,k是载波编号,N是子载波个数,a表示线性误差的斜率,b表示线性误差的截距。

估算出线性相位误差后,将测量的相位减去估计的相位误差得到处理后的相位,具体公式如下:

图5 展示了使用屏蔽线缆连续采集的100 包CSI 相位处理前后的分布情况,相位误差消除前的相位由蓝色点所示,所有相位随机分布在360°范围内,但经过相位误差消除后的相位由红色点所示,稳定的集中于一个角度范围内。

对消除相位误差后的CSI做逆傅里叶变换提取时域的CIR幅度指纹。如图6所示,相比于图4中的CIR,相位误差消除后的CIR 多径能量分布更一致,更加适合作为定位指纹。

3.4 定位算法

目前,已经获得两个频段优化后的时域和频域指纹,接下来介绍如何使用这些指纹进行位置估计。在指纹定位中,一些机器学习和深度学习模型被使用且已经取得较好的定位效果,如:KNN、支持向量机、随机森林和神经网络等[1]。在在线阶段,获得双频-时频信道联合指纹后,将指纹分别输入到定位模型中,如KNN 定位模型,传统定位方式将定位模型最大预测概率的训练格点坐标作为位置估计结果。但在实际场景中,由于环境的波动性,最大概率估计的位置可能离真实位置较远,而非最大概率估计的位置才是真实位置,基于此,提出将非最大概率估计的位置作为最终位置估计的候选位置。具体而言,当一个在线样本的第m种指纹输入到定位模型后,模型将输出如下概率集合:

其中,G为训练格点的总数,Pm(k)是第m种指纹的定位模型预测第k个训练格点是真实位置的概率。为了自适应将非最大概率估计的位置作为候选位置,可以通过下式选择候选位置:

在室内复杂的环境中,如人员走动和开关门等将影响指纹的质量。使用多个样本可以很好的减小异常样本对定位结果的影响[27],因此,将多个样本输入到定位模型获得更多的候选位置集合。获得候选位置集合后,提出TPS算法,从候选位置中找到值得信任的候选位置进行加权融合。具体而言,将各候选位置坐标的核密度估计进行加权,建立加权误差最小的优化函数,通过最小化目标函数实现最优核密度函数估计。目标函数表示为:

其中,pij是第i个样本的第j个候选位置的坐标pij=[xij,yij],n和mi分别为样本数和第i个样本的候选位置总数,Φ(pij)是坐标pij的核密度函数的简写,即Kh(⋅,pij):=Φ(pij),Kh(⋅,pij)是带宽为h核函数,如高斯核函数,它满足∫Kh(p,pij)dp=1,且Kh(⋅,pij)≥0,核函数的带宽选择将在实验部分详细说明,f为待估计的核密度函数,wij是第i个样本的第j个候选位置权向量,权向量满足下式:

该式子能够限制每个候选位置的权值分配和确保目标函数是一个凸函数。

为了让在式(14)约束条件下的损失函数(13)最小化,利用拉格朗日乘子法,将约束化问题转为无约束问题,可以得到损失函数的拉格朗日方程:

其中,λ为拉格朗日乘子,联立求解0的方程组,可得:

w11,w12,…,wnmn固定时,有,即损失函数无条件约束。求解可得下式:

算法1 是由一个标准的KDE 函数开始迭代,迭代过程中不断更新各候选位置的核密度函数和权值。当候选位置的核密度函数接近真实位置的核密度函数时,该候选位置的权重将增大。

4 实验结果与分析

4.1 实验设置

1)硬件描述:本文实验使用两台安装有Ubuntu14.04 LTS 的笔记本分别作为发射机和接收机,两台笔记本都安装了Intel 5300 网卡和CSI Tool。在数据采集中,两个频段均工作在HT20 模式,即20 MHz 带宽,接收机安装有三根外接天线,发射机安装有一根外接天线。

2)实验场景:为了验证本文提出方法的性能,在两个完全不同的实验场景中进行了实验,第一个场景为电子科技大学创新中心大厅(场景1),如图7所示,共采集36 个格点,格点间距0.8 m,在每个格点采集两个频段的数据各1000 包,采样频率为40 Hz。第二个场景为电子科技大学D 组团16 楼的走廊(场景2),如图8 所示,共采集49 个格点,格点间距0.8 m,在每个格点采集两个频段的数据各1000包,采样频率为40 Hz。

3)度量方法:为了体现真实位置和被估计位置的真实距离,使用平均定位误差作为度量准则,被定义为:

其中,nT表示定位次数,(xi,yi)和分别表示第i个真实坐标和估计坐标。

4)方法对比:将本文提出的方法和三个单指纹定位方法进行了对比,包括:Horus[9]、FIFS[8]和CSIMIMO[14],此外,还比较了通过信息熵最小准则选择分类器的融合定位算法SWIM[27]。在实验中,除非特别说明,MFMS-TPS 方法的基定位模型为KNN 分类器,超参数K值取10。

4.2 定位性能

1)定位精度

利用平均定位误差的累积分布函数(Cumulative Distribution Function,CDF),首先评估了所提MFMS-TPS方法的定位精度,并与现有的方法进行了比较。如图9(a)所示,对于场景1,本文提出方法的第九十百分位误差为1.75 m,而SWIM、CSI-MIMO/5 GHz、FIFS/5 GHz、Horus/5 GHz、CSI-MIMO/2.4 GHz、FIFS/2.4 GHz 和Horus/2.4 GHz 的第九十百分位误差分别为2.53 m、6.44 m、4.00 m、3.28 m、4.86 m、4.85 m 和4.12 m。类似的,场景2 平均定位误差的CDF如图9(b)所示,可以看出,本文方法第九十百分位误差为1.84 m,性能相比SWIM、CSI-MIMO/5 GHz、FIFS/5 GHz、Horus/5 GHz、CSI-MIMO/2.4 GHz、FIFS/2.4 GHz 和Horus/2.4 GHz 提升了44.1%、57.2%、54.1%、44.4%、54.0%、49.3%和45.7%。

为了全面的对比这些定位方法的性能,表1、表2 分别列出了各方法在场景1 和场景2 的最小误差、最大误差、平均误差和第九十百分位误差。可以看出,本文方法的各种误差均是最小的。

表1 场景1中定位精度对比/mTab.1 Comparison of positioning errors in Environment 1

表2 场景2中定位精度对比/mTab.2 Comparison of positioning errors in Environment 2

2)幅度优化的性能

为了体现提出的幅度指纹优化方法对定位性能的影响,将幅度指纹优化方法提取的指纹、FIFS指纹和CSI-MIMO 指纹分别输入到相同参数的KNN定位模型中。图10 分别展示了两个场景不同频段的平均定位误差,可以看出,幅度指纹优化方法提取的指纹定位性能均是最优的。表明消除AGC 的影响将有助于提高指纹定位精度。

3)双频-时频信道指纹的性能

为了验证双频段时频域指纹对定位性能的影响,MFMS-TPS 算法分别使用2.4 GHz 频段的CSI幅度指纹、2.4 GHz 频段CSI 幅度指纹+CIR 幅度指纹、5 GHz频段CSI幅度指纹、5 GHz频段CSI幅度指纹+5 GHz 频段CIR 幅度指纹和双频段时频域指纹的平均定位误差的CDF 如图11 所示。从图中可以看出,对于单个频段,CSI幅度指纹+CIR幅度指纹定位效果优于只使用CSI 幅度指纹,表明了相比于只使用单频段的CSI 幅度指纹,增加时域的CIR 幅度作为指纹提高了定位的精度。此外,还可以看出,使用双频段时频域指纹信息的定位性能明显优于只使用单频段时频域指纹,这验证了双频段指纹提高定位精度的有效性。

4)核函数带宽和样本数量的影响

回想在线位置估计阶段,MFMS-TPS 方法将多个样本的候选位置进行核密度函数加权,最终选择核密度函数的最大概率密度值对应的坐标作为位置估计值。这里核函数带宽是一个很重要的参数,核函数带宽越大,参与最终位置估计的候选位置就越多,但可能引入异常候选位置导致定位精度下降。核函数越小,参与最终位置估计的候选位置就越少,但候选位置过少减小了位置的真值空间。因此,核函数带宽的选择对最终位置的估计很重要。如图12 所示,分别比较了用KNN 和SVM 算法选出候选位置后,核函数在不同带宽条件下的平均定位误差。有趣的发现,对于KNN 算法,随着核函数带宽的增加,定位误差逐渐减小,最终收敛,而对于SVM 算法,随着核函数带宽的增加,定位误差先减小后增大。对于出现这种情况的解释,因为KNN 以欧式距离的大小来估计概率,所以概率分布很集中,是一种很自信的算法,该算法选出的候选位置较少,而SVM 算法的概率分布较分散,是一种很不自信的算法[28],最终选出的候选位置较多,其中包含了较多的异常候选位置。

表3 列出了两个场景下不同样本数量的定位结果,可以看出,场景1 的最优样本数为20,场景2的最优样本数为10,两个场景都是随着样本数量的增加,平均定位误差先减小然后不变。因为随着样本数量的增加,异常样本的影响将减小直至不变。为了获得最优核函数带宽以及最佳样本数量,可以使用交叉验证的方式在离线阶段获得最优值。

表3 样本数对定位精度的影响/mTab.3 Influence of sample number on positioning accuracy

5 结论

针对目前CSI指纹定位工作中没有考虑使用双频WiFi 信号提取CSI 指纹、没有提取时域信息作为指纹和没有消除AGC 对CSI 幅度指纹影响等问题,本文创新性的提出双频-时频信道联合指纹优化室内定位方法。首先,优化双频段的CSI幅度和相位,从优化后的CSI 数据中提取双频-时频信道联合指纹。然后,提出MFMS-TPS 算法充分融合双频-时频信道指纹获得最优位置估计。在两个实验场景中的实验结果表明,本定位方法的定位精度和稳健性明显提高。

猜你喜欢
幅度频段指纹
单次止损幅度对组合盈亏的影响
5G高新视频的双频段协同传输
gPhone重力仪的面波频段响应实测研究
像侦探一样提取指纹
为什么每个人的指纹都不一样
雷声公司交付首套中频段下一代干扰机
微波超宽带高速数控幅度调节器研制
唯一的指纹
推挤的5GHz频段
可疑的指纹