基于遗传算法的协作频谱租借策略研究

2019-06-11 03:39:57 计算技术与自动化2019年1期

刘爱民 曾凡仔 陈嘉贝

摘要:随着认知无线电(CR)技术的发展,协作认知无线电网络(CCRN)成为提高频谱利用效率和解决频谱稀缺问题的有效途径。而且,无线通信系统中的过度能量消耗已变得越来越重要。能量采集(EH)被认为是缓解此类问题的有效解决方案。然而,由于自然能量的随机性和间断性,从自然能源采集的能量不能保证EH网络中令人满意的服务质量(QoS)。混合能源供应已经成为解决不稳定电力供应问题的一种新模式,这意味着,这样的网络是由固定电源能量和采集能量共同提供动力。提出了一种新的混合能量供应认知无线电网络协作频谱租借方案。主用户(PU)雇佣次用户(SUs)作为协作中继,SUs通过从PU的RF信号中采集的能量来帮助PU传输数据,作为回报,PU授予SU接入信道的权利。PU的目标是通过与SUs合作来最大化其收益并节约自身能源,而SU旨在最大化其吞吐量和能源利用率。将此模式制定为Stackelberg博弈。最后,通过遗传算法解决了PU和SU在定价和频谱租借中的最优策略问题。

关键词:认知无线电;协作频谱租借;斯坦克尔伯格博弈;能量采集;遗传算法

中图分类号:TP393.1

文献标识码:A

认知无线电已经作为非授权次用户(SU)动态地接入主用户(PU)的授权频谱以提高频谱利用率的一种手段。它被设计成一个具有观察,推理,决定和合作能力的智能无线电[1-2]。近年来,协作认知无线电网络(CCRN)这样一种新型认知无线电模式被广泛应用[3]。在CCRN中,PU雇佣若干SU作为中继帮助PU传输数据并且给他们部分频谱资源接入时间作为回报。这样的一种合作模式导致的结果就是,PU不仅可以获得显着的效益,SU也有机会传输自己的数据,从而实现“双赢”。

尽管传统的CCRN框架既可以使PU和SU都受益,但仍然存在效率低等弊端。近年的研究主要考虑链路层频谱租赁,并假设主网络中只有一条链路,例如[3-4]。在现实世界的系统中,网络通常由多个用户和多个链路组成,频谱租借在网络层面上才能更好地进行。并且,在未来,动态频谱共享模式最有可能是具有多个PU和SU的二级频谱市场。在同一地理位置,不同的PU在不同的授权频段上运行,并面临越来越多的SU要求频谱租借的事实。当然,每个用户都是理性和自私的,他们只关心自己的回报,并始终遵循最佳策略,从而最大化他们的效用。

使用合作多样性来提高认知无线电网络的性能引起了广泛的关注。其中一类工作的重点在SU之间的合作以改善次级网络(SN)的性能,如[5-6]。另一个CCRN的重点是PU和SU之间的合作沟通。

考虑具有一对主收发器和多对次收发器的CR系统,其以时隙模式操作。文献[7,8]均考虑了多中继的合作模式,文中同样采用文献[7,8]提到的MRC技术,最大比合并(MRC)是分集合并技术中的最优选择,相对于选择合并和等增益合并可以获得最好的性能。波束成形技术近年来在多天线、多用户的网络模型中应用广泛[9,10],其目的主要是通过编码信号来防止信号之间的干扰,在本文中,我们同样也用到这样的技术,使主用户和次用户之间信号传输不会相互影响。由于从自然能源收集的能量动力和能量储存能力有限,这种能源可能无法保证为SU提供足够的电力供应。在模型中,SU发射机主要从PU的相对稳定的RF信号采集的能量供电,即,SU发射机具有混合电源。在这样的网络中,如果SU的电池中存储了足够的绿色能源,则SU采用采集的能源。最大限度地利用绿色能源来优化这种网络中的能源利用,从而节省固定能源的消耗。频谱感知和SU的预期吞吐量之间的基本平衡已经在[11]中进行了深入分析,重点在时间维度上的资源分配以及研究最优感知持续时间以最大化SU实现的吞吐量不低于预定义的检测级别。受到了[11]的启发,本文中,主要关注PU和SU的吞吐量以及效用值。这项工作的主要工作总结如下:

1.提出了一种新型的CCRN系统架构。研究一个PU和多个SU的情况。为了使SU能够获取更强的信号,运用了波束成形的设计。然后将这一模型放人在Stackelberg博弈框架下分析问题。最优策略也将由Stackelberg博弈均衡得到。

2.考虑如何用PU频谱接人时间的一部分来激励给SU,如何确定租赁价格以最大化其效用,如何激励SU作为合作中继,并确定最优合作策略,以及如何为PU和SU节省能源。

3.由于直接求解最优策略相对复杂,设计了一种遗传算法求解博弈均衡,之后,还设计了一个迭代算法实现Stackelberg博弈的最优策略。

其余部分安排如下。在第二节中,详细描述了系统模型。在第三节中,确定了效用最大化问题。第四节中将用Stackelberg博弈来获得最优策略。第五节中将会介绍本文中用到的两个相关算法,数值仿真结果以及结果分析在第六节中给出。最后在第七节得出结论。

1 系统模型

考虑的认知无线电网络,它由一对主收发器和多个次收发器组成,并且它们都以时隙模式工作。

在本文中考虑了协作频谱租借模式,也就是说,只要有数据要发送,PU就优先使用授权频谱。假设在每个时隙中,都有一定数量的数据存储在其缓冲区中。主传输完成后,授权频谱的状态变为空闲状态。此外,PU知道SU的存在,并且為了从SU得到回报,一旦许可信道空置,PU允许没有频谱资源的SU接入频谱并且发送SU的数据。在这种情况下,为了赢得数据传输的机会,SU可以选择等到主传输完成或作为中继来缩短主传输时间。

由于自然能源的间歇性和动态性,收集的能量并不稳定,不够支持整个传输过程,因此在的工作中,考虑混合能源供应的网络。在这个框架中,不是从动态的自然能源采集能量,而是在PU正在传输其数据时,SU从更稳定的RF信号中采集能量。SU大量使用采集的能量,当采集的能量太少以至不能支持整个通信过程时,SU可以使用固定电源来确保稳定的传输。我们还假定SU的收发器中只有一个天线,遵循save-then-transmit协议。在每个时隙中,次用户首先使用一部分时间进行能量采集,然后尽量使用采集的能量进行中继和自身数据传输,当采集的能量不足以支持通信时,则切换到固定电源。本文中PU和SU之间的协作通信采用了解码转发(DF)协议。

如图1一图4所示,文中无线通信过程共有四个步骤。也就是说,如图5所示,我们模型中的一个时隙被分成四个部分用于两种不同类型的用户,具体描述如下:

1.时间段(0,pT):當PU将其数据直接从主发射器( PT)发射到主接收器(PR)时,ST,可以同时从PU的RF信号获取能量。在此期间表示ST,收获能量为:

其中,pT表示整个时间帧的一部分,0≤p≤1。PT在(0,pT]时间段内将数据直接发送给PR,同时,SU能从PT相对稳定的RF信号中采集到能量。我们用来Xi表示STi的能量采集速率,即单位时间内采集的能量,只从PU的RF信号中获取能量,RF信号相对稳定,所以可以假定在整个帧持续时间内能量采集速率是恒定的,但是在不同帧内,不同的采集速率是不一样的。假设PU数据率为,PU以功率直接传输其数据给PR。根据香农定理,其功率与传输速率的关系可以表述如下:

PU和SU采用合作传输模式的前提条件是协作传输速率Pps(S)应该大于直接传输速率Rpu,所以信道增益hps,i应该大于hpp。在这种情况下,PU的数据采用直接传输本可以在一个时隙中完成,合作模式下有SUs作为中继来转发缩短了主数据的传输时间,这就确保了SU可以赢得传输机会。

一旦STi解码了数据,它就可以从其它STj的RF信号中获取能量。每个STi所需要的接收解码数据时间可以表示为:

3.时间段:在这段时间内扮演中继的角色,以最大功率转发原始剩余数据到PR,其数据传输速率为。参考文献[8]对多中继SNR的处理方式,假设接收机在解码信号之前利用最大比率组合(MRC),则PR处的有效SNR等于来自所有的SNR的总和。协作链路可达到的传输速率为:

2 问题分析

在本节中,将介绍一种基于效用的合作频谱租借机制。用户在系统中的效用值与其吞吐量以及能效有关。一方面,PU雇佣SU作为中继来最大化频谱租借费用并节约自身能量。另一方面,SU旨在通过与PU合作并通过从PU的RF信号收集能量来最小化固定能源消耗并尽可能提高其吞吐量。

3 最优频谱租借策略

根据以上分析,可以把该优化问题建模成斯坦科尔博格博弈。在系统模型中,主用户是频谱的授权使用者,对频谱具有绝对的优先使用权,因此主用户作为斯坦科尔博格博弈的领导者,次用户作为跟随者。目的就是要得到斯坦科尔博格博弈的均衡,即领导者与跟随者均达到一个最优状态,均不会试图偏离这个均衡点[12]。基于以上的分析,可以将最优频谱租借策略表述为:

4.1 遗传算法

借鉴生物进化理论,将遗传算法需要解决的问题建模为生物进化过程,通过复制,交叉,变异等操作产生下一代解,逐步淘汰适应度低的个体,遗传适应度高的个体。N代演化以后就能得到相应的最优个体。

在模型中,当求解最优策略ρ时,使用八位二进制数编码ρ,因为p的值范围为[0,1],所以求得的ρ值可以精确到小数点后两位,实验种群是由四组编码的ρ组成。由于的目标是找到PU的最大效用函数值,将适应度函数设置为PU的效用值。当适应度值越大时,下一代被遗传下来的机会就越大。

同样的,在计算SU,的最大效用值和相应的ci时,由于ci也是一个有限的值,同样可以把ci编码并且产生初始种群,然后进行一系列的复制,交叉,变异等操作求得最优效用值和对应的ci

4.2 迭代算法

该迭代算法包括多次用户和主用户之间的相互影响更新。缓存的初始状态设置方法有许多方法,例如通过历史经验设置初始状态值(ρ,c0,cl,…)或者设置为0然后主用户和次用户可以按照上述迭代算法进行不断更新最佳策略,直到收敛。

从图中可以看出价格和频谱接入时间分配策略对主次用户的效用具有很大的影响。

图9和图10展示了SU的数量对PU和SU,效用的影响。图9和图10中的“非协作模式”意味着PU不会将频谱租给任何SU,也就是说,这意味着p等于零,并且SU支付给PU的等于零。从数值仿真图上可以看出,与非合作模式相比,合作模式下的PU和SUs获得了更高的效用值。但是,随着SU数量的增加,为了获得更多的时间用于接入频谱,SU的竞争变大,导致每个SU的效用下降,但是PU和整个网络的效用依旧增加。在非合作模式下,每个SU在整个过程中收集来自PT的RF信号,并且在该模式下,PT以广播的形式发送信号,因此SU,的效用与SU的数量多少无关。

6 结论

提出了一个协作通信频谱租借模型,通过定价和频谱接人时间分配策略来最大化主用户和次用户的效用,该主用户为了增加收益而将一些频谱接入时间租用给次用户,并且利用次发射机作为用于主数据传输的中继。将主用户和次用户之间的频谱共享建模为Stackelberg博弈,并通过智能算法求解出频谱接人时间分配和频谱定价的最佳策略。数值分析表明,在这种合作频谱租赁和能量采集方案下,存在一个最优策略可以使PU和SUs的效用最大化。

参考文献

[1]

HU S, YAO Y D,YANC Z.MAC protocol identification approachfor implement smart cognitive radio[C]//IEEE Intemational Con-ference on Communications, IEEE, 2012:5 608-5612.

[2] HU S,YAO Y D,YANG Z.MAC protocol identification usingsupport vector machines for cognitive radio networks [J]. IEEEWireless Communications, 2014, 21(1 ):52-60.

[3] SIMEONE 0,STANOJEV I, SAVAZZI S,et al.Spectrum leasingto cooperating secondary Ad Hoc networks[J].Selected Areas inCommunic ations IEEE Journal, 2008, 26(1):203-213.

[4] ZHANG J, ZHANG Q. Stackelberg game for utility-based cooper-ative cognitiveradio networks[C]//ACM Interational Symposiumon Mobile Ad Hoc NETWORKINC and Computing, MOBIHOC2009, New Orleans, La, Usa, May.DBIP, 2009:23-32.

[5] JIA J,ZHANC J,ZHANG Q.Relay-assisted routing in cognitiveradio networks[J]Inform.IEEE, 2009:1-5.

[6] JIA J, ZHANC J,ZHANG Q. Cooperative relay for cognitive radi。

networks[C]//INFOCOM. IEEE, 2009:2304-2312.

[7]

WANG X,WANG Y,ZHANG Y,et al.Approximate analysis onuplink sum rate with MRC receivers in massive MIMO systems[C]//International Symposium on Wireless Personal MultimediaCommunications,IEEE, 2017.

[8]

HO-VAN K.Exact outage probability analysis of proactive relayselection in cognitive radio networks with MRC receivers[J].Joumal of Communications&Networks, 2016,18(3):288-298.

[9]

SHENG Z, TUAN H D,DUONG T Q,etd.Optimal beamformingfor physical layer security in MISO wireless networks [J]. IEEETransactions on Signal Processing, 2018:12-20.

[10] BANERJEE S,DWIVEDI V V.Comparative analysis of adaptivebeamforming techniques [J]. Progress in Intelligent ComputingTechniques: Theory, Practice, and Applications, 2017: 357-364.

[11] LIANG Y C,ZENG Y,PEH E C Y,et al.Sensing-throughputtradeoff for cognitive radio networks [J]. Wireless Communica-tions IEEE Transactions on, 2008, 7(4):1326-1337.

[12] FAHIMI M,GHASEMI A.Joint spectrum load balancing andhandoff management in cognitive radio networks:a non-coopera-tive game approach[J]. Wireless Networks, 2016, 22(4):1161- 1180.

[13] SHENF, LID, LINPH,etd.Auction based spectrum sharing for hybrid access in macro -femtocell networks under QoS require-ments[C]//IEEE Intemational Conference on Cormuunications,IEEE, 2015:3335-3340.