基于内容热度与节点介数的NDN网络缓存策略①

2018-01-08 03:12晨,郑烇,丁尧,王
计算机系统应用 2017年12期
关键词:热点服务器决策

郭 晨,郑 烇,丁 尧,王 嵩

(中国科学技术大学 自动化系 未来网络实验室,合肥 230026)

基于内容热度与节点介数的NDN网络缓存策略①

郭 晨,郑 烇,丁 尧,王 嵩

(中国科学技术大学 自动化系 未来网络实验室,合肥 230026)

缓存技术是数据命名网络 (Named data networking,NDN)的关键技术之一. NDN 传统的 LCE 缓存策略会造成较大的冗余. 改进的RCOne策略采用随机放置的方法,没有利用任何内容、节点信息,对网络缓存性能的提升有限. Betw策略只考虑到节点介数,导致高介数节点缓存更替频繁,当节点缓存容量远小于内容总量时,缓存性能下降. 为了解决这些问题,本文提出一种结合内容热度与节点介数的新型缓存策略HotBetw(Hot content placed on node with high Betweenness),充分利用内容与节点信息选择最佳的位置放置缓存. 仿真实验表明相对于典型NDN缓存策略,HotBetw缓存策略在提高缓存命中率、降低平均跳数方面具有很好的效果.

数据命名网络; 缓存技术; 内容热度; 节点介数; HotBetw 缓存策略

为了从根本上解决传统IP网络传输效率低的问题,一类以信息为中心的新型网络体系——ICN被提出[1]. 数据命名网络NDN是ICN的主流网络架构之一[2],NDN网络泛在化的缓存能有效的降低用户的等待时延、节约带宽资源、减小服务器负载.

NDN网络默认的缓存决策策略是LCE(Leave copy everywhere)[1],LCE策略会在网络中产生大量冗余副本,导致网络缓存资源的利用率低. 针对LCE的缺点,RCOne[3]、Betw[4]等缓存决策策略被提出[5,6]. 为了提升网络缓存的多样性,RCOne算法在内容返回路径中随机地选择一个节点缓存内容. 这种随机化的缓存决策易于实现,但并未考虑内容的热度等信息,对缓存性能的提升有限. Betw算法在内容返回时选择兴趣包请求路径上最重要的节点缓存,其它节点不再缓存. 对于不同网络拓扑,该策略都取得了较高的网内节点缓存命中率,并减少了内容传输的平均跳数. 然而,在实际网络中,节点缓存量远小于内容总量,Betw策略会导致节点越重要,到达的请求越多,需要缓存的内容也越多,同时节点负载也会越大,从而导致缓存中的内容更替频繁,新缓存的内容,即使具有很高的热度,也具有较大可能性被快速替换掉,致使后续请求无法充分利用前期缓存.

选取2016年3月—2018年1月在我院接受口腔疾病治疗的患者90例作为研究对象,并将其随机分为研究组和对照组,每组各45例患者。其中,对照组中,男21例,女24例,年龄20~50岁,平均年龄(32.06±6.49)岁,其中有7例是牙列缺损、12例是龋齿导致的牙体大面积缺损、8例牙间隙过宽、18例牙周炎;研究组中,男28例,女17例,年龄19~50岁,平均年龄(31.59±5.89)岁,其中有9例是牙列缺损、10例是龋齿导致的牙体大面积缺损、6例牙间隙过宽、15例牙周炎;对两组患者的一般资料进行对比,差异无统计学意义(P>0.05),具有可比性。

基于以上方案存在的问题,本文提出一种综合考虑内容热度与节点介数的网络缓存决策策略HotBetw.根据内容的热度信息将内容分为热点内容与非热点内容. 在内容返回的过程中结合内容热度与节点的重要性,将热点内容放置在重要节点上,非热点内容随机放置在某一个节点上. 该策略既能保证热点内容尽量缓存在相对重要节点上,又能避免重要节点处于高频率的内容替换状态下,同时也充分利于了非重要节点的缓存资源,达到提升网络缓存性能的目的.

本文的结构如下: 第1节介绍和分析内容热度算法与NDN缓存决策策略的相关技术; 第2节阐述本文提出的HotBetw缓存决策策略; 第3节给出仿真环境、方案与参数的设置,并分析仿真结果; 第4节对本文工作进行总结.

1 相关技术

1.1 内容热度算法

为了提高缓存命中率,节点进行缓存替换时会把热度最小的内容替换出去. 最常用的NDN网络缓存替换算法有 LRU[7]与 LFU[8]. LRU(Least recently used)主要思想是: 当有新内容转发到节点且节点缓存空间已满时,将最久未使用的缓存内容替换掉. LRU主要考虑内容的动态性,认为最近转发的内容很有可能再次被请求,因此具有较大的热度. 但是如果一个内容每隔一段时间都会被请求一次,LRU算法会用最近的内容将它替换掉,即使最近的内容很少有人感兴趣. LRU算法只注重了内容的动态性却忽略了内容的历史热度.LFU(Least frequently used)的核心思想是给每一个缓存内容进行计数,缓存命中时,计数值加 1. 缓存替换时将计数值最小的内容替换掉. LFU主要考虑内容的历史热度,认为历史热度高的内容被再次请求的概率大.但是如果请求的内容在动态变化时,LFU算法的性能将下降. 原因是: 当一个内容过去很流行,即使之后没有人再请求,它也会一直留在缓存中直到最近的一些被命中次数更多的内容出现. LFU算法只只注重了内容的历史热度却忽略了内容的动态性.

Complete Freund's adjuvant:CFA is composed of paraffin oil,mannide monooleate and heat-killed,dried Bacillus Calmette-Guerin(BCG).11 CFA was purchased from Sigma-Aldrich(USA),which had been used to stir immunity in several researches.12,13

针对LRU与LFU缓存替换策略的不足,文献[8]提出了CCP缓存替换策略. CCP缓存替换策略周期性地统计内容的命中次数,实时计算内容的热度,根据内容热度进行缓存替换. 内容热度的计算公式如下:

1)根据内容热度算法,将内容分为热点内容与非热点内容.

本文旨在结合内容热度与节点介数进行缓存决策,因此接下来将详细介绍内容热度算法、NDN缓存决策策略这两方面的相关技术.

1.2 NDN缓存决策策略

NDN的默认缓存决策策略是LCE(Leave copy everywhere). LCE的主要思想是在内容返回过程中的每一个节点都缓存内容. LCE的算法复杂度低、实现简单,但是会导致网络中出现大量冗余副本,降低缓存的多样性.

谢子卧疾山顶,览古人遗书,与其意合,悠然而笑曰:夫道可重,故物为轻;理宜存,故事斯忘。古今不能革,质文咸其常。合宫非缙云之馆,衢室岂放勋之堂。迈深心于鼎湖,送高情于汾阳。嗟文成之却粒,愿追松以远游。嘉陶朱之鼓棹,乃语种以免忧。判身名之有辨,权荣素其无留。孰如牵犬之路既寡,听鹤之途何由哉![注] 《宋书》卷六十七《谢灵运传》,第1754页。

健脾生血片与多糖铁复合物胶囊治疗非透析肾性贫血的疗效及安全性比较 ……………………………… 简 讯等(10):1384

根据内容的实时热度值,我们可以对内容进行合理的划分. NDN网络中用户请求到的内容是由源服务器节点或者请求路由路径中某个节点的CS表提供[9].由源服务器节点提供的内容在请求路由路径中没有缓存副本,说明这个内容在路径中所有节点上的热度都不高,因此被划分为非热点内容. 由节点CS缓存表提供的内容根据实时热度值进行划分. 内容分类的详细情况如下:

图1 实例拓扑

文献[4]提出的Betw缓存决策策略,请求命中后将内容只缓存在内容返回路径中最重要的节点上. 由于在重要节点上,同一个内容被请求的次数会更多,使得内容在节点上被缓存时间变长,缓存命中率变高从而提升缓存性能. 而节点重要程度是以节点介数作为度量,节点介数用来描述节点在网络中重要性的一个度量,源于复杂网络领域,其数学定义如下:

然而在实际网络中节点缓存大小与网络内容总量相比非常小,因此,重要节点到达的请求数量非常大,节点处于高频率的内容替换状态下,导致热点内容也会出现很快就被替换. 此时大量的兴趣包到达重要节点后,无法实现缓存命中,兴趣包也只能被转发到别的节点,直至内容源端. 在图1 的拓扑结构中,Betw 策略会把所有的内容都缓存在v2节点,v2节点的缓存空间大小有限,高频率的替换状态下导致网络缓存性能的降低; 此外v2之外的其他节点均未放置缓存,也造成了缓存资源的浪费.

2 算法介绍

2.1 HotBetw缓存决策策略核心思想

基于以上分析,我们发现如果将内容缓存在内容返回路径中最重要的节点上,虽然能够满足更多的请求,但是由于节点缓存空间有限,缓存替换过快会导致网络缓存性能下降. 另一方面,如果采用随机缓存的方法,由于没有结合任何内容或者节点的信息,网络缓存性能的提升也很有限,因此本文提出如下基于内容热度与节点信息的HotBetw缓存决策策略:

随机抽取2017年2月-2018年2月至我院接受治疗的104例冠心病患者为检验组(n=56),再随机抽取同时期至我院接受健康体检的健康者为对照组(n=48),检验组男33例,女23例,年龄45-70岁,平均年龄(57.58±12.74)岁,病程1-9年,平均病程(3.47±2.39)年;对照组男23例,女25例,年龄47-74岁,平均年龄(57.79±12.83)岁,病程2-7年,平均病程(4.32±2.18)年;将两组人员年龄、病程、性别等基本资料纳入统计学中分析显示无显著差异(P>0.05),具有比较意义。

8是一个吉利的数字,在中国人的传统语境中,8意味着财富的增长。但是在这个尾数是8的年份里,很多民众的感受中,这并不是一个好的年景。中国股市复制了2008年的大跌模式,股指在2018年开市的最后一天回落至2500点以下收盘,全年跌幅超过四分之一,1.46亿股民人均亏损近10万元。“二八规则”也被轻易打破,仅有一成股民侥幸赚了点钱。对于中国股市,这显然是一个没能逾越的寒冬。

2.5 m时的过流能力分别为0.442 m3/s、1.070 m3/s。 按式(1)计算得出鱼道池室的容积功率耗散约为19.92 W/m3、19.29 W/m3,紊动不剧烈,适合鱼类上溯。

3)非热点内容采用随机化的RCOne策略,随机缓存在内容返回路径中的某一个节点上.

下面通过一个实例来分析HotBetw策略的性能.在图1所示的拓扑结构中,假设每个节点的CS缓存表的大小为1,3个用户节点分别先后请求1次内容:Client A请求c1,然后Client B请求c2,最后Client C请求c1. 接下来我们分析采用不同缓存决策策略下,网络的缓存命中次数. 缓存决策策略采用Betw策略时,Client A请求的c1由源服务器s1提供,c1缓存在v2节点;Client B请求的c2由源服务器s1提供,c2缓存在v2节点,将之前的c1替换掉; 最后Client C请求的c1依然不能被缓存命中,只能由源服务器s1提供. 3次请求过后,缓存命中次数为0. 如果缓存决策策略采用RCOne,当Client A请求的c1缓存在v1节点,Client B请求的c2缓存在v2或v4节点; 或者Client A请求的c1缓存在v2节点,Client B请求的c2缓存在v1或v4节点时,Client C请求的c1才会被缓存命中. 可以算出RCOne策略的平均缓存命中次数为4/9. 如果缓存决策策略采用 HotBetw,c1被请求 2 次,是热点内容,采用Betw 策略;c2只被请求 1 次,是非热点内容,采用RCOne策略.Client A请求的c1由源服务器s1提供,c1缓存在v2节点;Client B请求的c2由源服务器s1提供,c2只要不缓存在v2节点,Client C请求的c1就会被v2节点的缓存命中. 可以计算出HotBetw策略的平均缓存命中次数为2/3,高于Betw策略与RCOne策略. HotBetw策略既能将热点内容放置在重要节点,又能降低重要节点缓存替换率提高缓存命中率,同时利用其它节点存储非热点内容,提升网络缓存多样性.

2.2 基于CCP缓存替换策略的内容热度算法

合理划分热点内容与非热点内容是HotBetw策略的关键之处. 在实际网络中,我们无法像2.1小节实例中那样提前预知具体的内容请求,此时正确计算内容的实时热度显得尤为关键. 文献[8]中提出的CCP缓存替换策略中能兼顾内容请求的动态变化与内容的历史热度,正确计算出内容的实时热度,因此本文采用CCP缓存替换策略所提出的内容热度算法计算内容热度. CCP替换策略在NDN网络的CS、PIT以及FIB结构的基础上,新增了内容热度统计表(Content popularity table,CPT). CPT 表用来保存缓存内容的命中次数、历史热度用来计算缓存内容的实时热度. 当CS表更新时,CPT表也同步更新,确保CPT表保存CS表中所有缓存内容的信息. CPT表详细表结构如表1所示.

2)热点内容采用基于节点介数的Betw策略,缓存在内容返回路径中节点介数最大的节点上.

表1 内容热度统计表(CPT)

RCOne缓存决策策略采用随机化的思想,在内容返回路径中随机选取一个节点缓存内容. 图1所示的拓扑结构中,用户Client A请求内容c1时,源服务器s1提供c1,c1在返回过程中随机选择v1、v2、v3中的某一个节点缓存下来. 相比于LCE,RCOne虽然能在一定程度上提升网络缓存多样性,但是在缓存放置时既没有考虑内容热度,也没有考虑节点信息,对网络缓存性能的提升有限.

1)热点内容: CS表中实时热度值位于前40%的内容.

2)非热点内容: 源服务器节点提供的内容、节点CS表实时热度值位于后60%的内容.

兴趣包请求如果被某一个节点CS表中实时热度值位于前40%的内容缓存命中,那么返回的内容是热点内容; 如果被源服务器或者某一个节点CS表中实时热度值位于后60%的内容满足,则返回的内容是非热点内容.

2.3 HotBetw缓存决策策略的实现

为了实现HotBetw缓存决策策略,兴趣包在请求的过程中,需要记录路由路径中所有节点的最大节点介数CB和跳数hop. 兴趣包被满足时,基于2.2小节的内容热度算法,判断内容是否为热点内容. 热点内容采用Betw缓存决策策略,在内容返回的路径中,将路径中每个节点v的节点介数CB(v)与最大节点介数CB进行比较,两个值相同则将内容缓存在这个节点v上. 非热点内容采用RCOne缓存决策策略,兴趣包被满足时产生一个0到跳数hop之间的随机数,内容返回过程中每转发 1 跳,随机数减 1,当随机数减为 0 时,将内容缓存在这个节点上. 图2的伪代码给出了节点对兴趣包与内容的详细处理过程. 兴趣包到达节点v时,OnIncomingInterest首先查询兴趣包是否被节点v满足(v的CS表缓存命中或者v是源服务器server). 如果被满足,则返回内容,内容从兴趣包中获得3项信息:最大节点介数CB、0-hop之间的一个随机数,热点内容标志位hot. 如果兴趣包没被满足,则更新兴趣包的最大节点介数CB与跳数hop,继续转发到下一跳. 内容到达节点v时,OnIncomingData首先判断内容是否为热点内容,热点内容根据节点介数的匹配结果放置,非热点内容则根据跳数值是否为0进行放置,更新跳数值,继续将内容转发到下一跳.

图2 HotBetw 伪代码

3 实验分析

3.1 实验环境与参数配置

3.2 实验结果分析

图3是在4种缓存决策策略下,节点缓存容量不同时,用户请求在全网的缓存命中率. 这个命中率是在节点缓存大小确定好后,一次实验中被网内节点缓存命中的请求占所有用户请求的比例. LCE、RCOne、Betw这3组对照实验中,Betw策略的全网缓存命中率最高. 本文提出的HotBetw策略的全网缓存命中率相比于Betw策略高出9%.

图3 全网缓存命中率随节点缓存大小的变化

图4是在4种缓存决策策略下,请求的平均跳数随节点缓存容量大小的变化. 平均跳数是一次实验中所有的用户请求被转发的平均跳数. 3组对照实验中,Betw策略的平均跳数最低. 本文提出的HotBetw策略的平均跳数比Betw策略低0.3跳,性能提升了10%.

悬浮间隙传感器非线性校正模型为单输入单输出系统,因此其输入层和输出层均只有一个神经元。RBF神经网络的结构主要取决于隐含层神经元节点的个数,隐含层神经元的个数越多,网络的逼近能力越强,但网络也越复杂;神经元个数越少,网络越简单,但同时网络逼近能力亦随之降低。本文通过仿真试验最终选择5个隐含层神经元的网络结构。RBF网络隐含层神经元的中心值、阈值和输出权值参数的训练,采用粒子群优化算法,具体按式(6)将各优化参数用各粒子进行编码。

4 结语

为了解决NDN网络中内容在请求路径上如何选择缓存节点的问题,本文提出了一种基于内容热度与节点介数的缓存决策策略HotBetw. 该策略通过内容的热度信息,对内容进行分类,热点内容采用 Betw 策略,非热点内容采用RCOne策略. HotBetw策略既能保证热点内容尽量缓存在相对重要节点上,又能避免Betw策略只考虑节点介数而导致重要节点内容替换频繁,同时也充分利于了非重要节点的缓存资源. 仿真实验表明,HotBetw决策策略与Betw策略相比全网命中率提升了9%,请求平均跳数减小了10%,相比于随机放置的RCOne与到处放置的LCE策略性能提高更加显著.

图4 请求平均跳数随节点缓存大小的变化

1张国强,李杨,林涛,等. 信息中心网络中的内置缓存技术研究. 软件学报,2014,25(1): 154–175. [doi: 10.13328/j.cnki.jos.004494]

2Ahlgren B,Dannewitz C,Imbrenda C,et al. A survey of information-centric networking. IEEE Communications Magazine,2012,50(7): 26–36. [doi: 10.1109/MCOM.2012.6231276]

3Eum S,Nakauchi K,Murata M,et al. CATT: Potential based routing with content caching for ICN. Proc. of the Second Edition of the ICN Workshop on Information-Centric Networking. New York,USA. 2012. 49–54.

4Chai WK,He DL,Psaras I,et al. Cache“less for more” in information-centric networks. International Conference on Research in Networking. Berlin Heidelberg. 2012. 27–40.

5Psaras I,Chai WK,Pavlou G. Probabilistic in-network caching for information-centric networks. Proc. of the Second Edition of the ICN Workshop on Information-Centric Networking. New York,USA. 2012. 55–60.

6Laoutaris N,Che H,Stavrakakis I. The LCD interconnection of LRU caches and its analysis. Performance Evaluation,2006,63(7): 609–634. [doi: 10.1016/j.peva.2005.05.003]

7Podlipnig S,Böszörmenyi L. A survey of web cache replacement strategies. ACM Computing Surveys (CSUR),2003,35(4): 374–398. [doi: 10.1145/954339]

8Ran JH,Lv N,Zhang D,et al. On performance of cache policies in named data networking. Proc. of the 2013 International Conference on Advanced Computer Science and Electronics Information. Beijing,China. 2013. 668–671.

9Yi C,Afanasyev A,Wang L,et al. Adaptive forwarding in named data networking. ACM SIGCOMM Computer Communication Review,2012,42(3): 62–67. [doi: 10.1145/2317307]

10Mastorakis S,Afanasyev A,Moiseenko I,et al. ndnSIM 2.0:A new version of the NDN simulator for NS-3 [Technical Report]. NDN-0028. Los Angeles: NDN,2015.

Cache Scheme Based on Content Popularity and Node Betweenness in Named Data Networking

GUO Chen,ZHENG Quan,DING Yao,WANG Song

(Laboratory for Future Networks,Department of Automation,University of Science and Technology of China,Hefei 230026,China)

Cache is one of the key technologies of named data networking(NDN). However,the basic cache scheme LCE(leave copy everywhere) in NDN leads to much redundancy. The RCOne scheme chooses the cache node randomly without using any information of content and node,which is limited in improving cache performance. The Betw scheme results in that the node has the more frequent replacement with the larger betweenness centrality,which will decrease the cache performance when the node’s cache capacity is far smaller than the total content amount. In order to solve those problems,a cache scheme named HotBetw is proposed in this paper based on content popularity and node betweenness to choose appropriate cache node along the content delivery path. The simulation results show that the HotBetw cache scheme can achieve higher cache hit ratio and reduce average request hop compared with existing schemes.

named data networking; cache; content popularity; betweenness centrality; HotBetw cache scheme

郭晨,郑烇,丁尧,王嵩.基于内容热度与节点介数的NDN网络缓存策略.计算机系统应用,2017,26(12):165–169. http://www.c-sa.org.cn/1003-3254/6105.html

2017-03-14; 修改时间: 2017-03-31; 采用时间: 2017-04-07

猜你喜欢
热点服务器决策
为可持续决策提供依据
PowerTCP Server Tool
BlackJumboDog
热点
决策大数据
决策大数据
2018年全球服务器市场将保持温和增长
诸葛亮隆中决策
结合热点做演讲
热点