基于节点兴趣的对等网络信息搜索机制研究

2011-04-18 05:11
科技传播 2011年10期
关键词:搜索算法结构化服务器

江 涛

肇庆科技职业技术学院信息工程系,广东 肇庆 526000

1 P2P网络的定义

P2P(Peer to Peer)指的是对等计算或者对等网络,通常也简称为P2P,具体来说就是网路上的节点通过直接交换的方式,来共享其各自计算机上的各种资源以及服务。在P2P的网络环境里,成千上万台彼此相连的计算机都处于对等地位,整个网络是不依赖于专用服务器的。网络中的任一台计算机既是网络服务的申请者,又是资源与服务的提供者,因而能够开发每个网路节点潜力,提高网络的工作效率。

总的来说,P2P网络可描述为:网络的参与者共享其所拥有的部分硬件资源,这些被共享的资源经过网络,可以被其它的对等节点直接访问,而不需要去经过中间实体。在这种网络模式中的参与者,既是资源提供者,又是资源获取者。

2 P2P网络和传统网络(C/S)的对比

P2P网络与C/S网络,是相对应的网络模式。C/S网络模式与P2P网络模式的对比如图1所示:

图1 P2P模式和C/S模式

与传统的C/S模式相比,P2P模式有着明显优势:

2.1 资源的利用率较高

在P2P网络中,许多闲散的资源,可以得到许多机会被利用。所有节点的资源总和,即构成整个网络的资源,因而我们可以把整个网络,看成是具有优越的存储能力和强大的计算处理能力的一种超级计算机。对应的,在C/S模式下,即使客户端,有着大量的闲散资源,也是无法被充分利用。

2.2 节点的增多可以使网络更稳定

P2P网络中,每个节点,都是一个活动的参与者,都会向网络贡献一定资源,比如存储的空间、CPU运算、各种资源等。所以加入的节点越多,规模越大,网络的性能就越好也越稳固。而在C/S模式下,客户端之间共享资源需要经过服务器,网络节点的增加,会增大服务器的负担,一旦超过服务器的承受能力而崩溃,整个网络也会处于瘫痪。

2.3 信息在对等节点之间是直接交换,速度快,响应时间短,中转成本低

P2P也有不足之处:1)缺乏管理机制。不像C/S模式,只需要在服务器进行管理;3)P2P网络中,数据的安全面临较大威胁。此外还存在占用网络带宽,侵犯版权等问题。

3 P2P搜索技术

在P2P网络中,一个节点的搜索请求,通过网络,将可同时发给网络上其他N个节点,假设搜索请求没有得到满足,这N个节点又会将该搜索请求,转发给另外N个节点,如果这个过程持续进行下去,搜索范围将在短短数秒内,急速扩大,很快可搜索上百万节点的信息资源。

P2P资源搜索的这种策略需要较好的算法支持。当某个节点,发起一个查询时,将这个查询的消息数据包,广播到其邻居节点。对于查询请求,接收到查询消息的节点,首先会判断自己是否符合查询的要求,然后再决定是否按照制定的策略进行转发。一旦查询命中,即可通知发起节点,并在之间建立连接,进行相应任务。查询的命中与否,并不是取决于某个确定的节点,而是关系到,算法所规定的所有节点。因而具有较好的鲁棒性。一般P2P搜索算法是针对非集中式的拓朴领域内,按拓朴组织形式可分为结构化搜索算法和非结构化搜索。

3.1 结构化P2P搜索算法

结构化的P2P搜索算法,大都是DHT算法来实现的。目前已经有几种比较成熟的DHT搜索算法:Chord,CAN,Tapestry,Pastry等。这里主要介绍基于静态环形拓扑结构的经典chord算法。

Chord算法以DHT思想为指导,其核心思想可以描述为:Chord将DHT的文件索引表进行细分,分成多个的小局部文件索引表,再分别存放于环中的各个节点。一旦收到搜索命令时,就可通过一定的方式,连接到某几个节点的局部文件索引表,查找存放该资源的节点并获取资源所在节点地址。

3.2 非结构化P2P搜索算法

非结构化P2P的基本搜索算法,是Flooding算法,主要的代表是Gnutella系统。这种算法是通过查询邻节点,并通过邻节点的转发来达到遍历网络中所有节点,从而得到尽可能多的查询响应。可以为每个消息,设立一个最大的网络生存时间TTL。每转发一次就减少TTL,直到TTL为1时,便停止转发。

3.3 混合式搜索算法

在混合式P2P搜索中,资源的查询以混合模式实现:比如热门资源通过Flooding算法,而稀有资源则使用基于DHT的有结构搜索算法。通过这种混合设计,去同时获得对热门资源和稀有资源的搜索效率和质量。

4 P2P搜索技术的评价标准

4.1 搜索执行效率

查询请求,在网络中扩散,需要经过多个节点。而每个节点都要花费时间和资源,对其请求进行处理,是否有满足查询要求,是否转发查询请求。因而用资源的消耗,去衡量搜索的效率。高效的搜索技术要做到以较少的资源去获得较满意的搜索效果。

4.2 可扩展性

一般P2P网络的规模很大,并且随着加入的节点增多,规模急剧增长。P2P搜索需要满足网络对扩展性的要求,当网络规模急剧膨胀时,也能够及时有效的,满足节点的搜索需求。

4.3 健壮性

P2P网络其节点规模是动态的变化的,网络中节点,通常会频繁的加入或退出。根据对Gnutella的统计,超过40%的节点,在线的时间通常少于4个小时,而只有25%的节点,在线时间多于24小时。搜索方法良好的健壮性,可以保证在节点故障或者退出网络时,把影响降到最低,最大程度的保证搜索到足够的资源。

5 结论

P2P网络是当前计算机网络领域的一个热点问题。搜索策略作为P2P技术的关键技术,也是目前研究的热门领域。在P2P网络搜索中,无需通过中心服务器,也可以不受设备或搜索信息格式的制约,实现对网络的全方位搜索。其搜索深度和广度是传统搜索引擎难以比拟的,其搜索范围可在短时间内,迅速增长,采集到的信息将有更强的实时性和有效性。P2P网络搜索技术具有潜在广阔的应用前景。

[1]张晓刚.基于JXTA技术的P2P应用系统的研究与开发[J].微型电脑应用,2006(1):15-l7.

[2]郭丽,杨振启.P2P技术原理及安全性问题浅析[J].网络安全技术与应用,2005(6):37-38.

[3]李祖鹏,黄道颖,庄雷.基于Peer-to-Peer网络的JXTA技术研究[J].计算机工程与应用,2003,Vol.11:67-69.

[4]张利平,吴秀玲.基于P2P技术的搜索技术的研究[J].普图学刊,2008(5).

猜你喜欢
搜索算法结构化服务器
促进知识结构化的主题式复习初探
改进的和声搜索算法求解凸二次规划及线性规划
结构化面试方法在研究生复试中的应用
通信控制服务器(CCS)维护终端的设计与实现
中国服务器市场份额出炉
得形忘意的服务器标准
计算机网络安全服务器入侵与防御
基于图模型的通用半结构化数据检索
基于汽车接力的潮流转移快速搜索算法
基于逐维改进的自适应步长布谷鸟搜索算法