基于NFV的4G网络可靠性研究

2018-04-10 01:46◆马
网络安全技术与应用 2018年4期
关键词:网元核心网业务流程

◆马 龙 张 铮



基于NFV的4G网络可靠性研究

◆马 龙 张 铮

(信息工程大学四院 河南 450001)

本文主要介绍了NFV技术在4G网络中的应用以及4G虚拟化网络的实现方式,揭示了NFV对4G通信业务流程造成的影响,介绍了一种vEPC的实现方案,该方案对三类4G通信流程关键事件进行逻辑分解,并将其组装为一个Fat-proxy,使用Fat-proxy将关键事件的控制消息从核心网分离出来并形成实例,通过并行执行事件消息来加速整个事件的执行,从而提高基于NFV技术的4G网络的可靠性。

4G;NFV;vEPC;虚拟化

0 引言

随着通信技术、计算机技术、网络技术的发展,传统意义上的4G网络也逐渐开始从网络虚拟化入手,通过网络虚拟化提高网络资源的配置效率。如AT&T、BT、德国电信、法国电信等主要电信运营商推动成立了ETSI NFV,其主要目在于推动网络虚拟化技术的标准化,希望通过基于行业标准的x86服务器、存储和交换设备,来取代传统网络中专用网元设备,用以构建灵活定义、随需创建的开放网络和生态系统。网络功能虚拟化(NFV)以一种低成本的方式扩展了用户服务,将传统的集中4G核心架构转换为分布式架构。这种分布式体系结构使多个4G网络功能(NFs)实例化,并在商用数据中心网络上虚拟化它们。本文以NFV技术为切入点,重点研究NFV在4G网络的应用部署、产生的问题及解决方法。

1 NFV与SDN的区别

SDN[1]和NFV[2]都是近些年为了满足新的应用需求提出的新一代网络技术。SDN的核心理念是将网络功能和业务处理抽象化,并且通过外置控制器来控制这些抽象化的对象。SDN将网络业务的控制和转发进行分离,分为控制平面和转发平面,路由协议交换、路由表生成等路由功能均在统一的控制面完成。SDN是基于OpenFlow[3]实现的,OpenFlow在网络中实现了软硬件的分离以及底层硬件的虚拟化,从而为网络的发展提供了一个良好的发展平台。

NFV的本质在于解决电信运营商多年来高昂的网络成本和封闭的网络功能,NFV的初衷是通过使用x86等通用性硬件以及虚拟化技术,来承载很多功能的软件处理,最终用来取代私有专用的网元设备。NFV技术颠覆了传统电信封闭专用平台的思想,同时引入灵活的弹性资源管理理念,通过将网络设备的硬件和软件解耦,并把传统网络设备内的业务功能分解成一个个VNF(Virtualized Network Function),通过对VNF的统一编排和管理,根据应用需求进行定义不同的业务链,实现不同业务流经过不同VNF进行处理,在此基础上可以完成4G核心网网元、IMS网元等的逻辑实现。

SDN跟NFV最明显的区别是,SDN处理的是OSI模型中的2-3层,NFV处理的是4-7层。依赖于应用在大量数据中心内的现有技术,网络功能虚拟化的目标可以基于非SDN的机制而实现。但是,如果可以逐渐接近SDN所提出的将控制平面和数据平面的思路,那么就能进一步使现有的部署性能增强且简化互操作性。

2 虚拟化4G网络

2.1 4G网络结构

4G网络主要包括无线接入网、核心网以及与接入无关的IMS(IP Multimedia Subsystem)网络。3GPP定义了可支持高速移动数据业务的无线接入网LTE与演进的分组域核心网EPC架构。LTE主要研究无线接入网的长期演进技术,SAE (System Architecture Evolution)则是研究核心网的长期演进,它定义了一个全IP的分组核心网EPC,该系统仅有分组域而无电路域、基于全IP结构、控制与承载分离,其中主要包含HSS、MME、SGW、PGW、PCRF以及eNodeB等网元。在EPC网络中,只定义了分组域的网络架构,语音、短信等传统电路域业务将基于IMS网络分组架构承载。IMS网络使用SIP协议作为核心控制协议,提供与接入无关的IP多媒体业务控制能力,主要包括P-CSCF、I-CSCF、S-CSCF、AS等网元。无线接入网、EPC、IMS网络结构及主要接口协议如图1所示。

图1 4G网络结构及主要接口协议

2.2 NFV在4G网络中的应用

NFV旨在通过研究发展标准IT虚拟化技术,使得许多网络设备类型能够融入到符合行业标准的大容量服务器、交换机和存储设备中,目前全球越来越多的厂商、运营商、服务提供商均参与其中。Juniper、阿朗、思科等网络设备厂商结合SDN发展趋势,选择云数据中心网络为突破方向,向虚拟网络服务提供商转型;而华为、中兴、阿朗、爱立信等将重点推出vIMS、vEPC等平台并开展测试及商用,例如华为的FusionSphere、阿朗的Cloudbound、爱立信的ECEE、HP的OpenNFV计划等;传统的电信运营商例如AT&T、DOCOMO、Sprint、Vodafone、SK、Telefonica以及国内的运营商均已开展虚拟核心网vEPC、虚拟IMS网络以及部分虚拟网元的技术测试和与现网的融合工作。

NFV基础设施可由在云平台上运行虚拟网络功能(VNFs)的服务器组成。例如在进行4G网络的虚拟化部署时,可以将openEPC[4]分解成若干NFs(MME、SGW、PGW、HSS和PCRF),然后将这些NFs部署在华为的FusionSphere平台上,从而实现对4G核心网和IMS网络的虚拟化。虚拟化的vEPC NFs和vIMS NFs可根据实际需求进行快速灵活部署并扩展,基于FusionSphere平台的4G网络虚拟化架构如图2所示。

图2 4G虚拟化架构

3 NFV技术对4G通信业务的影响

NFV通过软硬件解耦、基础设施共享的方式,将传统网络设备内的业务功能分解成一个个VNF,能否保证电信级的处理能力,是影响4G通信业务在NFV上部署的关键。

3.1 NFV对4G组网方式的影响

(1)NFV对4G网络中各类网元在形态上由传统的软硬一体变为基于统一平台的虚拟功能网元,但是在功能逻辑上几乎没有变化。

(2)NFV在用户容量上可能低于传统网元,但是可以快速扩容。

(3)NFV虚拟功能网元之间的容灾也需要在业务层面考虑并实现。

NFV虚拟网元在组网方式上与传统4G网元没有太大区别,但是由于传统网元是直接部署在独立的软硬件设备上,而NFV架构下的4G网络是部署在虚拟化的云平台上,所以新增了虚拟资源管理、虚拟数据管理、虚拟控制管理等以及虚拟机的网络管理(如图3)。

图3 NFV-4G核心网架构

3.2 NFV对4G通信业务流程的影响

(1)传统电信级设备可靠性

电信级设备的可靠性需要达到99.999%,在性能上需要重点保证端到端时延和QoS。在传统的EPC中有较少的NF(MME、SGW、PGW、HSS、PCRF等网元),它们通过专用的光纤连接在一起,不同NF之间链路的RTT是稳定的,它决定了NF的可达性和数据包转发次数。这些NFs交换大量的控制消息来执行特定的通信流程。例如,在设备开机附着(Attach Request)中,MME从HSS获得设备安全密钥,对设备进行身份验证及鉴权,同时在SGW和PGW中创建设备会话信息。SGW和PGW建立了该设备与网络的会话,并配置了特定的QoS配置文件,从而在网络上注册了该设备。一旦某个控制消息延迟或失败将会导致完整的附着过程失败,然后设备会进行重新附着,将影响通信的可靠性。

(2)vEPC可靠性

通常EPC核心网是在数据中心网络上虚拟化的,其NFV基础设施是由在云平台上运行虚拟网络功能(VNFs)的服务器组成,这些VNFs可能存在多跳链接,而不像传统的NFs直接相连。一旦某跳出现拥塞,信令数据会在拥塞的IP链路上花费更长时间,从而触发不必要的数据重传。多跳链接和多路径还增加了丢包的概率,一个响应包的丢失可能就会导致整个业务流程失败。虚拟化网络利用了数据中心网络[5]的固有的多路径特性,也有可能导致数据包的乱序发送。排队延时、丢包、超时重传和乱序转发等问题会直接影响用户的通信状态(例如语音中断、无服务、不能上网等)。

为了解决以上问题需要在特定的软件和硬件上保证信令消息及数据传输的高可靠性和高可用性,提供数据包级别的保证(例如话音业务和数据业务的分别是100ms和300ms延迟[6])。

(3)vIMS可靠性

IMS的核心业务是VoLTE服务,IMS配合LTE和EPC网络实现端到端的基于分组域的短信、语音、视频通信业务。但是IMS协议和基于云平台的上IMS的故障恢复机制相对较弱,导致基于云的IMS不能在错误的情况下提供会话级别的恢复能力,将导致会话业务中断。为了解决这个问题,应当确保提供冗余来实时恢复故障。

4 NFV在4G应用中的实现方案

在NFV的应用中,排队延时、丢包、超时重传和乱序转发等问题会直接影响4G的通信业务流程及用户的通信状态。为了消除这些影响,需要对逻辑处理功能及网络架构进行适当调整,从而满足电信级的可靠性。下面将主要介绍NFV在EPC核心网中的实现方案。

4.1 Fat-proxy的概念

为了解决上述问题,UCLA的研究团队采用一种基于业务逻辑的虚拟化方法[7]。其主要原理是对于每一个关键的通信业务流程,以模块的形式从每个NF中提取该业务流程的逻辑功能,然后将所有NFs中提取的基于业务流程的模块组装为一个代理Fat-proxy(或者Thick Client),如图4所示。通过提取切换(Handover)、寻呼(Paging)、服务请求(Service Request)这三个关键事件的业务逻辑,为三个事件的业务逻辑创建Fat-proxy,利用Fat-proxy充当这些事件的NF,从而降低延时,提高处理效率。

4.2 Fat-proxy的特点

使用Fat-proxy主要有三方面特点:首先Fat-proxy充当NF,并且只处理单一类型的事件,既减少了延迟,又避免了超时重传;其次,这三个关键事件大量的消息流量(占总流量的50%)从vEPC中转移到Fat-proxy,可以使vEPC及时处理其他的事件请求,同时确保Fat-proxy及时执行关键事件业务;最后, Fat-proxy可以在需求增加时轻松地进行扩展。

4.3 Fat-proxy的实现

(1)逻辑功能分解

通过OpenEPC源码来构造业务逻辑事件函数调用关系,提取函数调用信息和全局变量,在源码的基础上自动识别功能依赖关系,从而形成函数调用图。调用图记录了调用关键事件和特定场景下的函数链,形成不同事件的功能依赖关系,然后对不同的调用关系进行分解。在调用过程中,由于相同的函数可以根据所执行的事件的场景被链接到不同的位置,所以要对此类调用关系进行细致划分。例如用户在没有X2切换接口情况下,在两个eNodeB之间进行切换(Handover)时,用户的下行数据是通过EPC进行转发。首先PGW将数据转发给源SGW,SGW将其转发给源eNodeB,由于eNodeB之间没有X2接口,因此无法向目的eNodeB转发数据。随后,源eNodeB将这些数据投递至源SGW,源SWG将这些数据转发给目的SGW,最终通过目的eNodeB转发给用户。整个业务流程从Forward Relocation Request请求开始调用,然后MME在目的SGW上调用创建会话请求(Create Session Request)来创建一个会话,用于转发下行数据包。第二种情况是用户在有X2接口的eNodeB之间进行切换,在这种情况下,下行数据包不需要通过EPC通道进行转发。目的eNodeB发送路径切换请求消息(PathswitchRequest)到MME,告知用户已从源eNodeB迁移,MME调用修改承载请求(ModifyBearerRequest),并更新下行通道标识符,控制SGW将要将数据包转发到目的eNodeB。

通过梳理各类业务逻辑事件函数调用关系,记录调用关键事件和特定场景下的函数链,最终将通信业务事件的逻辑功能进行分解。

(2)通信业务事件逻辑的提取

逻辑提取主要是从各自的vEPC NFs提取关键事件执行逻辑,并将它们组合为该事件的代理。首先识别关键事件所依赖的函数执行关系,通过函数分解过程(步骤1),提取执行过程中存在逻辑依赖关系和数据依赖关系。逻辑依赖发生在两个事件之间,当两个事件执行时存在逻辑联系时,如果没有正确识别和处理,将会影响整个事件的功能。数据依赖发生在事件执行期间,它需要与外部实体交换用户数据。一旦拥有了所有事件的执行逻辑流程,就会将关键事件的执行与所有其他事件进行比较,然后在关键事件和其他事件之间找到公共的要素,从而提取事件的执行逻辑。

图4 切换事件的并行化执行

(3)优化Fat-proxy

关键事件执行的延迟会导致整个通信业务的中断。因此,需要通过并行执行一些消息来加速事件的执行。可通过划分不同协议的互斥逻辑,利用网络协议的基于逻辑的分区来实现这一目标。例如,图4显示了在切换事件期间,EPC NFs之间交换消息的流程。S-MME从eNodeB接收到消息,并触发转发Allocation消息到T-MME。接收到消息后,T-MME将创建会话请求(Creation Session Req)发送给T-SGW,随后T-MME将T-SGW的响应消息成功会话发送给eNodeB。创建会话请求和跨区迁移请求消息的方向是相反的(两个消息都是同时发送的),前者是GTP协议的一部分,后者是S1AP协议的一部分,这些消息的并行传输是可能的。通过识别NF中的协议级别模块化,并将消息执行并行化,可加速跨区迁移的效率。在大多数业务流程事件中,有40%-60%的消息可以并发执行,以显著提高网络性能。

5 结束语

随着NFV技术在4G网络中的应用发展,越来越多的4G网络将会进行虚拟化部署,其中最关键的是解决NFV对4G通信业务流程造成的影响,使其能够提供电信级的服务保证。本文介绍的vEPC的实现方案,通过增加Fat-proxy来提高基于NFV技术的4G网络的可靠性,对研究NFV的实际应用具有一定的技术意义。

[1]ONF.Software Defined Networking(SDN) Definition[EB/OL].https://www.opennetworking.org/sdn-definition/.

[2]ETSI.Network Functions Virtualisation[EB/OL]. http://www.etsi.org/technologies-clusters/technologies/nfv.

[3]Mckeown N,Anderson T,Balakrishnan H,et al. Op-enFlow:enabling innovation in campus networks[J].Acm Sigcomm Computer Communication Review, 2008.

[4]OpenEPC-Open source LTE implementation[EB/OL].http://www.openepc.net/.

[5]Mittal R,Lam V T,Dukkipati N,et al.TIMELY: RTT-based Congestion Control for the Datacenter[C].ACM C-onference on Special Interest Group on Data Communication. ACM, 2015.

[6]3GPP.TS 23.203:Policy and Charging Control Architecture[S], 2013.

[7]Raza M T,Kim D,Kim K H,et al.Rethinking LTE network functions virtualization[C].IEEE,International Con-ference on Network Protocols.IEEE Computer Society,2017.

猜你喜欢
网元核心网业务流程
虚拟光网络中NFV资源分布式调度设计
GSM-R核心网升级改造方案
一种全网时钟同步管理方法
企业财务管理、业务流程管理中整合ERP之探索
互联网+背景下物流公司的业务流程再造
5G移动通信核心网关键技术
建设项目全过程造价管理咨询服务的业务流程分析
基于财务业务流程再造的ERP信息系统构建探析
核心网云化技术的分析
上海局GSM-R核心网资源优化配置研究