阶梯面积算法在IDC流量计费中的应用研究

2022-08-01 03:36李世宗陈智海颜永明
电信科学 2022年7期
关键词:计费阶梯峰值

李世宗,陈智海,颜永明

(中国电信股份有限公司上海分公司,上海 200085)

0 引言

互联网数据中心(Internet 2ata center,IDC)是互联网服务提供商利用已有的互联网通信线路和带宽资源,建立标准化的电信专业级机房环境和7×24 h高质量运维服务体系,为企业、政府提供服务器托管、租用以及与增值相关等方面的全方位服务。随着云技术的发展、5G的到来,互联网企业对IDC带宽需求越来越高。

IDC业务基础费用主要包括空间租用费和带宽租用费。空间租用费包括机架、电力、IP地址等静态资源,相应的费用相对固定。带宽租用费则相对复杂,涉及端口类型、大小等,在具体计费上包含多种计费方式。目前,IDC主流的计费方式为95峰值计费(计费标准详见第1节),计费模式实施已有几个年头,客户为了降低成本可能会采取一些措施,例如将流量调度到周边资费相较便宜的地区,这不仅会降低终端用户网络体验,还浪费了对应的带宽资源,同时提升了运营商的运维成本。为了避免IDC客户浪费研究资源,提升终端用户的网络体验,本文开展了对计费模式的研究。

1 IDC流量计费策略

带宽租用费主要有3种计费模式:限速计费、流速计费以及流量计费。限速计费即对租用端口的最高速率进行限定,支付费用一般是固定的;流速计费则是对用户租用的端口进行定时流量速率数据采集,根据用户实际使用情况选择其中某一个点进行计算费用;流量计费同样也是对租用端口进行流量数据采集,统计具体流量数据,根据用户实际使用的流量来进行计费。3种计费策略计费标准示意图如图1所示,3种IDC流量计费策略对比见表1。

图1 3种计费策略计费标准示意图

2 面积计费能改善流量调度产生的问题

流量调度行为流量模型示意图如图2所示。其中,数据中心A、数据中心B分别是某个区域内比邻的两个数据中心,从毛刺流量(一天中某个时段的高峰流量)中不难看出,客户分别于月初、月中及月末在两个数据中心不同时间内穿插出现毛刺流量,极有可能是流量调度导致,从而使得数据中心的毛刺流量总时长控制在1.5天(一个月的5%)以内,如此,当月95峰值计费则计算不到这部分毛刺流量,但客户实际上已经使用了95峰值计费点2~3倍的带宽资源。

图2 流量调度行为流量模型示意图

而未经调度的流量模型一般应同数据中心C一样,几乎每天都会有毛刺流量,每天的流量情况差异较小。

而对于有无调度流量的流量数据,对其进行排序则发现,有流量调度的流量有明显的转折点,95峰值最终落在这个点附近,而未调度的流量则会相对平滑,流量调度对95峰值计费和面积计费的影响如图3所示。对于面积计费而言,缺少的流量仅是图3中方框圈起的左下角三角区域,占比不大,而对于95峰值计费而言,缺少将近1/3,所以使用面积计费能较好地避免用户通过流量调度来降低成本,从而避免该行为导致的终端用户网络体验不佳,提升运营商运维成本。

图3 流量调度对95峰值计费和面积计费的影响

为了探究面积计费实施的可能性,需要与现有的95峰值计费方式进行对比,对其利弊进行初步探索,以及对定价方式提出一些建议。

3 95峰值计费与面积计费对比

3.1 对比方法

比较计费方式离不开计费标准,95峰值计费与面积计费是两种截然不同的计费标准模式,不能进行直接比较,需要有一个对应的面积计费规则才能进行比较。

面积计费有两种方式进行计算得到,理论上应对每个月采样点绘制的曲线进行积分,从而得到面积,即具体使用流量,另一种方式则通过采样点的均值乘以时间计算得出。积分法和均值计算法的差异示意图如图4所示。两种方式都随着采样点增多,结果更加精确,但无法完全相等。均值计算方式则会在每两个采样点直接缺少或多出一个小三角形的面积(如图4所示),但总值在采样点数量越多的情况下则越接近。本次实验由于有全量采样点的数据不够多,且面积和95峰值非同类型数值,无法直接放到二维图中进行对比,故采用均值计算法来进行比较。

图4 积分法和均值计算法的差异示意图

假设面积单价固定为Ys,95峰值计费单价为Y95,对每个月数据分别计算面积计费价格与95峰值计费价格对比,计算其间的价格差Δ得到以下计算式:

其中,G95为 当月9 5峰值,Gavr为当月平均流速。以Δ和G95-Gavr作为横纵坐标,模拟数据编程进行运算,比较95均值差和价格差之间的关系。

3.1.1 单一价格面积计费

为了寻求相对合理的比较方式,本文首先获取了某几家IDC大客户过去一年的流量数据,以一年的95流速峰值G95、95峰值计费价格Y95以及一年的流量面积S进行计算,得到面积计费的单价Ys,即计算过去一年几家IDC大客户95峰值计费的费用总和,除以过去一年流量的总面积(即总流量),得到面积计费的单价。

其中,Gi95为第i个月的95峰值,Giavr为第i个月的平均流速,Ti为第i个月的时间,单位为s,每个月的流量面积S=Giavr×Ti。

3.1.2 阶梯面积计费

单一的定价标准并不一定能够满足运营商及客户的需求,对于客户来说,随着流量的提升,其费用成本一样有了提升。为了满足客户的降本需求,同时保住运营商的基本收益,本文参考类似于阶梯电价的形式,设计了一套阶梯面积计费标准,即分几个流量阶梯分别计费,同时流量越大资费越低,当客户流量增长时,就能达到平均价格降低的效果,同时流量低时,运营商的收益不至于损失。

与单一价格面积计费类似,本文基于拿到的这部分数据,计算每个数据对应的流量面积,进行排序,以40%、40%、20%划分,确认阶梯位置。流量面积排序结果如图5所示。再以流量调度与否进行了分组,以同样的方式计算得到两组数据的价格,以此为参考基准进行阶梯计费的定价。

图5 流量面积排序结果

此外,针对有明显流量调度的数据及没有流量调度的数据进行分组实验,观察实验结果。

3.2 数据准备及实验方法

3.2.1 数据准备

收集某几个IDC大客户过去一年的流量数据,其中一个IDC大客户的数据见表2,如假定用户对应的95峰值单价为10000元/(Gbit·s-1),那么根据计算式计算得到对应的单一价格的面积计费单价约为7.2元/Tbit。

表2 IDC大客户A某一年的流量数据(单位Gbit/s)

阶梯面积计费以同样方式计算:

得到无流量调度的价格为:7.5元/Tbit,有流量调度的价格为:6.8元/Tbit,那么则以第一阶梯价格为7.5元/Tbit,第二阶梯价格为7.2元/Tbit,第三阶梯价格为6.8元/Tbit进行实验计算。

3.2.2 实验方法

本文将模拟数据分别进行计算95峰值计费与两种面积计费的价格差Δ,以带宽1000 Gbit/s 精度取小数点后一位,即取值范围为[0.0,1000.0],通过编程辅助计算,穷举计算在区间值内每组95峰值与平均值对应的Δ值。

步骤1根据得到的数据绘制Δ与G95-Gavr的散点图,观察它们之间是否有关系。

步骤2用已有的用户历史数据计算结果,观察目前用户的流量模型基本聚集在穷举情况中哪一块区域,不同用户数据分布是否存在较大的差异。同时对比结果数量占比情况和计费方式之间总价的差距以判断是否能达到本文预期的需求。结果数量占比越多,说明该计费方式在目前IDC流量模式下对运营商更有利,提升带宽价值;而总价越接近甚至略低者,对客户来说更容易接受。

4 实验结果

4.1 95峰值计费与两种面积计费比较

4.1.1 单一价格面积计费比较

本文分别进行两组验算,均以带宽1000 Gbit/s、95峰值计费价格为10000元/(Gbit·s-1)为基础进行换算面积计费价格。第一组以所有数据计算面积计费价格,进行实验,再对有无流量调度的数据进行比较;第二组则是区分有无明显流量调度的数据,分别使用每组全量数据进行计算面积计费价格,再每组选取一半数据进行验证实验。

(1)第一组

基于所有数据计算的面积计算计费价格为7.2元/Tbit。实验结果以G95-Gavr作为横坐标,对应的Δ值为纵坐标进行绘图,单价7.2元/Tbit价格差Δ与G95-Gavr的关系散点图如图6所示。图6中黑色区域即列举所有可能的情况分布。代入两组数据,观察两组数据在区域中的分布。

图6 单价7.2元/Tbit价格差Δ与G95-Gavr的关系散点图

根据实验结果,价格差Δ与G95-Gavr之间存在一定的线性趋势关系,其中G95-Gavr越大,95峰值计费的价格相对面积计费的价格就越高;在G95-Gavr较小时,较多情况下面积计费的价格相对95峰值计费的价格要高。观察实际数据的分布结果,有无流量调度的数据均聚集在价格差为(-250, 250)、95平均差为(0, 400)的区域中。

单价7.2元/Tbit数据占比及价格差距情况如 图7所示。从图7看数量占比,有调度行为的数据结果为面积计费费用大的(后文简称“面积大”,95峰值计费费用大的简称“95大”)占多数,无调度行为的数据则反之,进一步说明流量调度行为确实对95峰值计费产生较大的影响。从所有数据的总价来看,两种计费方式总价接近,面积计费略高出一些。对于无调度行为的数据的面积总价要低一些,对于客户而言更容易接受,但有调度行为的数据总价面积计费高5%,加之面积大的占比远高于95大的,对这部分客户来说比较难以接受。因而可能达不到本文预期的目标。

图7 单价7.2元/Tbit数据占比及价格差距情况

(2)第二组

基于有调度行为数据计算的面积计费价格为:6.8元/Tbit,无明显调度行为数据计算的面积计费价格为:7.5元/Tbit。实验结果:统一定价达不到本文预期的目标,所以进行分别计算定价观察结果是否要理想一些。分组计算单价的价格差Δ与G95-Gavr的关系散点图如图8所示。分组计算单价的数据占比及价格差距情况如图9所示。

图8 分组计算单价的价格差Δ与G95-Gavr的关系散点图

图9 分组计算单价的数据占比及价格差距情况

可以看到,相较于不分组数据统一定价的结果,分组定价总价差距更小,面积总价均较低一些,数据占比也更接近1:1,看起来能让客户更容易接受一些,但就要针对不同客户利用历史数据进行计算定价,对于新客户的定价标准也较难定下,是否有利于IDC的良性发展有待商榷。

4.1.2 阶梯面积计费比较

阶梯面积计费采用与单一价格面积计费相同的实验方式,3个阶梯分别为7.5元/Tbit、7.2元/Tbit、6.8元/Tbit。观察两组数据的分布情况。阶梯面积计费价格差Δ与G95-Gavr的关系散点图如图10所示。

图10 阶梯面积计费价格差Δ与G95-Gavr的关系散点图

从实验结果,可以看到,阶梯计费的分布结果与单一价格类似,但占比无论是有无调度行为的数据占比结果接近,比较均匀,均为面积计费的大,而总价上相差的不是很多,相较于单一面积计费价差小。阶梯计费数据占比及价格差距情况如图11所示。

图11 阶梯计费数据占比及价格差距情况

此次定价标准的实验结果对于有调度行为的客户来说可能依旧不是很好接受,是因为在原始数据中40%的数据处于第一阶梯,使得结果要比95峰值计费的大,那么本文对定价进行适当降低,再来观察结果是否能达到本文需求的结果。

以3个阶梯分别为7.3元/Tbit、7.0元/Tbit、6.7元/Tbit进行实验,降价后阶梯面积计费价格差Δ与G95-Gavr的关系散点图如图12所示,降价后阶梯计费数据占比及价格差距情况如图13所示。

图12 降价后阶梯面积计费价格差Δ与G95-Gavr的关系散点图

图13 降价后阶梯计费数据占比及价格差距情况

从分布结果来看,与降价前无明显差别,但在数据占比上,两组数据都要更接近1:1,能弱化流量调度效应,同时总价都有所降低,客户更能接受,随着客户流量的增长,一般情况下面积总价相较于95流量计费的总价会更低,从理论上达到了本文预期的目的,本文认为目前而言阶梯面积计费是能改善流量调度的问题,同时对客户来说更加优惠。

4.2 流量变化导致结果变化情况简单预测

客户流量随着互联网科技的发展会发生变化,利用历史数据只能看到目前的情况,为了能验证面积计费对未来的情况是否也符合本文的预期,本文简单模拟了客户流量变化的情况,为下一步的实验研究做铺垫。

由于客户流量增加或减少涉及的因素比较多,但基于本文实验的情况,影响结果的就是95流量峰值和平均值的变化情况。考虑到若采用面积计费,对于客户而言没有必要再进行流量毛刺的调度,固变化基数本文选取了没有明显调度行为的数据,设计了4种变化情况进行实验观察结果:等比放大95峰值和平均值1.5倍,等比缩小95峰值和平均值至其60%,对95峰值放大1.2倍、平均值放大1.5倍,对95峰值缩小至其80%、平均值缩小至其60%。

阶梯面积计费4种变化情况价格差Δ与G95-Gavr的关系散点图如图14所示,阶梯计费4种变化情况数据占比及价格差距情况如图15所示。

图14 阶梯面积计费4种变化情况价格差Δ与G95-Gavr的关系散点图

图15 阶梯计费4种变化情况数据占比及价格差距情况

可以看到,不同的流量变化对结果分布的聚散情况以及最终价格比较的结果都会有影响。其中,流量增长会使得结果分布更分散,减少使得结果分布更聚集;等比放大的情况下95峰值得到的价格更高,大于面积计费的情况也更多,等比缩小则反之;对于差额变化情况相对复杂,但与单一价格面积计费情况类似,会一定程度向变化大的那一边倾斜,列举中的情况是相对极端的情况,对占比结果和总价差距的影响都很大。对未来的预测只是本文简单地列举几个情况观察,具体分析还需要后续进行进一步研究。

本文想要的结果并不是面积计费能方方面面较于95峰值计费对运营商更有利,本文的需求是让客户尽量少地调度流量,同时不用过于担心流量增长而产生高额费用。通过实验结果,可以推测,阶梯面积计费在流量增长的时候相对于95峰值计费是更优惠的,只有在平均值增长速率远高于95峰值的情况下,计费结果才有所改变,但在实际情况中这种变化情况是很少的。对于客户而言,流量增长平均下来的费用更划算,运营商也因为用户流量增长获得相应的利润,能够一定程度上满足本文实现双赢的需求。对于流量减少的情况,与增长类似,等比变化会使得面积计费更接近于95峰值计费,甚至略高于95峰值计费。

5 结束语

本文旨在研究95峰值计费及两种面积计费之间的区别及关系,验证面积计费是否能够改善95峰值计费产生的对运营商不利的一些弊端,从而形成一定的方法论,此外尽量寻求能够实现双赢的方法,为经营决策提供参考。通过实验结果,可以看到面积计费是能够一定程度地改善95峰值计费产生的弊端的,但对于客户来说,他们对成本的顾虑没有得到改善,阶梯面积计费能够较大程度上满足运营商与客户的需求,从而实现双赢的局面。但实际的流量计费规则涉及方方面面,错综复杂,本文研究只是在一个相对局限的条件下进行的设定实验,仅作为经营决策的参考,对一个计费方式的改变不能一蹴而就,需要继续深入研究。

猜你喜欢
计费阶梯峰值
一种基于实际GIS底图的精准计费方式探究
犊牛生长发育对成年奶牛高峰奶产量和峰值日的影响
5G融合计费模式设计研究
基于J2EE的计费系统的设计和实现
锚杆锚固质量等级快速评级方法研究
良师·阶梯·加油站
爬阶梯
艺术创意阶梯
生死大考:网吧计费系统遭黑手!