关于搭建智慧家庭端到端性能监控平台的研究与实践

2021-01-14 06:52文俊峰
数字通信世界 2021年6期
关键词:画像分值监控

文俊峰

(中国移动通信集团山西有限公司,山西 太原 030000)

1 系统搭建

1.1 数据采集

(1)家宽DPI数据:采集互联网出口的信令解析数据,体现用户上网行为的记录,用于分析用户业务感知情况。(2)机顶盒软探针数据:机顶盒的告警数据、资源数据、运行周期数据、收视数据。(3)智能网关软探针数据:智能网关的信息原始数据、周期采集原始数据、网络探测原始数据、告警信息原始数据。(4)投诉数据:通过客服进行投诉的家客业务投诉工单数据。(5)故障数据:集中故障中网元(BRAS,OLT,PON)告警,包括告警开始时间,结束时间等属性。(6)AAA认证数据:用户登录radius验证的记录信息,包括登录开始时间,结束时间,认证失败原因及时间等。(7)PON网络性能数据:通过数据网或传输网采集各类网元的(ONU,OLT,BRAS,等)性能数据,如CPU利用率,内存利用率,光功率、端口峰值利用率等。

1.2 端到端监控

1.2.1 用户侧

(1)智能网关设备监控指标:wifi弱覆盖、wifi干扰、端口速率、ONU光功率、CPU占用、内存占用持续运行时长等。(2)互联网电视设备监控指标:卡顿频次、播放成功率、MOS值、EPG响应时延达标率等。(3)智能组网设备监控指标:设备状态、流量、周边Wi-Fi干扰、网络质量。(4)智能家居监控指标:防类智能家居设备告警。

1.2.2 网络侧

(1)OLT设备监控指标:OLT上光光功率、PON口发光光功率、OLT上行峰值带宽利用率、OLT-PON口的流量等。(2)BRAS设备监控指标:BRAS上行的带宽利用率、BRAS并发连接利用率、BRAS下行收光弱光、BRASNAT板带宽利用率。(3)故障监控:主干光缆断缆故障、分支光缆断缆故障、OLT故障退服等。

1.2.3 平台侧

(1)AAA平台监控指标:用户短时间上下线、认证失败、用户频繁掉线等。(2)DNS监控指标:DNS解析成功率。

1.2.4 内容侧

(1)TCP类监控指标:TCP建立成功率、一二次握手成功率、二三次握手成功率。(2)重点业务监控指标:网页浏览类业务重点监控指标:网页浏览第一个HTTP响应包时延(MS)、网页浏览页面响应成功率(%)、网页浏览页面响应时长(ms)、网页浏览页面显示成功率(%)、网页浏览页面显示时长(ms)、网页浏览页面下载速率(kb/s)。(3)视频类业务重点监控指标:视频第一个HTTP响应包时延(MS)、视频响应成功率、视频响应时延、视频播放成功率(%)、视频播放等待时长(ms)、视频播放停顿频次(次/分钟)、视频业务下载速率(kb/s)。(4)游戏类业务重点监控指标:游戏第一个HTTP响应包时延(MS)、游戏响应成功率(%)、游戏响应时延(ms)、游戏业务下载速率(kb/s)。

2 主动运维

家庭网络质量受长流程管理的多个环节影响,影响用户满意度的因素复杂,涉及端、管、云等各个环节,一个环节出现问题与瓶颈,整体满意度下滑。同时隐性因素发现难,端到端的监控只能发现较显性问题,其余隐性不满意原因难以定位。对于未形成投诉和故障的非紧急问题需要通过综合的挖掘分析进行预警,同时考虑实际工作开展情况,需要对问题对象有优先级评估体系。

基于上述多种因素考虑,需通过精确挖掘,多维度分析形成主动运维分析手段,考虑运维人员实际管辖处理的对象维度,分别对用户、小区、网元进行质量画像和质差分析,形成主动运维分析体系。本次通过运维大数据分析建模,形成大数据三级画像结果输出。数据整合和融合,形成用户画像、小区画像、网元画像评估方案,支撑家庭年业务的综合满意度评估和质差分析,实现主动运维与整治提升。

2.1 画像得分体系

(1)小于基准值:0;(2)等于基准值:权重*40%;(3)如果数据在基准值和挑战值区间内:权重*40%+权重*60%*(当前值-基准值)/(挑战值-基准值);(4)大于等于挑战值:权重值;(5)如果相关数据为空:权重值。

2.2 家庭用户质量画像

评估规则主要从家庭网络、承载网络、业务质量、服务质量四个维度定义26项指标评估算法,描述宽带质量画像整体得分和四项子维度得分,挖掘各类质差用户。该画像定位为单用户的质量评估。

宽带用户质量画像整体得分或四项子维度得分低于60分的用户,可标记为相应的贬损用户,用户级清单可提供给市场部、客户服务部、网络部作为业务营销、用户关怀、用户调研、投诉处理、质差整治、故障处理的参考依据。

家庭网络:家庭网络子维度得分主要评估用户家庭网络的接入质量优劣,它是以下各项指标得分的加权平均,各项指标满分均为100。包括:家庭网络分值、持续运行时长分值、CPU占用情况分值、内存占用情况分值、用户下线频次分值、ONU光功率分值、端口速率分值、下挂设备情况分值、Wi-Fi强干扰分值、Wi-Fi弱覆盖分值。

承载网络:承载网络子维度得分主要评估用户承载网络的运行质量优劣,它是以下各项指标得分的加权平均,各项指标满分均为100。包括:承载网络分值、OLT上联负载分值、PON口负载分值、短时间上下线分值、频繁掉线分值、业务不可用时长分值。

业务质量:业务质量子维度得分主要评估用户业务使用感知的优劣,它是以下各项指标得分的加权平均,各项指标满分均为100。包括:业务质量分值、时延分值、丢包重传分值、电视卡顿/花屏时长占比分值、电视播放成功率分值、EPG响应时延达标率分值、MOS值分值、无线接入质量分值、终端性能分值。

服务质量:服务质量子维度得分主要评估用户服务体验感知的优劣,它是以下各项指标得分的加权平均,各项指标满分均为100,计算规则参考以下小节。包括:服务质量分值、重复投诉分值、异常投诉分值、投诉满意度分值、装机满意度分值。

2.3 小区质量画像

从网络结构、业务质量、网络性能、故障处理、资源质量等五个维度对建立家宽小区质量画像评估体系。5个维度综合打分评估实现质差小区融合事先预警,通过预警及时发现小区整体问题导致的质差。该画像定位为挖掘小区内用户的共性问题。

网络结构:评估小区网络结构不合理导致感知问题,为以下指标的加权得分:双路由占比、分光比超限PON占比。

业务质量:评估小区业务质量整体情况,为以下指标的加权得分:宽带业务不可用率、电视卡顿时长占比、网络类投诉量、网络类投诉比。

网络性能:评估小区级网络性能问题导致感知问题,为以下指标的加权得分:ONU弱光率、OLT-PON口的流量超限占比、OLT上联链路的流量超限占比。

故障处理:评估故障处理的及时情况对感知的影响。为以下指标的加权得分:投诉处理及时率、小区中断故障平均历时、小区中断频次、小区群障抢修及时率。

资源质量:评估小区资源质量情况对感知的影响,为以下指标的加权得分:ONU自动激活成功率。

2.4 网元质量画像

从家客网元视角(BRAS、OLT)进行质量画像评估。该画像定位为挖掘网元级质量问题,明确设备问题引起的用户质差,优先解决。

OLT设备评估:通过OLT设备的多维指标融合评估,为以下指标加权得分:超限(70%)PON口的数量、PON口发光弱数量、OLT上行收光弱光、OLT上行峰值带宽利用率、是否双上联、OLT退服次数、OLT退服时长、分光比超1:64PON口数量、用户超64户PON口数量。

BRAS设备评估:通过BRAS设备的多维指标融合评估,为以下指标加权得分:BRAS故障次数、BRAS上行的带宽利用率、BRAS并发连接利用率、BRAS下行收光弱光、BRASNAT板带宽利用率。

3 闭环管理

(1)质差网元的问题是最明确的,可优先解决排除;(2)质差小区反应的是非单用户导致的小区共性问题,先于单用户问题进行优先处理;(3)用户质差反应的是单用户自身问题,网元和小区问题处理排查完后,最后再处理单用户个性化问题。

4 结束语

端到端监控和主动运维是为了提升用户满意度,满意度的提升有两个目标:留住老用户、维护口碑扩展新用户。留住老用户的手段如:基于AI技术分析用户的基础数据、投诉数据、网络感知数据、网络性能数据、行为/业务使用数据,定位用户离网的短板指标,进而对用户离网倾向进行预测。扩展新用户的手段如:通过移动网络用户和宽带用户进行关联,通过大数据分析未使用移动宽带的移动手机用户,对该用户所属的小区的整体情况进行分析,得出网络建设和用户营销的目标小区和用户。

猜你喜欢
画像分值监控
威猛的画像
The Great Barrier Reef shows coral comeback
芍梅化阴汤对干燥综合征患者生活质量的影响
“00后”画像
画像
指印特征点编辑差异对档案指印匹配分值影响的实验研究
悄悄告诉你:统计这样考
你被监控了吗?
科学训练监控新趋势——适时监控
潜行与画像