互动电视流化系统部署研究

2018-11-26 11:38张少欣
新媒体研究 2018年16期
关键词:负载均衡故障检测

张少欣

摘 要 文章提到的流化系统,在不改造终端、不移植客户端的情况下,解决了云媒体业务推广过程中严重影响新业务、新技术拓展的大量浏览器终端配置较低、型号较老、标准不统一等问题,提升了互动电视业务在浏览器终端上的操作体验。文章描述的负载均衡管理和故障检测流程,能有效保证系统的安全性、稳定性,进一步提升了用户体验。

关键词 流化系统;负载均衡;故障检测

中图分类号 G2 文献标识码 A 文章编号 2096-0360(2018)16-0034-02

江苏有线在全省进行云媒体业务的推广过程中,各地市和区县存在的大量浏览器终端存在配置较低、型号较老、标准不统一、无法升级成云媒体版本等问题,使得大量具备盈利前景的业务无法在全省进行统一下发,严重阻碍了互动电视新业务、新技术的拓展。

文章描述的流化系统,采用了免移植方案,在不改造终端、不移植客户端的情况下,可以提供快速部署、统一业务体验的应用服务,带给不同终端的非云媒体互动用户统一、高质量、低延时的用户体验。

1 系统组成

根据功能,流化系统主要包含接入网关型路由服务器、流化引擎服务器和管理服务器三种类型的服务器。

1)接入网关型路由服务器(CSR)。负责集成库客户端或者浏览器Javascript客户端(免移植方式)的云端接入。实现HTTP协议和流化协议的转换(免移植)。根据多种业务逻辑进行流化服务的业务路由,为每次请求选择最适合的流化引擎来提供服务:基于服务类型;基于地域位置;基于服务优先级;基于负载均衡;基于机顶盒型号或用户类型。会话管理和用户历史记录的存取。

2)流化引擎服务器(CSE)。负责HTML5应用在前端的运行和渲染,实时响应终端的键值请求;对云端的渲染输出进行实时捕获、编码和播出,支持IP ES的播出和QAM TS播出的双模方式;无缝的跨服务器业务切换;会话管理;与IPQAM资源管理的集成。

3)管理服务器(CSM)。负责系统的整体配置、监控和日志报表:服务器级别;业务级别;整体系统级别。通过模拟流化请求并监测码流的方式实现业务层面的设备监控。统計分析:并发分析;带宽分析;使用时长分析;PV/UV;系统故障率。

2 网络架构

流化引擎服务器:具有两个电口,一个用于信令,一个用于推流。管理服务器、接入网关服务器均为2个业务口。

根据端口需求,各类设备先接入业务汇聚交换机,然后信令由业务汇聚交换机上联至信令核心交换机;推流由业务汇聚交换机上联至推流核心交换机。网络架构如图1所示。

由于是直接面向电视用户的系统,系统必须充分保证7×24小时的安全播出,因此,需部署主前端系统和备份中心系统两套互为备份的系统,且两套系统必须满足数据一致性、业务可用性、操作可行性要求。

3 负载均衡管理

接入网关型路由服务器和管理服务器通过F5[1]的四层负载均衡、采用轮询方式进行负载均衡管理,流化引擎服务器采用CSR自带的七层负载管理。

1)接入服务器四层负载均衡管理。如图2所示,所有CSR服务器以一个CSR组的方式工作,同一个组内的CSR服务器间支持实时的Message Queue同步。管理系统下发的业务路由策略(含故障时移除服务器的修改)会通过四层交换发送至其中一台CSR服务器上,在所有CSR服务器上即刻同步,并在每台服务器上以配置文件方式保存下来。

在免移植方案中,CSR服务器用来实现终端和流化引擎服务器的中转连接,并将基本会话信息存储于共享的Oracle数据库中。当某台CSR服务器故障时,用户请求重连至其他CSR服务器,通过查询Oracle系统中关于该终端的会话信息,实现业务的无缝恢复。

一般情况下,用户请求只向主前端系统的四台接入服务器进行转发,当主前端系统整体故障时,切换至备份中心系统的接入服务器。

2)管理服务器四层负载均衡管理。如图3所示,实时监控信息和统计分析的日志数据通过四层交换负载均衡地发送至主前端系统的两台管理服务器上,任何一台管理服务器出现故障,剩余的一台都可以独立完成工作。通过共享Oracle数据库以及定期统计分析文件拷贝镜像的方式,实现主前端系统和备份中心系统管理服务器的数据同步。

一般情况下,仅主前端系统的两台管理服务器提供服务。当主前端系统的管理服务器出现故障时,才通过四层交换切换至备份中心系统的管理服

务器。

4 故障检测服务器检测方式

为了提高系统的可用性,及时发现故障服务器,系统中部署了故障检测服务器。由于故障检测原理基于流化服务的软硬件,所以实际部署中可抽取流化引擎服务器作为故障检测服务器。检测流程如图4所示。

故障检测的流程为:1)故障检测服务器周期性检测并校验流化引擎服务器的图像输出内容;2)如果被检测的流化引擎服务器输出内容出现问题,包含画面质量等服务状态问题,故障检测服务器将故障服务器通知接入网关型路由服务器,接入网关型路由服务器将此台服务器从路由表中去除;3)接入网关型路由服务器报告至管理服务器;4)管理服务器发出对应告警信息。

当故障服务器问题解决后:1)故障检测服务器将通知接入网关型路由服务器,接入网关型路由服务器将此台服务器加入路由表中;2)接入网关型路由服务器通知管理服务器;3)管理服务器解除对应告警信息。

5 总结

通过在流化系统的部署过程中充分考虑负载均衡策略和备份系统的建设,并增设故障检测服务器,满足了系统的安全性、稳定性要求,进一步保证了低延时、高质量的用户体验要求,有利于加快云媒体业务在全省各类型终端上无差别地推广。

参考文献

[1]F5 Networks,F5 LTM配置指南[EB/OL].www.f5.com.cn,2011.

猜你喜欢
负载均衡故障检测
Linux负载均衡集群技术在网络服务器中的应用
Oracle MAA在汽车行业电子政务平台中的应用
异构环境下改进的LATE调度算法
基于定子逆序的电机同步速变换故障检测算法
优化网络设备维护提高数据通信传输质量
基于负载均衡的云资源调度策略研究
新型探测线圈浅析
暖通空调系统故障检测与诊断技术探讨
多站点同步更新系统的设计
模糊理论在Ad hoc网络通信领域的应用