电信企业CRM应急系统设计与实现

2014-02-14 01:37孟利青常润梅
电信工程技术与标准化 2014年2期
关键词:连续性灾难逻辑

孟利青,常润梅

(1 中国移动通信集团内蒙古有限公司,呼和浩特 010020; 2 内蒙古电子信息职业技术学院,呼和浩特 010070)

电信企业CRM应急系统设计与实现

孟利青1,常润梅2

(1 中国移动通信集团内蒙古有限公司,呼和浩特 010020; 2 内蒙古电子信息职业技术学院,呼和浩特 010070)

电信业随着移动互联网的发展,企业运作越依赖于IT架构,对信息系统运作的稳定性和可靠性的要求就越高,业务连续性将是最重要的竞争力。为保证7×24 h运营,除灾难恢复外,还需要制定业务连续综合计划。保证高度可用性和连续运营能力是企业成功的关键。企业需保证系统,关键应用和数据受到保护并处于可用状态,发生停机或灾难后运营可以继续。通过利用底层数据复制技术和逻辑复制技术构建的应急系统,切换回切时长在分钟以内,保障了业务连续性,对用户无感知。

CRM应急系统;逻辑复制;灾难恢复

业务连续性是企业信息管理不可回避的问题,IT在企业提高企业竞争力的同时,也带来了新的挑战。例如企业需要缩小数据备份窗口,以解决存储容量逐年增长的问题。关键数据和应用不加以保护,当发生意外时,无论是软件小故障,还是受病毒入侵或天灾造成的,都会影响客户关系和产能,使经济受到严重影响。为此,每一企业都需要制定完善的,业务连续性计划。企业运作越依赖于IT架构,就对信息系统运作的稳定性和可靠性的要求越高。所以IT系统的完善程度,提供全天候业务运作,是竞争力的一个最重要的前提,即业务连续性的重要性。企业的业务持续计划的设计不是一蹴而就的简单步骤,应该是一个持续并循环往复的过程,每一阶段都能持续不断的改进,并且在实际工作中体现有效性与高效性。应急系统的建设解决了这一难题。

1 CRM应急系统功能

企业要保持业务连续性,最大的威胁并不是来自于火灾、地震等小概率、大影响的灾难,相反,企业的业务更多地受到诸如人员错误、流程缺陷等事件的威胁。虽然它们对经济的影响力远不如那些重大灾难,但是它们却时刻潜伏在企业的周围,随时一触即发,同样会对企业造成致命的打击。

业务连续性是指企业有应对风险自动调整和快速反应的能力,以保证企业业务的连续运转。为企业重要应用和流程提供业务连续性应该包括以下3个方面。

(1)高可用性(High Availability):是指提供在本地故障情况下,能继续访问应用的能力。无论这个故障是业务流程、物理设施、IT软/硬件的故障。

(2)连续操作(Continuous Operations):是指当所有设备无故障时保持业务连续运行的能力。用户不需要仅仅因为正常的备份或维护而需要停止应用的能力。

(3)灾难恢复(Disaster Recovery):是指当灾难破坏生产中心时在不同的地点恢复数据的能力。灾难恢复的特点是在不同的地点不同的硬件设备上流程。

同时3个部分又不是相互孤立的,是相互关联,而且有交叉的。

2 CRM应急系统建设方案

2.1 CRM应急系统架构(如图1所示)

图1 CRM应急系统建设架构图

传统的容灾中心解决的主要矛盾为数据安全性,并不能解决业务连续性。因为容灾中心的服务器处于非活动状态,不提供服务。启用流程复杂,切换、回切时间超过1 h。通过对生产系统的数据,做一份准实时镜像,构建成应急系统实现业务连续性。由于应用服务器采用的集群架构,可实现自动重连、负载均衡,不需要单独部署。

3.2.1 医院等级 通过不同医院级别护士及其配偶主观幸福感的比较,1级医院护士主观幸福感高于2、3级医院,这可能是由于1级医院床位数有限,且大部分收治的是老年慢性病患者,该类患者病情相对比较稳定,且与2、3级医院比较,1级医院的床位周转率相对较低,而2、3级医院收治的患者病情比较重,疑难杂症也相对较多,对护士不断掌握新技术新知识的要求也日益提高,因此护士的工作强度及工作风险相对较大有关。

2.2 CRM应急系统数据复制原理

业界一些准实时备份数据库软件,即逻辑复制软件,其原理大同小异。都是针对oracle数据库的日志变化,然后解析日志为SQL语句,然后在目标库上进行回放,完成数据的逻辑变化的同步。

复制之前要求初始化的同步,即利用存储复制软件实现系统底层同步,同步操作步骤简单,周期短。然后,再利用复制软件进行增量的逻辑同步,达到准实时的要求。延迟时间从秒到分,及小时都有可能,与生产系统的业务量大小有关。

2.2.1 初始化数据同步

使用存储公司的底层数据复制软件。存储复制是基于同一盘阵磁盘间进行镜像原理,实现准实时的数据同步、备份,保证数据的完整性和一致性。TB级容量的系统初始化同步在分钟级别。如图2所示。

图2 存储底层复制原理图

2.2.2 增量数据同步

应急系统的应用同步是使用逻辑复制软件,采用实时解析生产数据库的Redo-Log原理达到源端、目标端数据准实时的目的。逻辑复制原理图如图3所示。

图3 逻辑复制原理图

2.3 方案优势

2.3.1 复制方案先进

采用底层复制加逻辑复制技术,实现快速部署。单采用底层复制,目标系统平时处于非活动状态,资源利用率低,浪费成本。单采用逻辑复制,目标系统部署耗时长,TB级数据需要几天时间,如果应急系统复制过程中遇错误或业务量突增时,不能达准实时需要初始化时,无法实现,周期太长。采用两种技术的结合,解决以上问题。

2.3.2 全业务连续性得到保障

切换接管时间可达到秒级,切换步骤、回切步骤简洁,可实时双向的数据复制,数据无丢失,数据一致性强,达到业界最到的RTO,RPO。

2.3.3 报表业务更新

报表服务对电信企业的成本开销较大,对生产系统的稳定性影响较大,内部客户满意度较低。传统的报表在生产系统执行,利用新建的CRM应急系统,将报表业务迁移到应急系统上,提高资源利用率,减少对生产系统的压力,降低了生产系统的故障,提升了业务连续性。

2.4 切换流程(如图4所示)

图4 应急系统使用流程

应急切换启动原则:

(1)生产中心无法承载业务。(2)30 min之内决策是否切换。(3)确定a.可忍受中断时长b.切换时长c.预留时长。修复时长> a b c 则切换。(4)如果30 min内无法判断修复时长,则切换。

3 总结

应急体系建成以后,CRM系统退服时间指标逐月下降,客户投诉率指标下降明显,CRM系统客服满意度指标上升明显,话费信息获取速度、缴费成功率、开机速度都大大提高,营业厅很少遇到故障,应急系统的贡献明显。根据业务部门内部评价、集团考核和外部客户满意度调查的结果,CRM系统的满意度将会处于全国前几名的位置。系统每天的计划外退服时长缩短了几十倍,应急系统建设之前,每年的退服时长在几百分钟,现在,每年的退服时间达到30 min以内,用户端几乎感受不到系统停顿。每万用户的支撑类投诉比从0.4下降到0.05左右。缴费开机的速度也大大加快,由原来的几分钟达到目前的平均几秒数量级。

Design and implementation of CRM emergency system of telecom enterprises

MENG Li-qing1, CHANG Run-mei2
(1 China Mobile Group Inner Mongolia Company Limited, Huhehaote 010020, China; 2. Inner Mongolia Electronic Information Vocational Technical College, Huhehaote 010070, China)

With the development of mobile Internet, the operation of enterprises more and more dependent on the IT architecture, the information system operation stability and reliability requirements of the higher, business continuity is the most important competition. In order to ensure the operation of 7×24 h, in addition to the disaster recovery, also need to develop business continuity planning. To guarantee high availability and continuous operation ability is the key to success of enterprise. Enterprises need to ensure the system, the key applications and data is protected and available, happen downtime or disaster operations can continue to. By exploiting the underlying data replication emergency system and logic replication technology building, switch back to cut the time in minutes in, ensure business continuity, no perception of users.

CRM emergency system; logic replication; disaster recovery

TP3

A

1008-5599(2014)02-0049-03

2013-11-23

猜你喜欢
连续性灾难逻辑
刑事印证证明准确达成的逻辑反思
雷击灾难
逻辑
创新的逻辑
不可压缩Navier-Stokes方程解的非线性连续性
非连续性实用类文本阅读解题技巧例谈
灾难报道常见问题及反思
灾难来临,我不怕——科技馆一日游
女人买买买的神逻辑
半动力系统中闭集的稳定性和极限集映射的连续性