构建“智慧公积金”的数据基石

2018-03-08 00:16谢雯
中国房地产·综合版 2017年12期
关键词:业务管理数据仓库公积金

谢雯

近年来,在大数据技术的推动下,数据仓库和数据挖掘技术得到了飞速发展和广泛应用,对住房公积金(下称公积金)行业来说,住房公积金数据仓库的建立和应用既是“智慧公积金”发展转型期的重要方向,也是顺应大数据时代发展的一次历史机遇。

一、数据仓库的定义及特点概述

随着各类信息管理系统的建立和运行,数据处理的重点已经从传统的业务处理扩展到在线分析处理,并从中得到面向各种主题的统计信息和决策支持信息。随着数据量越来越大,现有数据存储形式已经不能满足信息分析的需要,于是建立数据仓库的构想应运而生。“数据仓库”一词最早是在1990年,由美国的William H. Inmon博士提出,他将数据仓库(Data Warehouse)定义为:“数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理者的决策过程”。不同于数据库是事务系统的数据平台,其侧重于在线交易数据的存储,数据仓库是分析系统的数据平台,其存储的一般为历史数据,它从事务系统中获取数据,并做汇总、加工,为决策者提供决策依据。

二、目前住房公积金行业信息管理存在的主要问题

自从1991年建立住房公积金制度以来,各地的住房公积金管理中心一直都致力于信息系统的建设,目前信息系统的建设基本都是建立在数据库基础上的,经过多年的运行和数据积累,信息系统技术架构已经基本成熟,但在日常运行和管理的过程中仍面临如下问题。

1.数据缺乏统一管理和分析的能力

对于以事务处理为主要目标的住房公积金信息系统来说,在面对不同业务管理模式和规则时,通常会采用以业务类型和管理部门进行分别设计和开发的模式,数据库的设计与存储也多以业务类型分别存储,这样使得住房公积金信息系统对于数据缺乏统一规划和管理。信息不仅容易重复收集,而且容易形成众多信息孤岛,难以共享,从而造成信息难以分析和价值挖掘。举例来说,住房公积金业务系统中通常客户的公积金账户和贷款账户是独立设置和管理的,由于信息孤岛的存在,在造成查询和管理不便的同时,也容易使得骗提骗贷的风险增加。

2.历史数据准确性和完整性很难保证

住房公积金信息系统的建设目标是为了实现住房公积金业务办理和信息管理的电子化,而各地的业务规则和业务流程一直在跟随房地产市场和科技等的发展变化在不断优化和改进。住房公积金信息收集的过程中难免会带有历史背景的烙印,同时早期的信息都是靠人工录入为主,人为操作失误在所难免,这些都很难保证历史数据的准确性和完整性。例如,身份证号从15位升至18位的改变会造成系统中部分客户的信息不准确;同时系统中会存在录入错误导致的信息错乱和不一致情况。类似的情况在大多数的信息系统中几乎都会存在,数据的准确性会给数据分析的结果造成很大的影响。

3.数据分析需求增加和系统性能不足的矛盾日益明显

面对当前瞬息万变的房地产市场,住房公积金的使用频次和利用效率越来越受到住房公积金管理人员的关注。随着住房公积金信息系统的建立与运行,大量的基础性数据和业务处理信息形成并长期积累,住房公积金信息系统的发展方向已从业务信息的收集开始转向数据信息的在线实时分析处理,住房公积金管理人员希望能够从业务系统中获取有效的、一致的决策支持信息,以便及时准确地应对市场和外部变化带来的影响。然而,由于数据量越来越大,利用已有的数据库系统做分析查询应用将影响数据库事务处理性能,不能满足数据分析的基本需求。此外,随着住房公积金业务系统的全流程电子化推进,其业务系统的各类系统风险和操作风险增加,针对各类业务操作的风险分析需求越来越受到重视,但基于已有的数据库进行风险分析存在情况多、数据量大、变化快、效率低的难题,这给基于系统的风险分析带来了工作难度的加大和工作量的增加。综上所述,现有的数据库技术已无法满足决策分析和风险分析等各类分析需求。

4.异构数据库系统融合困难

众所周知,住房公积金信息系统都是逐步建立起来的,基于不同时期的计算机技术而建立起来的信息系统有可能会采用不同的数据库系统。这些独立且自成一体的数据库系统以不同的数据模式描述数据,使用不同的语言描述数据存储和操纵事务,它们无法通过计算机网络实现系统间的信息交换和结合,从而在信息系统中容易形成多个异构的、分散的数据库系统,出现大量的信息孤岛。

5.大数据挖掘需求无法满足和适应

近年来,随着住房公积金事业的发展和“互联网+政务服务”的深入,大数据平台已经成为发展的必然趋势。目前,南京、廈门等多地的住房公积金管理中心已经逐步同银行、房产、民政、人社、公安等多部门实现了信息共享,信息共享使得住房公积金的数据更加多样和丰富。随着共享数据库中的数据不断积累,对这些数据进行再利用和深加工不仅有利于各项便捷服务的开展,而且对住房公积金的管理和决策具有十分重要的指导意义。因此,对于住房公积金的大数据挖掘需求愈发强烈。然而,住房公积金传统的基于数据库的数据管理维度单一且以面向应用为主,无法适应变化多端的面向不同主题的多维数据分析和大数据挖掘需求。

三、住房公积金数据仓库系统的体系架构初步设想

住房公积金数据仓库系统的基本体系架构设计如图1所示,主要由数据源、数据仓库服务器、OLAP服务器、前端工具与应用四部分组成。

数据源是数据仓库系统的基础,即系统的数据来源,包含住房公积金业务系统中存储在内部数据库中的内部业务信息和从外联单位获取的与住房公积金业务相关的外部信息。

在数据源的基础上,经过数据清洗、抽取、变换、加载等过程,形成数据仓库的元数据,按照主题进行重新组织后,部分元数据形成数据集市(Data Marts)。数据集市是数据仓库的一个子集,主要面向部门级业务,并且只面向某个特定的主题。相比较企业级的数据仓库而言,数据集市就是数据仓库体系结构中增加的一种小型部门级的数据仓库,投资规模比较小,通过为特定用户预先计算好数据,从而满足用户对性能的要求,解决了灵活性和性能之间的矛盾。endprint

数据OLAP (联机分析处理)是针对某个特定主题进行联机数据访问、处理、分析,从多个维度、多种数据综合度对数据进行有效分析,最终通过前端工具和应用以直观的方式展现出来。

前端工具主要包括数据查询工具、自由报表工具、风险审计工具、数据分析工具、数据挖掘工具等各类基于数据仓库或数据集市开发的应用。

四、住房公积金数据仓库的实施意义和未来价值探讨

根据住房公积金事业未来的发展趋势,结合当前公积金信息系统数据管理上出现的各类矛盾,住房公积金数据仓库的实施具有十分重要的意义和价值,主要体现在如下几方面。

1.将推动住房公积金业务管理和信息管理体系的重构与整合

住房公积金数据仓库将与现有的公积金信息管理系统一并经过重构和整合后形成新的信息管理体系,该体系将具备完整的信息收集、信息处理、信息查询、信息分析等功能,可实现高效进行大批量信息处理和分析。信息管理体系的整合又将对住房公积金业务管理的改革带来积极的影响。以报表为例,数据仓库将逐步取代现有的各类业务管理统计报表系统,彻底改变现行的业务管理统计报表管理模式,不仅会提高各类业务管理统计报表适时和准确性,也将从各类业务管理统计报表工作岗位上释放大量的人、物和财务资源。

2.将有助于提高对住房公积金数据的价值认识和分析意识

长期以来,住房公积金数据信息未能得到深入分析和挖掘,以致于住房公积金的数据价值长期被低估,一定程度上也阻碍了住房公积金事业的推广和发展。住房公积金数据仓库的建立将为数据分析提供强有力的基础保障和工具支持,可以实现住房公积金各类业务数据和共享信息的内涵和价值的深入挖掘,在为广大缴存对象提供优质高效便捷服务的同时,更好地提升住房公积金的附加增值服务体验。这不仅可促使住房公积金管理人员跳出对数据长期“重收集、轻分析”的思维惯性,也有助于提升缴存职工和缴存单位对住房公积金的价值认知,打破对住房公积金价值低估的偏见。

3.将促进住房公积金业务管理水平的提升和风险防控能力

数据仓库的建立,将推动并践行“以数据助服务,用技术促管理”的实现,在一定程度上解决“数据爆炸、知识贫乏”的问题。利用数据仓库,住房公积金管理人员可实现多层次、多角度、全方位地审视住房公积金数据,加深对住房公积金业务的理解和认识,重新梳理住房公积金各类评价指标,形成科学的住房公积金指标评价体系,有效提高住房公积金管理决策的科学性和管理效率;通过数据分析,可以快速发现日常业务数据的异常、趋势、差异,以便更好地做出管理和决策,有效提升住房公积金信息管理的风险防控水平,确保住房公积金的资金安全。

4.将有效缓解现有住房公积金业务系统信息处理的压力

数据仓库承担了面向决策和管理的各类住房公积金业务管理活动历史数据的存储和管理工作,这将有效缓解现有以面向事务处理为主的住房公积金业务系统处理各类管理信息分析需求的压力,使之能更专注于信息收集和信息处理,提升系统性能和数据处理效率。同时,由于数据仓库实现了业务系统信息数据的共享,因此在数据采集环节还可以大量减少信息数据的重复采集工作,提升业务系统运行的效率。

5.将有效提升住房公积金的数据质量和存储安全性

住房公积金的业务系统中存储着大量与日常业务管理相关的历史数据,通过数据仓库的数据清洗功能,可以对一些重要的错误数据进行有效梳理和掌握,在此基础上提升住房公积金的数据質量。同时,利用数据仓库的建设和实施还将对这些历史数据进行有效保护和二次备份。

6.将有效解决信息孤岛的技术难题

数据仓库可以从异构的数据库系统中使用统一的全局模式来描述数据,并将这些数据集成在数据仓库中,通过数据仓库提供的统一的数据接口对数据进行统计分析,最终支持决策者的决策过程。数据仓库可成为连接各业务模块间信息交流的桥梁,将减少甚至消除“信息孤岛”现象,有效发挥现有各类业务管理系统的整体效益,并推动信息管理标准化建设工作的进程。

五、结语

目前,国内几乎所有的商业银行都已经将数据管理作为未来重点发展的方向之一,大多数商业银行已经建成数据仓库或大数据分析平台,并产生了良好的经济效益和社会效益。然而,在住房公积金行业中仅有少数几个城市建有数据仓库,住房公积金数据管理水平的提升迫在眉睫。因此,参照目前住房公积金信息管理的发展趋势,从为广大缴存职工实现更好服务的角度出发,我们应尽快建立起数据仓库,重构住房公积金的信息管理体系,为“智慧公积金”的实现构建良好的数据基石。

李求军/责任编辑endprint

猜你喜欢
业务管理数据仓库公积金
基于数据仓库的住房城乡建设信息系统整合研究
综合业务管理平台的设计与开发
大学生缴存公积金,这个可以有
基于“互联网+”的高速公路清障业务管理平台设计
分布式存储系统在液晶面板制造数据仓库中的设计
探析电力系统调度中数据仓库技术的应用
基层台站综合观测业务管理之我见
基于数据仓库的数据分析探索与实践
谈如何做好环境监测业务管理