大数据产业统计系统的设计及应用

2020-03-16 02:31崔晓君
电子技术与软件工程 2020年24期
关键词:汇总上海市系统

崔晓君

(中国信息通信研究院华东分院 上海市 200000)

1 引言

大数据产业是新兴产业,尚无明确的统计口径,大数据产业统计工作更是没有经验可循[1]。为支撑大数据产业发展,探索建立一套科学高效的大数据产业统计系统尤为重要。本文着力于支撑政府决策,推动上海市大数据产业发展,创新性探索大数据产业统计制度方法,率先进行大数据产业统计系统的研究与设计,一方面提高产业主管部门统计工作工作效率,方便企业填报,另一方面获得大数据产业基础数据,为决策提供数据支撑[2]。

1.1 主要目标

调查上海市大数据重点企业的发展规模、关键技术、收益和支出等内容,实现上海市大数据产业的数据采集、统计分析,支撑上海市大数据产业发展。

1.2 统计范围与统计对象

不同出发点对大数据产业范围的界定结论有所不同[3],本次统计系统建设以工信部发布的《大数据产业发展规划(2016-2020)》中对大数据产业的界定为基础,同时结合上海市大数据产业的实际情况,采用重点调查的方式加以实施[4]。开展大数据企业分类模型研究(如图1:大数据企业分类示意图),通过企业国民经济分类、专利、软著、招聘信息、经营范围、企业基本情况、工商数据等开展数据分析,形成大数据重点企业名录库,作为统计对象。

1.3 统计指标

目前没有专门的针对大数据产业的统计分类,而是包含在软件与信息服务业中统计,本次系统设计需要首先进行大数据产业统计制度研究。

本次统计的目的是满足政府宏观管理决策的信息需求。统计指标体系的设计以此为基础,通过全国各地发布相关大数据政策文件视角开展研究,梳理全国各地政府宏观决策对大数据产业的主要信息需求。总结全国各地各项大数据政策指标,同时结合上海市对于大数据产业发展特定的信息需求指标,对于大数据产业整体发展的主要衡量指标主要包括大数据产业总产值、增加值、大数据核心企业数、经费投入、核心人才。

综上,本次设计大数据产业统计指标共28 项,包括:

(1)期末资产负债(数据资产相关硬件原值、数据资产相关硬件净值、数据资产相关软件原值、数据资产相关软件净值);

(2)损益及分配(营业收入、其中:大数据业务收入、营业成本、营业利润、所得税费用、研发费用);

(3)人工成本及增值税;

(4)从业人员(从业人员期末人数、从业人员平均人数);

图1:大数据企业分类模型结构示意图

图2:上海市大数据产业统计工作流程图

图3:大数据产业统计系统功能模块结构图

(5)研究开发人员情况(研究开发人员合计,其中:硕士及以上人员,本科人员,专科及以下人员);

(6)研究开发产出及相关情况(当年专利申请数、其中:发明专利、期末有效发明专利数、发表科技论文、形成国家或行业标准);

(7)合同成交情况(大数据行业解决方案合同成交量、大数据行业解决方案合同成交额、大数据产品市场合同成交量、大数据产品市场合同成交额);

(8)其他(是否上市、是否为高新技术企业)。

2 系统设计的目标

系统设计的目标是设计并开发一套满足上海市大数据产业统计需求的软件系统,实现上海市大数据企事业(单位)的基本信息及主要财物指标数据的录入、修改、查询和汇总,通过软件系统的设计,减轻企业和政府部门填报及统计工作量,提升工作效率。

3 统计工作流程

此次通过统计系统,开展上海市大数据产业统计工作流程包括四个主要方面(如图2 为上海市大数据产业统计工作流程图),即上海市各区大数据重点企业名录库建设、各区开展大数据重点企业专项调查工作、各区统计数据的初审、汇总与上报、全市大数据统计数据的汇总与分析。

4 软件系统的设计

4.1 系统的软件架构

技术体系上选用J2EE 技术,采用Browser/WebServer/DataBase Server 三层结构进行应用系统的开发,B/S/D 三层结构实现数据与应用逻辑分离,简化应用系统的分发、配置管理和版本管理工作。

4.2 系统数据处理流程

各大数据企业通过系统完成填写报送;各区县用户在系统内及时开展数据初审,并将初审结果在系统内完成提交,同时可进行本区填报数据的查询、汇总、分析;市级用户对报送信息进行复核,完成全市大专项统计调查的数据汇总和分析工作。

4.3 系统功能设计

上海市大数据产业统计系统根据大数据产业统计特点(采用企业法进行统计/统计指标体系首次使用),同时满足常规产业统计基本要求,功能设计包括数据采集/数据传输/综合查询与汇总/数据质量管理/数据备份与恢复/系统管理维护六大功能系统模块(图3 为大数据产业统计系统功能模块结构图)。

4.3.1 数据采集子系统

系统支持在线填报,提供表单式的填报界面。主要实现大数据企业基本信息及其主要财务指标数据、业务指标数据的录入/修改和查询等功能。

4.3.2 数据传输子系统

该系统主要完成数据的上报和接收,以实现数据的逐级汇总。其中数据上报操作主要用于将企业填报的数据导出,生成汇总数据,数据的导出分为批量导出和逐项导出。导出的数据可以保存为PFD、EXCEL 和文本等格式的文件。数据接收主要用于主管导入企业上报上来的数据,以实现系统数据的汇总功能。

4.3.3 综合查询与汇总子系统

该系统的功能是对汇总后的统计数据进行查询、分析、汇总统计。系统支持全文检索,可通过选定的组合条件来精确查询和模糊查询,并可对查询结果进行二次渐进式查询,逐步缩小查询范围。同时设计拖拽方式的可视化界面,实现数据的统计、汇总,针对数据指标展现与分析的要求,提供强大的图形展现能力,除支持常规图形,如:饼图、柱状图、折线图、散点图、雷达图、瀑布图、玫瑰图、气泡图、分区面积图、堆积图、卡特图外,还支持三维图、企业驾驶舱、交通灯、瀑布图、工程进度图、动态地图(MAP),等特色图形展现。同时支持将汇总统计的结果以文件或图表等形式导出,以供使用。

4.3.4 数据质量管理子系统

为了确保高质量的统计数据,系统设计从采集、上报、审核、分析的各个环节入手,建立数据质量管理机制。首先对系统填报涉及的统计指标从名称、统计口径、计算方法进行规范,鼠标在指标上悬浮时,进行该项指标的解释及计算方式介绍。对于上报数据系统自动按照设定的核查条件进行校验,对填报空数据、异常值、失真值进行提醒,要求用户修改或填写备注说明情况;审核人员审核上报数据,对所有异常数据进行着重排查,核对异常数据的情况说明,发现问题及时通过电话联系核实情况或退回并要求填报人员重新上报,确保数据的准确性、完整性。

4.3.5 数据备份与恢复子系统

该系统功能是完成统计数据的备份与恢复,以使系统的物理故障或其他不安全因素给系统带来的损失降低到最低程度,保障数据的安全性。

4.3.6 系统管理维护子系统

该系统主要包括统计系统用户管理、权限管理、系统日志管理等功能。用户管理实现管理用户和使用用户的细度管理,包括对内提供系统权限配置功能,对外提供权限验证接口。权限管理实现对系统、功能、菜单、页面元素、数据等不同粒度的资源的授权。系统日志管理实现用户操作跟踪、功能使用跟踪。

5 系统的应用

上海市大数据产业统计系统已经在上海市投入使用,2020年已完成上海市1000 余家大数据企业专项填报工作。目前系统运行良好,操作简单、数据有效性检查严格。该系统的建设和应用,一方面为我国探索大数据产业统计方法和途径提供了有效尝试。另一方面可满足上海市大数据产业主管部门利用数据的需要。

猜你喜欢
汇总上海市系统
常用缩略语汇总
上海市风华初级中学
WJ-700无人机系统
上海市房地产学校
基于PowerPC+FPGA显示系统
腾势400 用在上海市区的来回穿梭克服里程焦虑
连通与提升系统的最后一块拼图 Audiolab 傲立 M-DAC mini
上海市制冷学会四专“双·阳”行
供应商汇总
供应商汇总