基于数据挖掘的江苏省质量安全评价与网络预警方法研究

2020-09-17 13:26喻晓筠张明斐
中国质量与标准导报 2020年4期
关键词:质量评价数据挖掘

喻晓筠 张明斐

摘要:针对质量安全评价和预警理论与技术缺陷而导致的质量安全问题频发的重大现实问题,基于国际国内的比较研究,论文以江苏省质量安全信息监测与预警服务平台为实例,为提高质量安全评价与预警的科学性和有效性,提出了建设质量安全实时在线网络预警系统的建议。

关键词:数据挖掘 质量评价 网络预警

Research on Quality and Safety Evaluation and Network Early Warning Method of Jiangsu Province Based on Data Mining

Yu Xiaoyun, Zhang Mingfei

(Inspection and Testing Standard Certification Research Institute of Changzhou )

Abstract: In view of the major practical problems of frequent occurrence of quality and safety problems caused by the defects of quality and safety assessment and early warning theory and technology, based on the comparative study at home and abroad, this paper takes Jiangsu Province quality and safety information monitoring and early warning service platform as an example, in order to improve the scientificity and effectiveness of quality and safety assessment and early warning, puts forward the construction of quality and safety real-time online network early warning system recommendations.

Key words: data mining, quality evaluation, network early warning

1 引言

近年来,我国的质量安全事故频发,各级各地政府为此采取各种举措来管控质量问题,但绝大部分措施都以事后维护为主,这种滞后性必然导致大量的质量安全隐患不可能被发现,从而导致质量安全评价和预警失灵,进而使现有质量安全监管模式不能发挥应有作用。本文结合江苏省实际运用,从消费者质量信息数据挖掘的角度来对质量安全评价与网络预警方法进行研究,以期从源头管控来把好质量关,为质量监控体系提供新的研究思路。

2 国内外研究综述

国外预警技术模型与方法起源于美国在20世纪初创立 的“改良—责任”评估法,后逐步演变为决策导向评价模型、概率暴露评估模型、决策评估法、相对潜力因素评估法(RPF)等, 1994年提出了经典的关联规则挖掘的算法,即Apriori算法,后经研究人员对Apriori算法进行不断优化,对关联规则的应用进行推广,提出了不产生候选集的FP-Growth算法等。国内学者通过实证研究发现,宏观质量统计与分析的研究最主要的指标应是产品质量伤害和顾客满意状况的评价,而数据挖掘技术的快速发展又为这一研究赋予了新的手段,提出了指令信息、動态信息和反馈信息3种质量信息分类方法,以及具有关联规则分析功能的通用质量管理信息系统框架,但对如何通过互联网获得质量安全信息,特别是通过语义分析,来挖掘源于互联网的质量安全信息尚处于起步阶段。

3 国内质量安全评价与预警现状及问题原因

目前,我国进行产品质量监管的主体是国家行政部门,产品质量监管的主要方式包括行政许可、标准认证、监督检查等,其监管的本质就是总体质量信息的监管,而总体质量信息的基础是不同的参与主体,诸如质量供应方、质量需求方、质量监管方和质量第三方。由于各类参与主体掌握的质量信息量不同,造成了总体质量信息的不对称性,从而导致一些质量安全问题的出现。

(1)质量风险信息来源单一、数据量较少。从目前情况来看,政府部门的质量风险信息来源主要来自对产品的检验检测的质量数据,来源单一且数据量较少,但随着科技水平的快速提升,检测技术在浩如烟海的产品面前越来越力不从心,质量监管方掌握的信息量越来越处于弱势地位。

(2)缺乏系统的质量安全评价方法,主要依靠专家研判为主。当前政府质量监测与预警数据主要来源于工作中的检验检测,但并没有形成系统有效的质量风险评价与预警方法,依靠专家研判为主的工作例会风险分析研判制度,受专家主观影响程度较大。

(3)缺少智能化的预警及响应系统,预警不及时。造成这种现象的原因一方面是由于当前质量信息获取手段单一,另一方面还在于当前我国质量安全监测与预警体制不够完善,风险信息由基层向高层层层上报审核、指令任务层层下达的工作机制对预警与响应的及时性非常不利。

我国现有的质量安全评价与预警在理论上和技术上存在着双重的缺陷。理论层面上从基础理论对质量、质量安全、质量安全信息进行深入的研究,是建立科学的质量安全评价和预警的基础;技术层面上对质量安全评价与预警信息的获取,要通过现代网络和智能技术手段,实时获取来自于消费者的质量安全信息。

4 基于数据挖掘的江苏省平台实现

“江苏省质量安全信息监测与预警服务平台”是以公共互联网为载体,消费者信息来源为渠道,为消费者、企业和政府提供质量信息服务,特别是基于消费者的“第三方”质量安全信息服务的产业化平台。主要包含四大系统:质量安全数据采集系统、质量安全数据处理系统、质量安全数据分析系统、质量安全数据应用系统,平台总体架构和具体情况如图1所示。其中,质量安全数据采集系统的数据采集对象,主要是互联网上消费者的切身感知信息,以及其他机构和政府部门的质量安全信息。质量安全数据处理系统主要是针对子系统采集的数据建立各行业数据库,并对数据进行清洗、转换、分类、打标和整合。质量安全数据分析系统从功能上划分为语料库管理、数据统计、数据分析、报表工具、客观分类体系和数据检索6个部分。质量安全数据门户应用系统利用系统海量的数据,进行深度的挖掘和分析,为政府和企业提供质量数据决策支持、跟踪预警,为社会和各行业提供质量安全状况、消费指南等增值服务。

5 平台创新

平台基于互联网产品质量信息识别和预警方法设计的理论创新,研究了网络质量信息语言与质量安全之间,在语义上的转换、逻辑和相关性,将成熟的互联网搜索技术、数据挖掘技术与中文质量安全语料库、质量安全评价体系集成于一体,实现了对产品质量安全风险的评价,是典型的集成技术创新。

(1)基于分布式及元搜索的质量安全数据采集

平台采集程序采集对象主要是互联网网站和网页,数据源主要有两种,一是通过指定范围的网站对其进行抓取采集,支持新闻、博客、论坛和微博采集;另一种是通过百度、谷歌、奇虎等搜素引擎根据关键词进行全网的数据采集。

(2)基于中文的质量安全语义分析

对互联网上所获取的消费者质量安全信息进行语义分析,并构建反映汽车、食品、服务业等质量安全特征的行业语料库,通过语义分析和挖掘技术,对监测数据进行语义分析和提取,通过知识元提取、信息分类和聚类相关技术实现信息的深层次过滤和挖掘。

(3)基于消费者质量安全网络信息的第三方评价体系

基于自主知识产权研究开发的“质量安全风险评价体系”通过搜集、汇总网上来自于消费者的各类质量安全信息,并对搜集到的信息从安全性、服务质量、产品性能、经济性等多个方面进行分类,并在此基础上深度挖掘,最终形成质量评价的多维度分类体系。

6 对策和建议

消费者是最主要的质量安全信息源,质量评价与预警应当主要依靠互联网监测和收集的、来自于消费者的海量质量安全信息,建立通用和行业专业质量安全的评价指标和体系,借助语义分析、数据挖掘和知识管理等信息网络技术,支撑质量安全实时在线网络预警系统的建立,从而提高质量安全评价与预警的科学性和有效性。

(1)明确消费者是最主要的质量安全信息源,以消费者作为质量评价的主体有利于实现质量安全评价的科学性、预警的及时性与准确性,而且也有更低的成本去激励其输出质量信息,基于消费者的质量安全信息服务产业化平台具有更多优势。

(2)质量安全评价的重点在于海量质量安全信息数据甄别,通过分析消费者质量安全信息的语言语义,获得其与消费者质量安全信息的关联关系,以多种分类算法评估质量安全信息,获得语料库对质量安全状态最准确的反映。

(3)在质量分析指标体系基础上,应用云计算、数据挖掘等数据处理方法,并与质量评价与预警要求相结合,开发多样化的质量评价与预警方法,再辅以专家在线预警系统,共同进行质量安全风险研判。

参考文献

[1] 方永美,熊俊涛,杨振刚,等. 基于贝叶斯网络数据挖掘的蔬菜质量安全分析[J]. 湖北农业科学,2016(23):6253-6257.

[2] 施晓彦,曹喆岫,陈超,等. 基于大数据的电商产品质量评价研究:以儿童木制玩具为例[J]. 广西财经学院学报,2017,30(5):64-83.

[3] 玄冠华,屈雪丽,林洪,等. 中国食品质量安全风险预警预报技术研究进展[J]. 中国渔业质量与标准,2016,6(3):1-5.

[4] 李圣軍. 互联网时代农产品质量安全智能化监管模式研究[J]. 农产品质量与安全,2016(4):9-13.

[5] 丛晶,杨波,王乙红,等. 数据挖掘在医疗质量安全监控系统应用的可行性研究[J]. 中国医院管理,2013,33(2):45-47.

猜你喜欢
质量评价数据挖掘
数据挖掘技术在内河航道维护管理中的应用研究
数据挖掘综述
软件工程领域中的异常数据挖掘算法
水泥混凝土灌注桩质量监督检验及缺陷防治
不同栽培措施对党参药材化学质量的影响
BP神经网络在软件质量评价中的应用研究 
“中职+应用本科”会计专业人才培养质量评价体系的构建
技工院校校级领导职业素养的建设及质量评价研究
基于R的医学大数据挖掘系统研究
一本面向中高级读者的数据挖掘好书