基于数据挖掘的道路交通事故分析研究

2019-10-21 02:05胡国超
名城绘 2019年1期
关键词:数据仓库道路交通数据挖掘

胡国超

摘要:将数据挖掘技术应用在交通事故分析过程中,可以加强交通事故的研判准确性,将传统交通事故统计分析系统中存在的问题合理解决,加强交通事故分析的信息化、科学化。综上所述,本文将基于数据挖掘技术对交通事故分析系统进行构建,以期加强统计分析、关联分析、挖掘分析等多项功能。

关键词:数据挖掘;道路交通;交通事故分析;数据仓库

我国信息技术水平的不断提升,各行各业都开始应用大数据技术。我国的道路交通行业在对人、车、路等多方面进行管理时,会生成海量的动态、静态交通数据,因此使用数据挖掘技术,可以加强道路交通管理的水平,还可以加强交通事故信息分析系统的运行效果。

一、基于数据挖掘技术的道路交通事故分析系统流程设计

基于数据挖掘技术的道路交通事故分析系统可以从交通管理综合应用平台获得相关数据,从而对数据进行统一分类管理在对分析系统流程进行设计的过程中,需要成立交通事故信息综合分析数据库,将其作为基础,对交通事故的相关信息进行统计分析,驾驶者出现违反交通法律信息等与数据技术存在直接关联,并且将历史数据的预测分析作为基础提供可视化分析功能,之后将分析与挖掘之后的结果输出,从而对交通事故信息进行综合分析与研究判断。

二、基于数据挖掘技术的道路交通事故分析系统整体功能设计

在对数据挖掘技术的道路交通事故分析系统整体功能的设计过程中,其中应包含事故统计分析、关联分析、数据挖掘分析等分析功能,在交通事故的统计分析中包含事故任意分析、特点分析、事故原因综合分析。

三、基于数据挖掘技术的道路交通事故分析系统详细功能设计

(一)事故统计分析功能

在對交通事故进行统计分析的过程中,会对原有的交通事故统计分析进行拓展,使原有的统计分析功能获得完善与优化,还可以对原本没有分析的项目扩展,将原有需要改进的项目进行优化。其中包含交通该事故信息任意分析、交通事故特点综合分析等方面。

在任意分析的过程中,需要将时间、任意条件等数据开展单项或组合式的分析。在对交通事故特点进行综合分析时,需要增设片区统计[1]、大城市交通事故综合统计分析等相关功能。

(二)关联分析功能

1.交通事故与驾驶员的信息关联分析

为了对不同驾驶证种类持有者进行数量统计与分析,对相同、不同区域内的驾驶员数量与交通事故之间的关系进行分析,还会对不同驾照类型与每万驾驶员交通事故的不同区域交通事故发生率进行统计。可以使用JS表示每万驾驶人事故发生率,即JS=■×104,其中A表示事故数量,D表示驾驶员数量。另外,还需要对肇事驾驶员的发证区域[2]、驾驶员考试的通过率等多方面对驾驶员与交通事故之间的关系进行分析。

2.交通事故与机动车辆信息关联分析

为了对不同区域的机动车数量与交通事故之间的发生几率与发生关系进行分析,需要对万车死亡的概率进行计算。可以使用WC对万车死亡的发生几率进行表示,利用相关的公式进行系统计算,并且作为A交通事故发生的数量,D为机动车辆的数量。

3.交通事故与违法信息关联性分析

基于数据挖掘的道路交通分析系统中,会对管辖区域内的违法行为处罚实际情况与事故认定原因互相对比,之后将违法信息与交通事故之间存在的关系充分掌握。

4.交通事故与人口数量、经济等相关信息的关联性分析

系统会获取交通事故与人口数量、经济等相关信息,通过对不同区域中的十万人口死亡率、GDP事故发生率等相关数据进行分析,对交通事故的实际发生情况进行分析。可以使用Jr对十万人口的死亡率进行表示,即Jr=■×105,其中A表示交通事故的数量,r表示人口的整体数量。使用JZ对发生的的事故发生率进行表示,即JZ=■×108,其中A表示交通事故总量,Z表示GDP[3]。使用对百公里发生的交通事故率进行表示,即JP=■×100,其中A表示事故发生总量,L表示道路的总长度。使用Jx表示综合交通事故率,JZ=■×100其中A表示事故的总量,P为人口总数量。

(三)数据挖掘分析功能

第一,对交通事故数据进行预测。使用常用的指数平滑法、自动回归滑动平均法等平均处理模型,对交通事故发生的四项指标进行计算,其中包含事故的发生数量、死亡人数、受伤人数、造成经济损失,可以对交通事故的未来走向进行准确预测。第二,对单项的因素进行关联性分析。通过对单项因素的关联性进行分析, 可以对交通事故的原因与定性影响因素之间存在的关系是否独立进行判断。第三,对事故的原因关联性进行分析。将单相事故因素的关联性分析作为基础,对管辖区域的交通事故发生严重程度与事故关联性的因素进行构建,其中包含驾驶员的驾龄、车辆品牌、车辆类型等多方面,之后会形成逻辑回归模型,对相关定性与函数之间存在的关系进行拟合、定性、分析,可以将不同变量之间形成的影响作用完全描述,计算出最终的危险系数值,还可以提供相关原因与交通事故严重程度的危险系数示意图,之后会得出相关的分析结论。第四,对交通事故多发的路段进行全面通缉分析。在数据挖掘道路交通事故分析系统中会对重点道路进行分析,将交通事故多发路段进行筛选,之后会使用将密度作为基础的聚类算法进行计算,从而加强交通事故多发路段的统计与分析效果。

(四)可视化分析

在系统进行可视化分析的过程中,会将交通事故统计分析、关联性分析等相关结果显示在地图中,可以从宏观的角度对全国的道路交通事故区域划分进行掌控,还可以使用分析区域进行分级、分色的显示。

(五)重点关注

构建系统的重点关注功能时,需要将事故的上升点数据作为基础进行分析与构建,需要对各个区域的交通事故上升实际情况进行分析,还可以划分为3、5、10人的事故上升情况,对重点的车辆事故上升情况监控。

四、结语

基于数据挖掘技术对道路交通事故分析系统进行构建,可以加强数据的挖掘与分析效果,找出交通事故的发展规律,从而加强预防措施的科学性与准确性。

参考文献:

[1]胡鹏. 数据挖掘在交通管理中的应用研究[J]. 计算机安全,2013(10):54-57.

[2]郭璘,周继彪,董升,张水潮. 基于改进K-means算法的城市道路交通事故分析[J]. 中国公路学报,2018,31(04):270-279.

[3]惠宝锋,冯桂莲,王咏宁. 基于OLAP的道路交通事故影响因素分析[J]. 软件工程,2018,21(07):21-23+20.

(作者单位:安徽百友司法鉴定中心)

猜你喜欢
数据仓库道路交通数据挖掘
南京市2017年至2019年道路交通死亡事故分析与研判
道路交通基础设施建设中的节能减排问题及技术探讨
基于数据仓库的数据倾斜解决方案研究
永昌县人大常委会开展道路交通安全法执法检查
数据挖掘综述
软件工程领域中的异常数据挖掘算法
数据仓库系统设计与实现
基于R的医学大数据挖掘系统研究
数据复用在存储数据仓库中的运用
数据仓库技术在档案管理领域的应用