基于谱系聚类的公路运输驾驶行为研究

2016-11-16 05:24李月明郑贵省车亚辉
军事交通学院学报 2016年10期
关键词:谱系交通事故聚类

李月明,郑贵省,车亚辉,王 鹏

(1.军事交通学院 研究生管理大队,天津300161; 2.军事交通学院 基础部,天津300161)



● 基础科学与技术Basic Science & Technology

基于谱系聚类的公路运输驾驶行为研究

李月明1,郑贵省2,车亚辉1,王鹏1

(1.军事交通学院 研究生管理大队,天津300161; 2.军事交通学院 基础部,天津300161)

为规范驾驶行为、提高公路运输安全水平,对公路运输事故中车辆的驾驶行为及其诱因之间的关系进行研究。基于谱系聚类法并结合相关数学软件对驾驶行为进行聚类分析,并以2010—2012年道路交通事故统计数据为例进行实例验证,对引起交通事故的驾驶行为给出聚类图谱。研究结果表明:各种不规范的驾驶行为是引起交通事故的重要原因,通过聚类分析能够对引发交通事故的不规范驾驶行为进行识别,为规范驾驶行为提供重要依据。

谱系聚类;公路运输;驾驶行为

随着经济的发展,公路运输作为重要的运输方式不可避免地承担着越来越多的运输任务,与此同时,公路运输中交通事故也在不断发生。据有关数据显示,全球每年因公路交通事故都会使超过120万的人失去生命,经济损失数目巨大[1]。

国外关于公路运输事故的数据分析中,由人为因素引发的公路运输事故占了全部交通事故的80%~90%,国内有关数据分析中,在公路运输事故中92.9%的事故都是人为因素引发的[2]。很明显,在公路运输“人—车—货物及环境”系统中,车辆驾驶员的驾驶行为是导致公路运输交通事故的重要因素。本文利用谱系聚类法对公路运输中的驾驶行为进行研究,对引发交通事故的驾驶行为进行分析,为驾驶行为识别和驾驶员行车习惯分析提供支持,从而为公路运输安全提供重要保证。

1 聚类分析法

聚类分析是一种基于统计学对未知类属样品进行区分和归类的一种手段方法。对所获得样品对象的程度大小进行评估,最终将某种特征相同或者比较接近的样品对象看作一类,反之看作不同类。聚类分析的结果具有很多研究价值,比如提供实验猜测的依据,判别获得新数据的类属等应用[3]。

聚类分析根据分类对象的不同,即对样品的分类还是对变量的分类,可以分为Q型分析(前者)和R型分析(后者)。Q型聚类常常把样品的相似度以距离的形式来度量,这种聚类分析方法的特点:对样品的特征进行不同维数的数据采集处理和分析;清晰地呈现出分类结果,分类结果能够通过聚类谱系图把初始数据用图样表示出来;通过比较可知该聚类分析方式的分类结果具有合理性和全面性。

2 谱系聚类算法在驾驶行为中的应用

谱系聚类法在众多的聚类方法中是一种非常有效的分类方法。谱系聚类法通过对各个样品间相似程度的度量用距离进行统计学数字化,把距离相同或者距离最小的样品聚成一个小类;通过类间距离的计算进行类间相似度的评估,把小类聚合成较大的类,最后将所有样品聚合成一个大类,形成一个各类相似度不断减小,类间距离不断增大的谱系图[4]。

公路运输中的大部分交通事故都与不规范的驾驶行为有关,比如加塞、变道超车、超速、遇障碍急刹车等驾驶行为[5]。不规范的驾驶行为是造成公路运输中交通事故的重要原因,通过不规范驾驶行为对以往交通事故引发因素的数据进行聚类分析,找出与外部影响因素的关系,对改善交通安全状况,提高公路运输效率有着极其重要的研究价值和经济效益[6]。

2.1驾驶行为类间距离定义

本文对引发公路运输交通事故的不规范驾驶行为进行聚类分析,聚类的各驾驶行为作为不同样品,所以此处关于样品的谱系聚类法依据Q型聚类方式讨论。Q型聚类方式是通过对类间距离的大小评估类间相似程度大小进行划分类别。

类间距离的大小会根据不同的类间距离定义而产生不同的计算结果,类间距离的定义有下面几种。

图1 最长、最短距离示意

(3)类平均距离:通过计算类间所有样品之间距离的平均值作为两类之间的距离。

类平均距离还可以描述为:通过类间所有样品之间的平方距离的平均记为两类之间的距离。

(4)重心距离:用两类重心之间的距离作为两类距离。

(5)离差平方和距离:由Ward依据方差分析的思想提出来的。

在聚类样品时依据需要选择不同距离定义进行聚类或者选择不同距离定义比较聚类结果。

2.2驾驶行为谱系聚类法步骤

(1)确定要用的距离定义,包括样品距离和类间距离。此处以d(xi,xj)表示样品i与j间的距离,记为dij。类间距离按照上述几种距离定义选择,此处选择最小距离定义来计算类间距离。

(2)聚类样品开始时有n个样品就当作n个类,然后对n个类相互之间的距离进行计算,得出一个行向量,通过三角化得到一个对称矩阵。

此时,Dpq=dpq。

(3)选择找出D(0)非对角线上的数据最小的元素Dpq。这时Gp={xp},Gq={xq}。将Gp、Gq合在一起组成一个类Gr={Gp,Gq}。这时类个数就减少了一个变成了n-1个,所以得到新的矩阵距离D(1),这个新的矩阵是n-1阶方阵。

(4)从D(1)新矩阵经历步骤(3)的过程,得到下一个新矩阵D(2)。再由D(2)重复上述步骤,最后n个样品聚为一个大类的时候停止。

(5)在上述类别聚合的过程中,对被聚合的样品号码和聚合时候的相似程度要给以记录,并把聚合过程的聚类谱系图绘制出来。

3 公路运输交通事故行为聚类分析应用

根据《中华人民共和国道路交通事故统计年报(2010—2012)》,引发事故发生的因素主要有视野、行车道路环境、车身性能和其他的原因,不规范驾驶行为诱发事故的因素统计见表1[7]。

表1 不规范驾驶行为诱发事故因素统计表 次

下面进行谱系聚类的Matlab实现,利用最短距离法将其分为3类。

(1)在Matlab中依据样品类型输入数据矩阵,每一种驾驶行为看作一个样品,作为数据矩阵的行向量,事故的各种诱因作为样品的样本特征看作数据矩阵的列向量输入。

(2)利用软件函数(d=pdist(A),A为数据矩阵)进行计算各样品之间的距离d。此处d为每两行之间距离的一个行向量。

(3)利用软件函数(z=linkage(d),求得z为类间最小距离)进行不同类间距离计算并进行聚类,行表示类。最后将得到的距离矩阵利用命令tril(squareform(z))进行处理,最终得到一个三角矩阵D。

(4)将上述矩阵利用SAS进行谱系聚类处理,按最短距离法聚为3类,得到谱系聚类如图2所示。

图2 将各类驾驶行为聚为3类的谱系聚类

4 聚类结果分析

通过谱系聚类图可以看出:超速行为u1自成一类;操作失误u2、超载行为u3分为一类;其他7项分为一类。结合初始数据表可以看出,在实际的车辆安全事故中,超速行驶是最容易引发事故的现象,因此超速行为被单独聚类成一个大类是符合现实的。

此外,操作失误和超载行为被聚成一个大类,结合聚类图谱和初始数据容易看出,道路环境的复杂变化性是操作失误和超载行为引发事故的非常突出的因素。实际公路运输中,由于超载会使车辆的正常驾驶模式失效,在道路环境发生变化时不能及时避免事故发生,从而造成车祸;在复杂多变的道路环境中,驾驶员也很容易发生操作失误行为,从而引发交通安全事故。道路环境因素是引发超载和操作失误行为类事故的突出因素,因此数据聚类的结果是符合实际意义的。现实中经常发生车辆因超载、超员而产生的公路运输交通事故,在高速公路以及城市交通中一个错误的操作就可能带来严重的交通安全事故,因此超速行为和操作错误行为聚成的大类图谱结果和现实情况也是非常符合的。

其他7类现象的样品特征相似度比较高,所以其他7类驾驶行为就聚合成了一个大类。结合图谱和初始数据很容易发现图谱和初始数据是一致的,这几类不规范驾驶行为造成公路运输安全事故的因素是多种因素综合影响的结果,单一因素虽然相比较于前面两个大类的驾驶行为的危险程度相对小一点,但是每一个引发事故的因素都不可忽视。

5 结 语

本文依据影响驾驶行为的因素,将引发交通事故的不规范驾驶行为进行谱系聚类法分析,相似度接近的行为聚合为一类,聚类结果的图谱和现实背景具有一致性。通过成功应用谱系聚类法分析引发事故的不规范行为,说明聚类法在公路运输安全领域是可以用来分析事故原因以及公路运输安全影响潜在因素的威胁程度,由此可以对驾驶行为进行规范,对驾驶行为进行预判以及实时驾驶机动模式的判别等。

[1]张兴俭.基于驾驶行为个体特征的酒后驾驶状态识别方法研究[D].北京:北京工业大学,2014.

[2]肖献强.基于信息融合的驾驶行为识别关键技术研究[D].合肥:合肥工业大学,2011.

[3]杨淑莹,张桦.模式识别与智能计算—MATLAB技术实现[M].北京:电子工业出版社,2015:16.

[4]范金城,梅长林.数据分析[M].2版.北京:科学出版社,2010:198-202.

[5]成波,徐少兵,王文军,等.激进驾驶状态识别算法研究[J].汽车工程,2014,36(7):784-789.

[6]牛增良,李海斌,王文峰,等.基于聚类分析的营运驾驶人危险驾驶行为研究[J].山东交通学院学报,2014,22(1):19-23.

[7]公安部交通管理局.中华人民共和国道路交通事故统计年报(2010—2012)[R].北京:公安部交通管理局,2012.

(编辑:史海英)

Road Transportation Driving Behavior Based on Pedigree Cluster

LI Yueming1, ZHENG Guixing2, CHE Yahui1, WANG Peng1

(1.Postgarduate Training Brigade, Military Transportation University, Tianjin 300161, China;2.General Courses Department, Military Transportation University, Tianjin 300161, China)

To regularize driving behavior and improve road transportation safety, the paper studies the relation between driving behavior in road transportation accidents and its causes. It analyzes driving behavior with related mathematical software based on pedigree cluster and verifies it with 2010—2012 road traffic accident statistics as the example, and provides cluster map on driving behaviors caused traffic accidents. The result shows that irregular driving behaviors are the important causes for traffic accidents. Cluster analysis can identify irregular driving behaviors causing traffic accidents, which can provide important basis for regulating driving behaviors.

pedigree cluster; road transportation; driving behavior

2016-03-20;

2016-04-24.

李月明(1990—),男,硕士研究生;

郑贵省(1975—),男,教授,硕士研究生导师.

10.16807/j.cnki.12-1372/e.2016.10.022

U471.1

A

1674-2192(2016)10- 0092- 04

猜你喜欢
谱系交通事故聚类
基于BPNN-AdaBoost的隧道交通事故数预测研究
神族谱系
《春秋》公羊学胡毋生师授谱系补证
王锡良陶瓷世家谱系
预防交通事故
陕西现当代文学的谱系与基因
面向WSN的聚类头选举与维护协议的研究综述
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现
基于加权模糊聚类的不平衡数据分类方法