基于贝叶斯网络的城市快速路交通事故相关因素分析

2023-02-23 04:55陈宣霓周婧浙江警察学院
警察技术 2023年1期
关键词:驾龄快速路贝叶斯

陈宣霓 周婧 浙江警察学院

引言

快速路作为城市交通重要的支撑,有效提升了城市路网的运行效率,同时也诱发了大量交通事故,给城市带来安全隐患,给居民的生命以及财产安全造成了损失。根据道路交通事故数据统计,城市快速路的平均事故死亡率和平均事故财产损失率均比一般道路更高。因此城市快速路一旦发生交通事故,造成的人员伤亡和财产损失程度要更加严重,研究城市快速路事故相关因素有非常重要的意义。

国内外关于道路事故影响因素的相关研究有不少的研究成果。例如,Cheng等采用MARS模型对交通事故率进行了研究[1]。对城市快速路的研究主要集中在快速路通行能力影响因素和模型研究等,例如,裴玉龙等分析了大量的城市快速路交通事故数据,探究事故影响因素并对城市快速路交通安全进行评价[2],但国内外对快速路事故相关因素的研究较少。贝叶斯网络是由Pearl所提出的经典概率图模式,其基本形式为贝叶斯公式。在故障分析、交通风险分析、医疗诊断、模式识别研究等领域得到了较为广泛的应用。贝叶斯网络能将相关因素之间的条件独立性和关联性进行划分,有利于减少计算量,并将相关因素之间的关系以图形的方法清晰表达,易于理解。贝叶斯网络在交通事故的相关研究主要集中在行车安全和事故成因研究,例如,Bayraktar等利用贝叶斯网络对影响公路行车安全因素进行研究[3],许洪国等人利用贝叶斯网络建立了交通事故的致因分析模型[4]。

本文将以某市快速路的交通事故数据为例,探索时间、地点、天气、驾驶员年龄、驾龄等道路交通事故相关因素,将事故相关因素通过图表等可视化方式进行展示,利用GeNIe软件进行贝叶斯网络的制作,挖掘、分析事故相关因素之间的复杂影响程度并总结归纳,为预防控制快速路事故发生和事故快速反应处理提供理论支持和帮助。

一、数据预处理

本文数据来自2021年某市城市快速路的交通事故数据,共9553起。删除原始数据中存在多处信息缺失的数据后,得到有效数据共计8576条。

将数据变量进行编码,得到表1,10个变量包括:事故责任、事故原因、事故车辆驾驶员的性别、驾龄、年龄、事故车辆的机动车类型、早晚、月份、星期、天气。

二、事故相关因素可视化分析

(一)事故发生地点分析

通过地址转换工具将事故警情地址信息转换为经纬度数据,并把经纬度数据导入高德API开放平台,将事故发生频次做成立体热力图,如图1所示。

事故发生峰值在A与B处。A、B都处于该市城市快速路主干道交汇的立交桥,地理位置优越,车流量大。同时,城市快速路相对封闭,参照物少、环境单调,车辆在快速路高速运行时,驾驶员会显著低估车速、高估跟车距离,容易诱发超速行为、追尾等交通事故。

(二)事故发生时间分析

对城市快速路事故发生的时间段进行统计,绘制事故时间小时折线图,如图2所示。

从图中可以看出,早上10~11时、下午13~16时和傍晚17~19时为每日事故高峰期。早上的快速路事故高峰期时间与一般道路的出行早高峰时间(7~9点)相比较为滞后。

结合该市城市干线路网交通拥堵指数实时监控平台的监控数据,如图3所示,可看出事故发生量总体趋势与快速路交通拥堵指数变化趋势成正相关,城市快速路的早高峰时间大约为9~12时,并在10~11时达到早高峰的顶峰,因此城市快速路的事故高峰时间与城市快速路的出行高峰时间是吻合的。事故和拥堵是相互影响的关系。在出行高峰期间,交通处于拥堵状态,行车较为缓慢,驾驶员更容易产生焦躁的心理,引起交通事故的发生,而事故发生在早晚高峰时段,车流量接近饱和状态,驾驶员主观驾驶习惯影响程度低,交通运行效率很大程度上会受交通事故的影响[5]。

对城市快速路事故发生的时间段进行统计,将一周内不同时间段事故发生量制作线性统计图,如图4所示。

根据事故发生的星期小时数据统计显示,工作日的事故变化趋势大致相同,而周一的早高峰时期事故量最高,周五的晚高峰事故量最高,同时星期五的事故量在一周内是最高的,而星期三的事故量是最低的。星期一作为一周工作日的开始,人们心情较为低落,容易忽视道路上的危险信息,而星期五作为一周工作日的结束,人们往往会放松警惕,情绪比较激动,容易造成疏忽大意的驾驶过失行为[6],引发交通事故的发生,符合驾驶员对于工作日开始和结束的心理变化;双休日的事故高峰开始时间明显比工作日推迟,在中午时段事故量高于工作日并一直处于高态势,傍晚的事故高峰期较工作日提早。

(三)事故原因分析

对所有交通事故原因进行统计,并绘制交通事故原因的玫瑰图,如图5所示。

由追尾引起的交通事故最多,其次是由违规变道导致的事故。而由于抢灯、超速、使用手机、涉酒、不按规定停车等这几类事故类型相对较少。

深入研究事故原因的致因因素发现,追尾导致的事故主要是由于肇事车辆跟车太近刹车不及,部分是由于驾驶员视线转移和地面湿滑等原因导致的,而变道导致的事故则是由于驾驶员未观察直接转向所致。综合来看,城市快速路事故发生主要是驾驶员过失行为导致,部分与天气有关。

跟车太近、未观察直接转向等是驾驶员的不良驾驶行为,是由于驾驶员存在侥幸心理、从众心理、麻痹心理等长期作用下养成的不良驾驶习惯[7]。据公安部统计,2021年全国新领证驾驶人(驾龄不满1年)的数量占全国机动车驾驶人总数的5.72%,比2020年增长23.25%。与国外发达国家相比,中国的驾驶员新手比例较高。开车习惯不好是汽车保有量增长太快,短时间内还没有形成一种全社会都遵守的驾驶文化的不良反应。

(四)肇事者年龄和驾龄分析

将驾龄和年龄两两进行对比统计,如图6所示。年龄在36~50岁的驾龄在十年以上的驾驶员以及年龄在18~35岁的驾龄在1~5年的驾驶员是快速路事故高发人群。年龄在50~70岁的驾龄在十年以上的驾驶员以及年龄在18~35岁的驾龄在6~10年的驾驶员也是较高的事故多发人群。

青年人群开车容易冒失,新驾驶员技术不娴熟,容易发生交通事故。同时驾龄较长、经验丰富的驾驶员往往对自身驾驶技术会过于自信,容易安全意识淡薄,忽略路上的交通隐藏危害[8]。因此年龄在18~35岁的驾驶员和驾龄在10年以上的驾驶员是预防城市快速路事故发生的重点关注对象。

三、建立事故相关因素贝叶斯网络

(一)贝叶斯定理与贝叶斯网络

根据概率论的知识,可知在随机事件B发生的条件下发生随机事件A(随机事件B为发生随机事件A的原因)的概率公式为:

而随机事件A在随机事件B发生情况下的全概率公式为:

结合随机事件A的条件概率和全概率公式可得在随机事件A必发生的情况下,随机事件B发生的概率公式,即求导致随机事件A发生的原因随机事件B的概率:

随机事件A和随机事件B的条件概率关系公式即为贝叶斯定理的后验概率公式,是贝叶斯网络的推理基础。贝叶斯网络则是在贝叶斯定理基础上结合图表简化求解概率的一种模型。

将随机变量由两个增加为三个:随机事件a、随机事件b、随机事件c,即构成了最简单的贝叶斯网络。当其全连接时,贝叶斯网络公式为:

若将随机事件继续增加,其全连接的贝叶斯网络计算量将会成倍增加,而实际生活中并不存在完全的全连接贝叶斯网络,往往会有条件独立的随机事件,因此,贝叶斯网络将大大减少条件概率计算的次数,从而减轻计算难度。

(二)贝叶斯网络构建

本文共有十个节点,依次计算两两的条件概率需要计算774144次,而借助贝叶斯网络的优势,仅需计算768次。

由现有数据可计算各相关因素的先验概率,如表2所示。

1. 制作贝叶斯网络图及先、后验概率图

将事故原因设置为目标参数作为贝叶斯网络的结果,综合考虑各相关因素之间的关系,利用GeNIe软件制作结合经验法和机器学习法的贝叶斯网络。贝叶斯网络和先验概率图,如图7、图8所示。

早晚、月份、星期因素共同影响了天气因素,年龄影响了驾龄、机动车类型、事故责任,性别影响了机动车类型,在此基础上,驾龄、天气、事故责任、机动车类型这几个因素影响了事故原因。从贝叶斯网络的先验概率图,可以看出各相关因素各自的概率,其中快速路事故发生的事故责任中单方负全责的概率为98%,事故车辆类型主要以非营运小型客车为主,月份、星期分布相对均衡。

无法当场认定的事故一般为较为复杂严重的交通事故,若将事故原因中的无法现场认定的事故设置为必然发生,可求其他相关因素的后验概率,如图9所示。

观察后验概率的变化,可以发现驾龄的概率变化幅度较大,10年以上驾龄的概率提高了5%,其他因素的概率变化不大。因此,驾龄对较为复杂严重的交通事故的发生概率存在影响,驾龄越大,发生较为复杂严重的交通事故的概率越大。

2. 敏感性分析

敏感性分析是一种定量描述模型输入变量对输出变量重要性程度的方法,影响程度的大小称为该属性的敏感性系数。敏感性系数越大,说明该属性对模型输出的影响越大。将事故原因设置为目标参数,观察其他相关因素的敏感性,并观察事故原因中追尾和变道的事故敏感因素,如图10所示。

相关因素敏感性图中箭头粗细代表关联性大小,可以看出年龄和驾龄的关联性比年龄和事故责任的关联性强;在影响天气的相关因素中,月份对于天气的影响更强;事故责任和机动车类型对事故原因的关联性较强。

把事故原因的相关因素敏感性进行细分,以事故原因概率最大的追尾事故原因的各相关因素敏感性分析为例,如图11所示。

当事故原因变量变化时,最敏感的是事故责任,其次是机动车类型,而性别和天气的变化最小,虽然天气因素敏感性小,但是早晚、星期和月份都间接存在一定的敏感性。事故责任由全责和同责构成,对于占比高的追尾和违规变道事故来说,主要由一位驾驶员的行为导致,因此敏感性高。由于城市中主要以小型客车为主,中、大型车辆限制进城,事故数量少,所以敏感性较高。

四、结语

本文针对2021年某市城市快速路交通事故,通过数据分析,结合实地调研,利用GeNIe软件构建贝叶斯网络,主要从人、车、环境三个方面提炼出10个相关因素,分析各相关因素之间的关系并得出结论。(1)贝叶斯网络在交通事故相关因素分析中,能够保证数据的可靠性和真实性,同时具有反推理能力,可以进行事故相关因素之间关系的定量化分析,并且简单易懂。(2)驾驶员群体是事故发生最大的责任方且也是最大的损失方,其驾驶行为更应该被重视。(3)从导致快速路事故的原因来看,驾龄和年龄是最主要的因素之一,故应针对不同年龄、驾龄层,针对驾驶行为特性展开专门的培训教育和测试,使其养成良好的驾驶习惯并注意驾驶细节。环境因素也会影响驾驶员的注意分布,因此,交警部门可以和气象部门展开合作,提前预警,做好应急措施,同时增加巡逻警力,及时发现潜在的事故风险,还可利用广播、公众号等媒体平台进行交通安全宣传。(4)快速路道路具有封闭性的特点,可以在事故多发地段设立警示标志标线,在快速路出入口、立交桥等事故高发地,设置事故处理服务站点,缩短处警和撤离时间,有效提高事故处理效率。

猜你喜欢
驾龄快速路贝叶斯
不同驾龄新手驾驶员感知能力认知偏差分析
#全国近7%驾驶员驾龄不足一年#
贝叶斯公式及其应用
基于贝叶斯估计的轨道占用识别方法
有机生活
一种基于贝叶斯压缩感知的说话人识别方法
基于LS-SVM的快速路入口匝道预测控制
IIRCT下负二项分布参数多变点的贝叶斯估计
城市快速路主路与辅路间出入口设计探讨
塘汉快速路永定新河特大桥方案比选