基于K最邻近算法的沥青路面使用性能预测

2020-07-14 12:41张丽娟许薛军
公路工程 2020年3期
关键词:国省道使用性能交通量

张丽娟,黄 晟,梅 诚,许薛军

(1.华南理工大学土木与交通学院,广东 广州 510640;2.广东省交通运输规划研究中心,广东 广州 510101)

0 引言

随着行车荷载和使用年限的增加,沥青路面服务水平不断下降,路面逐渐发生破坏,准确预测沥青路面使用性能衰变规律,可为掌握沥青路面技术状况、评定路面结构设计优劣、制定养护决策提供依据。

沥青路面使用性能受自然环境、交通荷载、结构设计、材料性能、施工质量和维修养护等多因素综合影响,使得预测沥青路面性能十分复杂。目前国内外比较常见的确定型预测模型包括经验法和力学经验法等。如美国(NCHRP)1-37A模型[1]、KIM[2]等开发的基于力学经验法的在役路面车辙预测模型;孙立军[3]等提出基于沥青路面初始性能指数、路龄等因素的沥青路面性能衰变模型;汪海年[4]等提出了考虑当地气候条件、交通荷载与参数校正的MEPDG半刚性基层沥青路面车辙预估模型。这些模型都是用数据拟合的回归模型,预测值与真实值可以产生很大偏差,且有些模型考虑的性能影响因素不够全面。

目前我国公路管理部门构建了多个公路养护信息管理平台,积累了大量的道路路线、区间、路面结构、交通量、路况基础数据。大数据技术是挖掘这些信息资源的重要工具,大数据的相关算法已在沥青路面性能预测中得到应用。如刘黔会[5]等利用支持向量机(SVM)回归方法,建立沥青路面使用性能的预测评价模型;赵静[6]等提出了基于灰色关联度分析和支持向量机回归(GRA-SVR)的沥青路面使用性能预测模型。

K最邻近(K Nearest Neighbor,简称KNN)算法是数据挖掘领域常用的机器学习算法,在大规模、大批量的数据分级分类方面,KNN算法具有独特的快速性、便捷性与精准性。近年来,有学者采用K最邻近算法预测道路路段短时行程时间[7-9],但未见K最邻近算法应用于沥青路面使用性能预测上。本文利用广东省普通国省道典型沥青路面路况资料,探索K最邻近算法在沥青路面使用性能预测领域的应用。

1 广东省普通国省道典型沥青路面结构选定

1.1 国省道典型沥青路面结构

根据广东省公路事务中心提供的资料,本文筛选了广东省9条国道和124条省道的普通国省道干线路段(总长度达13 576 km),从中统计出广东省普通国省道典型路面结构及其组成[10](见表1)。

从表1可见,排名前2位的路面结构为水泥路面结构,排名前3~6位的路面结构为沥青路面结构(A1~A4型)。在普通国省道典型沥青路面结构中,一般采用厚度为20~35 cm水泥稳定级配碎石(CGA)基层和15~20 cm水泥稳定碎石(CCS)底基层,有些底基层采用石灰稳定集料(LSGA),有些路段为水泥混凝土路面(PCC)上加铺沥青面层。表1分别列出了A2~A4型沥青路面结构常见的2种基层结构组成。

根据表1的统计结果,本文选用A1~A4型沥青路面结构作为广东省典型国省道典型沥青路面结构开展研究。

表1 广东省普通国省道典型路面结构Table1 ThetypicalpavementstructuresincommonnationalandprovincialtrunkhighwaysinGuangdongprovince排序路面结构编码路面结构组成路面类型所占比例/%1C1水泥混凝土(23-26cm)水泥路面37.172C2水泥混凝土(20-23cm)水泥路面20.563A1沥青混凝土(0-4cm)+(20-25)cmPCC+(15-20)CGA沥青路面6.184A2A2-1沥青混凝土(12-15cm)+(20-25)cmCGA+(15-20)cmCCS沥青路面3.90A2-2沥青混凝土(12-15cm)+(20-25)cmCGA+(15-20)cmLSGA5A3A3-1沥青混凝土(15-16cm)+(20-25)cmPCC+(25-30)cmCGA沥青路面3.71A3-2沥青混凝土(15-16cm)+(30-35)cmCGA+(15-20)cmCCS6A4A4-1沥青混凝土(8-10m)+(20-25)cmPCC+(15-20)cmCCS沥青路面2.95A4-2沥青混凝土(8-10m)+(25-30)cmCGA+(15-20)cmCCS

1.2 国省道典型沥青路面结构分类

自然气候条件、交通量和施工质量是影响路面结构使用性能的外部因素。根据对广东省不同地区气候、地质及交通特点比较分析,从路面结构设计角度来看,将全省划分为2个自然片区较为合理,即粤北地区(①分区),珠三角、粤东和粤西地区(②分区)。根据普通国省道交通量数据,本文采用年平均日交通量AADT作为交通量分级的指标,将普通国省道交通量分成了轻交通、中交通、重交通3个等级。即轻交通等级的AADT值小于3 000 pcu/d,中交通等级的AADT为3 000~10 000 pcu/d,重交通等级的AADT大于10 000 pcu/d。

表1所列的典型沥青路面结构在两个自然分区均有分布,且大多数普通国省道路段的交通量属于重交通和中交通等级,轻交通量等级情况只出现在部分省道中。A1沥青路面结构的沥青面层厚度偏薄,只见于省道的轻交通量等级路面中,多属于旧路改造路面。

根据自然气候条件、交通荷载条件特点,广东省分为2个自然片区,交通荷载分为轻、中、重3个交通量等级。根据面层、基层类型的材料及厚度差异,表1所列的典型沥青路面结构实际上可以细化为26种典型沥青路面结构。

2 普通国省道典型沥青路面使用性能评价

2.1 沥青路面使用性能评价方法

根据《公路技术状况评定标准》(JTG 5210-2018),采用路面使用性能指数PQI作为沥青路面使用性能状况评定指标。PQI由路面损坏状况指数PCI、路面行驶质量指数RQI、路面车辙深度指数RDI、路面抗滑性能指数SRI等4个分项指标组成。路面使用性能状况分为优、良、中、次、差5个等级,PQI值评价等级分级标准见表2。

表2 PQI值评价等级分级标准Table2 ClassificationcriteriaofPQIevaluationlevel等级优良中次差PQI值/%90^10080^9070^8060^700^60

2.2 国省道典型沥青路面结构使用性能变化规律

根据广东省公路事务中心提供的资料,本文选取了在2011年-2015年内路面没有进行大中修、仅进行普通日常养护情况下具有代表性的典型沥青路面结构路段,统计了上述26种广东省国省道典型沥青路面结构的PCI、RQI、RDI、SRI等分项指标5a检测数据,计算出PQI值。

图1~图5分别为不同自然分区、交通量等级下典型沥青路面结构的PQI值变化规律。

图1 ①分区重交通条件下PQI值趋势

图2 ②分区重交通条件下PQI值趋势

图3 ①分区中交通条件下PQI值趋势

图4 ②分区中交通条件下PQI值趋势

图5 轻交通条件下PQI值趋势

从图1~图5可以看出,各典型沥青路面结构代表性的5年评价等级都在“良”级以上,路面结构使用性能随时间而衰减,交通量越大,衰减程度越大。在交通量相同条件下,广东省不同地区的沥青路面使用性能差异不显著。

3 K最邻近(KNN)算法

3.1 K最邻近(KNN)算法原理

K最邻近(KNN)算法是数据挖掘领域中基于实例学习的非参数回归预测法,通过搜索训练集数据库中与预测值特征向量最相似的K个样本来进行分类和预测。如果某一个样本与该训练集空间中K个最相似(即训练集空间中最近邻)的样本中的绝大多数都属于某一个类别,则该样本也属于这个类别[11-12]。KNN算法采用距离度量的方式判断历史数据与预测值特征向量的近似程度。

本文以欧几里得距离(Euclidean)作为距离算法,以最大投票法(Consensus)作为决策类别属性算法,在K值未定情况下,KNN算法步骤为:

a.通过己经采集的数据构建训练集S。其中,S由i个样本组成,每个样本由m个特征向量(输入变量)及输出变量y构成,其数学表达式为:

(1)

b.先拟定K值(通常为奇数),再根据预测结果最终确定K值。

c.设yp为预测值(输出变量),xp为预测值yp的特征向量,计算特征向量xp与训练集S中历史特征向量xm的欧几里得距离dm:

(2)

d.将计算得到的预测值特征向量与训练集历史特征向量的距离由小到大排列,在训练集中搜寻出K个与xp距离最近的历史特征向量,得出这K个历史特征向量所对应的输出值集合y=[y1,y2,y3,…,yK]。

e.采用最大投票原则,投票数最多的输出值yh(h∈K)即为待预测值yp。

3.2 KNN算法计算流程

KNN算法包括选择训练集、构建特征向量、选择合适的K值、距离测量、决策判别等过程,如图6所示。

图6 KNN算法流程图

4 KNN算法在沥青路面使用性能预测中的应用

4.1 KNN算法预测模型

a.建立KNN模型的训练集和测试集。

利用KNN算法预测路面使用性能时,需要先建立有足够多样性和复杂性样本的训练集,以保证训练集有一定的深度与广度。表1所列的A1、A3、A4型沥青路面结构的组成、厚度各异,所在路段分布在①分区和②分区,且有轻、中、重3种交通量等级,满足训练集的深度与广度要求。因此,以A1、A3、A4型沥青路面结构作为训练集,将A2型沥青路面结构作为测试集。

b.建立KNN模型输入、输出指标体系。

将影响路面使用性能的因素(自然分区、交通量等级、面层类型及厚度、基层类型及厚度、路龄)作为输入指标(特征向量),将PQI值及其评价等级作为输出指标(输出变量),本文在Matlab平台上进行KNN算法仿真分析。在Matlab平台上,自然分区、交通量等级、性能评价等级等无法以文本形式输入,需要将文本转化为数字形式输入。

4.2 沥青路面使用性能预测结果及分析

本文运用欧几里得距离算法,在由A1、A3、A4型沥青路面结构数据构建的训练集中寻找K个近似样本,通过最大投票法决策类别属性算法预测A2型路面结构的PQI值及其性能等级,并与实测得到的PQI值进行比较。

图7~图10为K=3时各自然分区、交通量等级下A2型沥青路面结构PQI值预测值和实测值。

图7 ①分区重交通条件下PQI值预测(K=3)

图8 ②分区重交通条件下PQI值预测(K=3)

图9 ①分区中交通条件下PQI值预测(K=3)

图10 ②分区中交通条件下PQI值预测(K=3)

图11~图14为K=5时各自然分区、交通量等级下A2型沥青路面结构的PQI值预测值和实测值。

图11 ①分区重交通条件下PQI值预测(K=5)

图12 ②分区重交通条件下PQI值预测(K=5)

图13 ①分区中交通条件下PQI值预测(K=5)

图14 ②分区中交通条件下PQI值预测(K=5)

选择平均绝对误差(MAE)、均方根误差(RMSE)和平均绝对百分误差(MAPE)作为评价预测精度指标。根据预测结果,计算出预测误差指标值见表3。

表3 KNN算法预测结果评价Table3 EvaluationofpredictedresultsbyKNNAlgorithmK值MAERMSEMAPE/%K=30.6920.8320.737K=50.7640.8740.793

从表3可见,两个K值的PQI预测结果平均绝对百分误差均小于1%,满足预测精度要求,体现了KNN算法这种非参数回归方法的优越性。K=3时PQI值预测结果的MAE、RMSE和MAPE值均小于K=5时的值,说明在该路面性能KNN预测模型中,K取值为3时,预测误差小、精度高。

5 结语

a.基于K最邻近算法的沥青路面使用性能预测方法考虑了沥青路面使用性能的非线性影响因素,其以自然分区、交通量等级、面层类型及厚度、基层类型及厚度、路龄作为特征向量,将PQI值及其评价等级作为输出向量。KNN模型是一种多因素的综合模型,相对于其他模型考虑的影响因素更多。

b.利用广东省普通国省道典型沥青路面结构5 a的路况历史数据,构建了KNN预测模型的训练集,PQI预测结果平均绝对百分误差小于1%,模型预测精度较高,为沥青路面结构设计和制定养护决策提供参考依据。

c.模型预测结果受限于训练集的数据特性。如实例中训练集的沥青路面结构性能评价等级皆为“优”、“良”等级时,测试集沥青路面结构的性能评价等级结果呈现出只有“优”、“良”等级的特点。因此,要求训练集的数据应具有一定的广度与深度,才能保证预测结果的准确性。

d.K最邻近算法是大数据挖掘算法,数据样本的规模越大,其评价和预测结果更科学、准确。将获得的数据不断补充到训练集中,基于K最邻近算法的沥青路面使用性能预测方法可实现动态预测,推进大数据技术在道路工程领域中的应用。

猜你喜欢
国省道使用性能交通量
基于ETC门架数据的高速公路交通量转换探究
山东国省道改扩建大中修资金绩效评价研究
浅谈国省道公路绿化中本土植物的运用
关于国省道干线公路软地基处理的要点分析
基于动态差法的交通量监测技术应用
高速公路补偿交通量模型研究
提升普通国省道路面大中修设计质量
基于地区差异的沥青路面使用性能非线性模糊评价
高速公路沥青路面使用性能评价
基于四阶段法的公路交通量预测研究