基于收费数据的短时路网交通量推算方法研究

2019-09-26 05:05王鑫王英平张彭顾明臣王卓伟宋扬费彧

中国管理信息化 2019年17期

王鑫王英平张彭顾明臣王卓伟宋扬费彧

[摘要] 高速公路联网收费信息系统中包含了海量的公路交通信息[1]，通过收费数据挖掘得到长时间断面交通量的算法已经实现，但是针对短时间粒度的断面交通量算法尚属空白。而短时间粒度、分车型交通量是公路交通情况调查系统采集数据的主要指标。本研究构建了针对短时、分车型数据的挖掘分析方法，充分利用高速公路收费数据，采用车辆动态模拟的分配方式，计算全路网各路段短时间粒度的动态交通量。将收费数据推算结果与自动化交通情况调查站监测结果对比，高速公路网日交通量平均误差为8.87%，小时交通量误差为9.02%。本文提出的方法实现了高速公路网全域、高效的自动化交通量推算，对于推动公路交通基础信息采集技术发展及提升多源大数据分析能力建设具有重要意义。

[关键词] 交通量;收费数据;交通调查;车型;推算方法

doi ： 10 . 3969 / j . issn . 1673 - 0194 . 2019. 17. 070

[中圖分类号] TP312 [文献标识码] A [文章编号] 1673 - 0194（2019）17- 0180- 04

1 引言

我国从1978年正式开展公路交通情况调查，并从2010年起开展大规模自动化调查站建设，站点涵盖全国31个省（区、市），涉及高速公路、普通国道、普通省道等各等级道路。截至2018年底，全国共有交调站44 574个，其中自动化交调站7 631个[2]，间隙式站点和比重调查站点36 943个。但是目前交调站采集覆盖率还不能满足行业、社会的应用需求[3]。经过多年来的持续投入，我国高速公路网已建成了较为完备的联网收费系统[4]，基本覆盖高速网全境，可以自动获取海量、实时的收费数据[5]。如何利用现有多源公路交通数据，提高高速公路交调数据采集覆盖率，对公路交通基础信息统计工作具有重大意义，也是亟待解决的技术问题。目前研究已经可以用收费数据进行OD分配来计算路段交通量，但是主要是使用平均OD、通过静态分配方式计算路段平均交通量，数据的时效性不强，没有完全挖掘出收费数据短时粒度的特点，不能很好地满足短时间粒度的数据需求。文章针对现有研究中算法时效性的不足的问题，利用四川省高速公路收费数据，通过车辆动态模拟的分配方法，将收费数据转换成短时高速公路路段交通量，并通过一定对应关系，将收费数据车型转换为交调数据车型，得到路网中任意断面的短时分车型交通量。研究表明，由高速公路收费数据转换成的短时路段分车型交通量数据，能够为高速公路交调数据采集提供补充、校核。文章第二节完成数据准备，第三节给出推算方法，第四节给出推算结果，最后给出结论。

2 收费数据准备

本研究采用四川省全省联网收费系统采集的收费数据作为研究建模对象，采用四川省高速公路交调数据作为校核对象。目前全省共529个实际收费站点，其中省界收费站点21个。为解决多义性路径问题，在产生多义性路径的路段上设置了共129个标识站，车辆进入高速公路后，其所经标识站均可在收费数据中记录，从而保证了车辆路径的唯一性。

在进行分析建模前，首先要对收费数据进行数据清洗。一方面删除不符合常规的、或明显错误的数据，另一方面，将与推算断面交通量相关的信息进行读取与分析，包括进出高速公路的收费站编号、出入时间，标识站、车型信息等，而忽略其他数十种无用属性信息。用于数据处理的收费数据属性信息如表1所示。

3 推算方法

推算方法包括路网拓扑构建和交通量推算两部分。

3.1 路网拓扑构建

路网拓扑构建是将收费数据与实际路网相结合、进行动态模拟分配、推算路段断面交通量的基础。路网拓扑建构需要考虑高速公路网路段间的拓扑关系，收费站和路网的关系，以及收费站之间的关系、标识站位置等。在进行路网拓扑构建时，还要考虑必要的路段属性信息，如每条路段的长度距离，用于进行下一步建模。

路网采用近邻表的方法进行构建。路网拓扑节点的建立采用虚实结合的方法。四川路网中的收费站、标识站作为路网中的实节点，而路段间相交的、但没有布设收费站或标识站的节点作为虚节点。近邻表实节点包括已建设529个收费站点，129个标识站，结合路段相交点的虚节点，共有830各路网拓扑节点。网络拓扑节点编号的建立需要与收费数据中的节点编号相对应。在建立路网拓扑过程中，发现有些收费站中同一个收费站却配有不同的编号，需用一张单独表将这些编号不同而实体相同的节点一一对应，以便在处理收费数据中不产生歧义。

3.2 交通量推算

交通量推算分为三个主要步骤，分别为路段经过性判断、车辆通过时间判断和集成交通量。根据处理数据的时间，可以分为离线处理和在线处理两种情况。其中，路段经过性判断属于离线处理，即在分析收费数据前就进行的步骤;车辆通过时间判断、集成交通量两个步骤属于在线处理，即与处理收费数据同步进行的步骤。

路段经过性判断的方法是最短路径法。对于路网上任意两个收费站节点（标识站看作特殊的收费站，可以将车辆的实际路径描述为最短路径的集合），用迪杰斯特拉（Dijkstra）算法计算两个收费站的最短路径，作为进出这两个收费站点的车辆的行驶路径。四川路网收费站529个，标识站129个，即共有658个网络实节点。

对于任意路段D，在推断交通量之前，还需要求经过路段D的经由路径LAB中每辆车通过路段D的时间。本研究使用匀速平均法来确定每辆车所经过路径中每一个路段的时间。匀速平均法是假设车辆进入高速路网后以匀速行驶，来计算该车辆通过各个路段的时间。因为车辆入站时间、出站时间、以及所经路线的行驶总距离为已知，所以可以容易计算出匀速行驶的速度等参数，再通过各个路段的长度和与入口之间的距离，推出车辆经过每个路段的时间。设AB是经过路段D的最短路径集合SD中的任意一个进出站组合。车辆i从A站进入高速的时间为TiA，车辆从B站驶出高速的时间为TiB，车辆从站点A到路段D的路程为LNAD，车辆由进入站A到驶出站B的最短路径的路程为LNAB，则根据匀速假设，可以求出车辆i通过路段D的时间为

TDAB（i）=TiA+（TiA-TiB）*LNAD/LNAB（1）

其中，LNAB为由A到B的最短路径经过的所有路段集合SLAB中的路段距离之和。LNAB∑LNK（k∈SLAB）;LNAD为由A到B的最短路径经过路段D之前的所有路段集合SLAD中的路段距离之和，LNAD=∑LNK（k∈SLAD）。若以路段D 的中点的断面交通量代表通过路段D的交通量，则在计算LNAD时需要多考虑路段D本身距离长度的一半。设路段的长度为LND，则LNAD=∑LNK+0.5×LND（k∈SLAD）。

计算任意路段D在任意时段T（T1，T2）内的交通量VD（T），本质就是计算经由路段D的最短路径的集合SD中，对于每一组进出高速的AB组合，在時段T内经过路段D的车辆数量的累加。用Ni代表累计个数增量，Ni数值取1。∑Ni代表满足条件的车辆i的累计总数。设时间段T的起始时间为T1，终止时间为T2，VDAB（T）为由A进入高速、由B驶出高速、且在时间段T内经过路段D的车辆数，则有

VDAB（T）=∑Ni（i∈w满足T1

VDAB（T）代表进出组合高速站点组合AB在时间段T经过路段D的车辆数。对于单一路段D，可以根据SD中的每一组合AB中的所有车辆进出高速时间和距离，计算其经过D的时间，从而求得VDAB（T）。将集合SD中的所有组合的车辆数累加，从而得到路段D在时间段T中的交通量。

VD（T）∑VDAB（T）（AB∈SD）（3）

若考虑路段经过性判断，可将上式写为

以上是以路段为对象考虑的交通量推算方法。在四川路网中根据节点划分了几百个路段。在计算不同路段的交通量时，会涉及同一辆车在不同时间行驶到不同路段的情况。为了减少计算量，在计算不同路段时不重复计算每辆车的基本信息，本研究采用以每辆车为对象的动态模拟的方法标定其行驶轨迹，从而计算路网路段的交通量。通过收费数据进出收费站的时间，推算车辆在高速公路网中经过每一个路段中点的时间，进一步推断该路段的交通量。车辆i从A站进入高速的时间为TiA，车辆i从B站驶出高速的时间为TiB，可以根据公式标出其经过各个路段中点的时间TDAB（i），其中D为车辆从A站到B站经过的每个路段。对驶入高速的每辆车都进行如从计算，则每一个路段D都标定了路网中的经过其路径的车辆通过它的时间TDAB（i）。计算交通量时，将符合时间段T内的车辆个数累加，即为该路段在时间T内的交通量。用动态模拟的方法，可以同时计算路网中所有路段的交通量，而不会重复计算车辆行驶到每个路段的时间等基本信息，从而减少了计算量。

4 推断结果

采用上述算法对四川省高速公路2018年1-6月的收费数据进行分析，并与已建设的70个自动化交调站采集的数据进行校验。图1为可视化的四川工作日晚高峰流量空间分布图，可以看出，成都周边路网车流量较大，其他路段流量相对较小。

图2为可视化的路网各路段车速分布。可以看出，四川省高速路网中，成都环线的路网较为拥堵，速度较为缓慢，而从成都环线分向各个放射线高速的车速较为通畅。对于行驶路径依次经过放射线和成都环线的车辆，实际车速并非理想的匀速行驶，从而按照匀速平均法计算的路段交通量会有微小偏差。但根据数据分析，在计算交通流量时，匀速行驶假设基本可以满足以小时为单位的短时间粒度交通量计算要求。

将由收费数据转化的交通量和交调站点直接采集的断面交通量在同一空间、时间范围下进行比对。图3为基于全网具备交调站点的路段的平均流量与相对应的收费数据转化的平均流量的比较。从图中可以看出，二者变化趋势一致，高速公路网日交通量平均误差为8.87%，小时交通量误差为9.02%。对于单一路段，高速公路日交通量误差为13.80%，小时交通量误差为17.20%。分车型看，单个站点的中小客车小时交通量误差在12%左右。车型校验结果如图4所示。

5 结论

高速公路收费数据中蕴含了丰富的动态路网交通信息。本文研究了收费数据推算交通量的数据挖掘方法，首次采用动态模拟分配的方法得出了短时间粒度的全网各路段流量;且经过车型匹配算法，得出基于公路交调系统的分车型交通量数据。通过收费数据转换计算短时的路段交通量数据，能够掌握全路网各路段交通情况，可以作为公路交通情况调查数据的有益补充，可为后续相关研究与应用奠定基础。

主要参考文献

[1]付鑫，王建伟，袁长伟.基于高速公路收费数据库的断面交通量计算方法[J].交通运输研究，2006（6）：150-153.

[2]交通运输部规划研究院.2017年国家干线公路交通情况分析报告[R].2017.

[3]胡闰秀，李梦雪.基于高速公路收费数据的交通量调查[J].山东交通学院学报，2016，24（1）：21-26.

[4]孙忠辉.从联网收费数据中提取管理信息方法探讨[J].中国交通信息化，2009（8）：70-72.

[5]钟足峰，刘伟铭.基于联网收费数据预测交通流量的实现[J].中国管理信息化，2009，12（2）：59-61.