基于神经网络和视频检测的公交车内拥挤度预测

2018-06-17 10:48孙默川张昊范瑞麟李智斌
科学与技术 2018年22期
关键词:预测模型BP神经网络

孙默川 张昊 范瑞麟 李智斌

摘要:公交拥挤度预测是城市公交智能优化的重要部分。城市公交客流分布具有一定的不均匀性,做好拥挤度预测可以有效改变这一现状,从而给乘客更舒适的乘车体验。本文通过研究bp神经网络,改进相应的学习算法,建立不同的拥挤度预测模型,使用在吉林省吉林市调研的客流数据进行训练与检验,保证了实际客观性和较高的预测精度。

关键词:拥挤度预测;bp神经网络;预测模型;智能优化

引言

随着我国机动车保有量的日益增长,现有道路条件不适应交通需求的矛盾日益尖锐,造成了交通拥挤、秩序混乱、事故频发和污染加剧等严重问题。优先发展公共交通已经被世界各国公认为是解决大、中城市交通问题的最佳策略,是城市可持续发展的必由之路。实现高效的公交运营系统需要多方面的努力,提高公交线路的運营管理水平是其关键之一,而公交线路客流预测是实现公交运营调度优化的基础。另外,在客运高峰时段,公交系统面临着客流量过大、车内人流密度过高、车辆利用不合理等问题,在拥挤度方面乘客的需求得不到满足。总之,不管是为了提高公交运营调度水平还是为了优化乘客的出行体验,公交客流的拥挤度预测已经迫在眉睫。本文利用实时调研所得的公交客流数据基于bp神经网络进行了短时的公交拥挤度预测。

本文通过对公交线路站点上下车人数主要相关影响因素的分析,基于公交车历史车流数据利用人工神经网络的基本原理,根据改进的BP学习算法,建立了公交车内拥挤度预测模型。

1 公交拥挤度预测研究意义

在客运高峰时段,公交系统面临着客流量过大、车内人流密度过高、车辆利用不合理等问题,具有一定的安全隐患[1]。而即使避开了客运高峰,每辆公交的拥挤程度也无法满足乘客的各种需求。拥挤度在很大程度上影响人们的出行方式[2,3]。

我们针对市民对公交车拥挤度的相关看法进行了问卷调查,在数据获取后对问卷进行了筛选,剔除了所有选择单一选项、选择具有明显规律性、反向表述(与正向表述的选择具有明显矛盾)、网络问卷答题时间明显不符合正常答题所需时间等有问题的问卷,得到了相对精准的用户公交出行体验。其中多数乘客对现有的公交车运营调度手段不满意,表示深受无座、拥挤等公交常见问题的困扰。近80%的居民表示在时间充裕的情况下愿意等待下一辆公交车,不愿意等车的人只占少数。居民的出行选择与其职业年龄密切相关,不愿意等公交的几乎均为中年上班族,而青年与老年乘客则更趋向于选择舒适度更高的出行体验。在居民意愿的基础上,我们确定了本项目的切实需求,在基于历史数据的拥挤度预测基础上,根据当前站点车内人数对比数据库中历史数据,预测后面站点的拥挤度。本文面向市民可以方便其更好得做出行选择,面向公交公司可以帮助其进行相关运营调度,根据某站预测拥挤度增减车辆,满足居民的出行需要。

2 客流数据的处理分析与神经网络的选取

本文采用的是吉林市56号公交线路2018年6月的公交客流数据作为样本数据,其中工作日的数据有22天,周末的数据有8天,本文仅对于正常工作日的客流数据进行预测。我们选取连续工作日同一时段的客流数据进行处理,将筛选出的异常数据前后相邻数据取几何平均内置作为估计值继而代替异常值作样本使用,之后进行归一化处理。处理好后,建立了BP神经网络预测模型。

2.1 客流数据的处理分析

公交车经常出现在某一站点不上下客的情况,我们采取等差并采用等差变换加等比变换的方法,即对样本对的输入输出值先加一常数,再除以一常数,使BP网络的输入输出值限制在区间(0,1)之间,然后输入网络进行计算。受人工统计的影响,样本中有明显不符合常理的数据,我们采用替代法处理异常值,即将异常数据前后相邻数据取几何平均内置作为估计值继而代替异常值作样本使用,避免了数据样本的减少。

为了减少数据之间的数量级,防止由于数量级差别过大而引起误差,神经网络输入的数据要归一化在一定范围内。通常采用最大最小化的方法将数据统一在(0,1)之间,该方法的公式是: ,式中Xi是当前输入数据,Xmin是所有输入数据中的最小值,Xmax是所有输入数据中的最大值。

2.2 神经网络的选取

BP神经网络相比于其他神经网络,具有网络精度高、逼近效果好、计算速度快等优点,有很强的非线性拟合能力,适用于复杂性较高的预测系统,能够对权值进行动态调整。我们进行了BP神经网络与ELM神经网络的对比实验,结果显示BP神经网络更符合我们的数据特点,预测结果的相对误差比较小。网络模型的建立需要确定很多因素,包括隐含层层数、隐含层神经元个数、学习速率、学习次数、网络参数等。网络的训练过程是一个不断修正权值和阈值的过程。通过调整,使网络的输出误差达到最小,满足我们的预测要求。

1)确定隐含层层数

BP神经网络的结构和性能受隐含层的层数影响。单隐含层网络非线性映射能力较弱,为了达到预定映射关系,隐含层节点要多一些,使网络的可调参数增加。我们通过构造法得到三种隐含层数,然后逐个验证模型预测误差,选取误差最小的那个。

2)确定隐含层的神经元个数

确定隐含层的层数后,就需要确定该层神经元的个数,神经元个数太多的话会花费大量训练时间,容易形成“过拟合”现象;个数太少的话不能准确完整地传递信息。本文采用输入层节点数和输出层节点数之积开平方的方法,不断实验,找出误差最小的那一种。

3)确定初始权值和阈值

由于网络的训练过程就是一个不断调整权值的过程,因此训练时间会受到四个因素的影响,分别是输入层到隐含层的权值、隐含层到输出层的权值、隐含层神经元的阈值和输出层神经元的阈值。由于激励函数的中点是零,所以当神经元的初始权值和阈值足够小接近零的时候,能够快速地收敛并获得最小误差。因此将初始参数调整为-1到1之间的随机数是普遍采用的做法。

3 数据的训练

在选择网络的输入和输出数据时,由于暂时无法获得充足的数据,不能使用相邻周及相邻月的数据,由于六月的天气持续晴朗,天气信息不纳入输入变量的考虑范围。我们选取一个月前29天早上8点的数据作为训练集,预测第30天早上8点全程的车内人数,并把最后一个工作日数据作为测试数据,来验证模型的可用性。

基于三层神经网络可逼近任何非线性函数的理论,本文选用了三层网络结构。根据输入变量和输出变量的个数,确定网络输入层包含6个神经元,输出层包含1个神经元。我们在判断隐含层包含多少个神经元的过程中,采用了试算法,当神经元的数目为12时,网络的预测误差最小,因此把12作为最终数目。设定隐含层的传递函数为tansig,设定输出层的传递函数为purelin,网络的训练函数选择trainscg。同时,设置必要的网络参数,训练迭代步数 epoch=5000,学习率 lr=0.2,学习目标 goal=0.001神经网络模型构建完毕后,将训练数据输入到网络中,当满足停止条件时训练过程终止:

numberOfSample = 20;%输入样本数量

%取测试样本数量等于输入(训练集)样本数量,因为输入样本(训练集)容量较少,否则一般必须用新鲜数据进行测试

numberOfTestSample = 20;

numberOfForcastSample = 2;

numberOfHiddenNeure = 8;

inputDimension = 3;

outputDimension = 2;

通过修改权值:

%初始化输入层与隐含层之间的权值

W1 = 0.5 * rand(numberOfHiddenNeure,inputDimension)- 0.1;

%初始化输入层与隐含层之间的阈值

B1 = 0.5 * rand(numberOfHiddenNeure,1)- 0.1;

%初始化输出层与隐含层之间的权值

W2 = 0.5 * rand(outputDimension,numberOfHiddenNeure)- 0.1;

%初始化输出层与隐含层之间的阈值

B2 = 0.5 * rand(outputDimension,1)- 0.1;

得到不同输出值。

4 预测模型的建立与结果评价

网络训练完成后,就可以用来检验测试样本。用网络预测结果与检验样本的实际结果相比较,找出预测值与真实值之间的误差,即可检验出网络的训练质量。网络模拟值是归一化后的数据,将根据归一化公式反推后的模拟结果即可看出网络的状态。

【预测模型:单站点拥挤度预测(微观)】

单点预测我们可以采用多矩阵预测同一站点来提高准确度,找出最准确的一组来和真实值比较。其中我们预测过的精度最高的一组,与真实值误差小于10%。

全程预测我们采用图像法,第一组预测值出来之后,不直接和真实值进行比较,而是根据预测值研究曲线,找出曲线开始趋于平缓的一段,将这一段的预测值提取出来与真实值进行比较,会大大提高效率。

【预测模型:上下线路拥挤度预测(宏观)】

这种方法是跨越20多个站点的宏观全程预测,即选取前一周的数据作为训练集,预测下一周某天某时刻全程的车内人数及拥挤度情况。图片为同一辆车上行线和下行线的预测结果图,虽然我们的模型对于每个站点的上下客果不是非常准确。但在整条公交线路上,我们对公交车全程的拥挤度预测与走势判断相当精准,可视为较满意的预测。

5 基于视频检测的数据实时获取与研究

本文的拥挤度预测基于历史客流数据,同样也应用历史数据检验。在算法完善之后,此技术可以与大数据相结合,进行实时客流预测与拥挤度判断。下面简单介绍本文采用的视频检测技术。

5.1 视频检测系统

传统的数据采集具有调查周期长,后期维护难,实时程度弱等缺点,再加上环境等客观不可控制因素,就无法获得足够准确的信息。传统的采集方法没有可统计性,不能满足当下的管理需求,因此我们要使客流信息化。本系统采用了车载摄像头的方法,在公交车前后门的上部嵌入摄像头,对乘客进行包括形体捕捉和特征提取等一系列操作,利用传感器检测从乘客身上反射回来的光线从而识别并统计乘客上下车方向及人数。这种方法具有很高的识别度,可以识别拥挤人群、正反向人群、滞留与流动人群等不同状态,具有很强的抗干扰性,有效的避免了环境、光线、温度等的影响。此外可以引入红外线激光发射器进行辅助识别,通过装有带通滤波器的车载摄像头捕捉激光线的位置变化来确定乘客人数。

本系统通过实时分析车载摄像头给出的信息,统计每个站点视频画面中人数,进行实时的数据采集,完成实时的客流统计,从而对车内拥挤度进行准确判断。而精确度的根本在于尽可能地减少摄像头所识别出的人数与实际人数的误差,其度量需要经过目标检测、目标跟踪、乘客行为分析三个步骤。目标检测是计算机视觉处理不可或缺的一环,其焦点置于所选目标的位置并划定范围,基本过程包括了图像数据、预处理、特征提取、分类器训练、目标检测五部分。

以公交车为例,在前后车门各安装一组摄像头,由于身体躯干等部分在人群密集时会被遮挡,采集不到相应的信息,导致统计出现误差。因此将乘客明显特征如面部、肩部作为目标正样本,进行人脸识别与轮廓匹配,这样会降低颜色、光线、噪声以及阴影的影响。为了增强干扰性,获得真正意义上的边缘前景,对当前帧的边缘图像和背景的边缘图像进行了做差计算。然后利用圆检测进行轮廓识别,相比其他方法更易于操作,识别率高,能够高效的进行检测,为客流统计系统提供了强有力的依据。

5.2 研究与展望

该系统用于对公交车各站点人数的预测,进而判断车内拥挤度。此系统可以与app或者小程序结合,给用户提供相应信息。当用户选择公交出行时,输入选择乘车的站点,系统会根据实时数据计算出未来公交车到达本站点时的人數,然后给出公交车内拥挤度,用户可以根据拥挤度选择是否乘坐该公交车。此外,系统还会根据上一时刻的客流数据给出该车辆拥挤度变化趋势,用户可以知道各个路段的拥挤程度,从而选择更加舒适的方式出行。

6 结论

本文以bp神经网络建立拥挤度预测模型,并根据实际情况改进相应的算法。以吉林省吉林市56路公交线路的数据为训练样本进行训练,以进行预测检验,结果证明,该模型具有较高的预测精度。

参考文献

[1]李荣庆.公交拥挤司乘行为博弈分析及对策[J].对外经贸,2012(04):101-103.

[2]蒋盛川,孙轶凡,杜豫川.拥挤度对公共交通方式选择意愿的影响[J].同济大学学报(自然科学版),2012,40(12):1831-1835.

[3]侯现耀. 智能公交信息对城市居民公交出行方式选择的影响研究[D].东南大学,2016.

[4]刘翠,张艳青,陈洪仁 . 基于 BP 神经网络的公交线路站点时段上下车人数预测模型 [J]. 交通标准化,2008(177):186-189。

[5]任崇岭,曹成铉,李静,史文雯 . 基于小波神经网络的短时客流量预测研究 [J]. 科学技术与工程,2011,07,11(21):5099-5103.

[6]范海雁,范炳全,张林峰,等.灰色网络预测方法在公交客流预测中的应用[ J] .上海理工大学 报,2003,25(1):25-28.

[7]孙爱充.公交客流预测方法研究[ J] .城市交通,1996,(6):32—33.

(作者单位:吉林大学交通学院)

猜你喜欢
预测模型BP神经网络
基于矩阵理论下的高校教师人员流动趋势预测
基于支持向量回归的台湾旅游短期客流量预测模型研究
基于神经网络的北京市房价预测研究
就bp神经网络银行选址模型的相关研究
中国石化J分公司油气开发投资分析与预测模型研究
基于DEA—GA—BP的建设工程评标方法研究
复杂背景下的手势识别方法
BP神经网络在软件质量评价中的应用研究 
BP神经网络算法在数值预报产品释用中的应用
基于IOWHA法的物流需求组合改善与预测模型构建