基于大数据处理的公共自行车服务系统研究

2016-09-20 10:24宣子岳朱家明张素洁张庆茹
赤峰学院学报·自然科学版 2016年16期
关键词:借车用车数据处理

宣子岳,朱家明,张素洁,张庆茹

(1.安徽财经大学 统计与应用数学学院;2.安徽财经大学 金融学院,安徽 蚌埠 233030)

基于大数据处理的公共自行车服务系统研究

宣子岳1,朱家明1,张素洁1,张庆茹2

(1.安徽财经大学统计与应用数学学院;2.安徽财经大学金融学院,安徽蚌埠233030)

本文针对浙江省温州市鹿城区公共自行车使用数据,使用数据透视表、GIS分析法等方法,基于公共自行车服务模式和使用规则,运用SPSS、EXCEL软件,对公共自行车服务系统从各个站点运行规律、借车人借车规律和高峰日的具体运行规律三个方面进行研究.并通过分析结果对目前公共自行车服务系统进行了评价,同时给出了提高公共自行车服务系统效率的建议.

公共自行车;大数据处理;SPSS;EXCEL

公共自行车服务系统由管理中心、站点、发卡处、调度中心、通讯网络和互联网业务平台共同组成,其中站点又包括公共自行车、锁车器和站点控制器.其运营原理是利用通讯网络信号,通过站点控制器将站点运营信息上传到管理中心服务器,管理人员利用互联网调取服务器中的站点信息,从而实现管理中心对全城各个站点的整体管控.[1]研究公共自行车的借还车规律,为公共自行车系统提供规划分析的决策支持,充分发挥公共自行车的综合优势,对改善居民的出行状况、缓解城市交通拥挤、促进城市交通可持续发展具有重要意义.

1 模型假设

⑴假设用户和借车卡之间是一一对应的关系;

⑵假设所查找到的数据真实可靠;

⑶假设用车时长在10h以上和1min以下的均为异常数据,不予以统计.

2 各站点借还车频次的统计模型

2.1研究思路

为了分别统计各站点20天中每天及累计的借车频次和还车频次,并对所有站点按累计的借车频次和还车频次分别给出它们的排序,得到每次用车时长的分布情况,借助EXCEL和SPSS对所给的数据做了处理.为了方便说明,引入了用车时长的人数分布频率的概念.

2.2数据处理

在对数据预处理的过程中,我们发现了表格中的错误,并将错误归纳如下:⑴除了180个站点外,还有编号为1000的调试点;⑵用车时长为0的数据分为两种情况,一种是因为借出自行车后,发现自行车有故障或者其他原因在一分钟之内又将其放回,另一种是由于记录中只有借车记录而没有还车记录,用车时长记为0;⑶用时在10h以上和1min以下的,均认为异常数据,不予以统计;⑷站点的编号是1~107和109~181.[1]

将20天的用车时长的数据导入SPSS后,得到了时长在0~6601分钟范围内的487组数据.我们发现用车时长集中在小于100分钟的范围内,因此对用车时长的人数分布频率进行了计算.用车时长的人数分布频率就是将用车时长按照一定的组距进行划分,划分后每组的人数除以用车总人数,结果见表1.

表1 用车时长的人数分布频率表

2.3结果分析

用EXCEL得到了各站点20天中每天及累计的借车频次和还车频次,然后对所有站点按累计的借车频次和还车频次分别进行排序,部分结果如图1、2、3、4所示.

从以上几幅图中可以直观的看出,站点的自行车借出量与归还量相差不大,也就是说借出量大的站点归还量也比较大,借出量少的站点归还量也比较少.

由图5可知,用车时长大多分布在30分钟以内,当用车时长多于30分钟时,出行者一般会考虑换乘其他交通工具继续行程.

图1 第一天各站点的借车频次统计

图2 第一天各站点的还车频次

图3 各站点20天累计借车频次

图4 各站点20天累计借车频次

图5 用车时长在100分钟以内的人数分布直方图

3 借车卡累计借车次数统计模型

3.1研究思路

根据温州市鹿城区借车卡办理方法规定,每张身份证限办一张借车卡,并且一张借车卡只能借一辆公共自行车.因此我们假定用户和借车卡之间是一一对应的关系,即每个用户各采用一张借车卡.为得到20天中各天使用公共自行车的不同借车卡数量,我们对数据使用EXCEL软件中的数据透视表功能对其进行处理.再利用SPSS软件的标识重复个案和选择个案功能对原始数据进行累加统计,由此得出每张借车卡累计借车次数的分布情况.

3.2数据处理

建立累加模型对每天累计借车次数以及20天总累计借车次数进行求解:

3.3结果分析

表2 不同借车卡每天累计数量

由表2可知,第20天借车人最多,第10天借车人最少.

表3 累计借车次数的区间频次统计

由表3可知,大部分人的借车次数都在30次以内,样本点99.2%的用户的借车次数都在100次以下,只有极少数人超过100次.

4 公共自行车使用次数最多一天的基本情况统计分析

4.1站点间距离的定义

4.1.1研究思路

已知站点181个,根据数理统计排列组合可知,距离数值共有C21R1组,短时间内无法通过地图精确计算任意两个站点之间的距离.因此选取不同站点间自行车代步所用的时间来估计不同站点间的距离.[3]我们定义:

s=vt

其中,v是一般自行车的骑行速度,t是不同站点之间自行车骑行的时间.

4.1.2数据处理

一般人的骑自行车速度为12~15km/h,为简便计算,取v=13.5km/h,即v=0.225km/min.[4]假设借车人从借车时起到还车时止,均在匀速骑车.部分借车站点的最近与最远还车站点及距离见表4.

表4 借车站点的最近与最远还车站点及距离(部分)

4.2借还车频次最高的站点基本情况统计分析

4.2.1研究思路

对于第二十天的数据,首先用EXCEL中的数据透视图求出所有车站的借车频次和还车频次,再对其进行排序,得到借车频次最高和还车频次最高的站点.针对所得的两个站点,对其借车时刻、还车时刻、用车时长分别进行条件筛选.由于数据量过大,为了统计方便,将时间段以两个小时为一层次、借车时长分钟段以10分钟为一段进行划分后统计出其各自分布.[6]

4.2.2数据处理

对于第二十天的数据,用EXCEL中的数据透视图求出所有车站的借车频次和还车频次,再进行排序,下表列出的是排名前十的借还车站:

表5 借车还车频次排名前十的站点统计

由上表可以知道借车频次最高的站点为42(街心公园),还车的频次最高的站点为56(五马美食林),对于第二十天的数据,用EXCEL中的数据透视图求出所有车站的借车频次和还车频次,再对其进行排序,得到借车频次最高和还车频次最高的站点.[5]我们将时间段以两个小时为一层次、借车时长分钟段以10分钟为一段进行划分,结果如表6、7所示.

表6 借还车时刻分布表

表7 用车时长分布

4.3各站点借还车峰值的统计分析

4.3.1研究思路

将一天中的借还车时段进行合理划分,统计出每个时间段各站点的借、还车频次,设置界定值筛选出每个车站的高峰期,并得出高峰时段各站点的借车频次和还车频次,最后对具有共同借车高峰时段和还车高峰时段的站点分别进行归类.

4.3.2数据处理

定义最小时间段为2小时,将借车还车总时间段6: 00—22:00划分为八个小的时间段.[7]统计181个站点每两个小时内的借车频次和还车频次,部分结果见表8、表9.

根据每个站点借还车频次的总和,计算每个时间段借还车频次占全天频次的比例.将两小时内借还车频次占全天比值大于0.20的时间段均称为高峰时间段.大部分站点借车高峰期和还车高峰期在8:00—10:00和16:00—18:00,相对于借车高峰期来说,还车高峰期在8:00—10:00的更多一些.这些时间正好处于上下班的高峰期,所以借还车频次增多实属正常.通过对具有共同借车高峰时段和还车高峰时段的站点的归类,可为公共自行车站点的管理提供参考,以能得到更好的管理效果,增大自行车站点的利用率.

表8 前十个车站的各时段的借车频次

表9 前十个车站的各时段的还车频次

5 公共自行车服务系统的评价分析

5.1研究思路

对公共自行车服务系统的评价分为两部分:一是从宏观角度,将各个站点的地理位置与站点总数的设定做出总评价;二是根据每个站点的数据评价单个站点的服务效率,作出相应锁桩数量的配置评价.

5.2数据处理

5.2.1站点总数的设置

公共自行车站点这类公共设施的建设一般采取“一次规划,分期建成”的办法.对于“一次规划”,我们可以参照GIS分析方式,这种分析方式就是将区域内的有利于公共自行车使用的GIS数据集进行加权,根据加权值判断一个区域内核心服务的范围.区域面积与站点数的函数关系式:

S=16A1+9A2

S为站点数量,A1为核心服务范围面积,A2为扩展服务范围面积,单位为km2.[8]

计算出站点基础设置数为S=16×8+9×2=146(个).对于“分期建成”,我们可以根据后期各个区域内所有站点的服务效率的不同进行站点数量相应的调整和增减.

5.2.2站点间服务效率的对比

图6 各站点用车总次数对比图

从图中可以看出,对比各个站点之间的用车频次数据有较大差别,若取5000为一个分界点,可以认为在用车总次数不超过5000或者更低的站点服务效率不高.例如累计用车次数后十位的以下站点,这些站点可能存在较大的缺陷,应视为重点整改对象.

表10 累计用车次数后十位的站点

5.2.3单个站点的锁桩数量与投放车辆数的设置

在一般情况下,投放自行车数与锁桩数量为1:1.3到1: 1.5之间的比例,这是由于有些站点的借车数与还车数不能保持相同,为减少车辆调度以及考虑到检修车辆和被盗车辆,锁桩数要大于车辆数.由于自行车数量的设定是按照一地居民的出行来定,投放自行车数量的计算公式可表示如下:

其中X为投放公共自行车数,k为人口,p为对应人群的日均出行次数,l为出行方式,m为对应出行方式转变率,n为新增出行比例,a为坏车率,b为丢车率,t为每车日均租借量.[9]

经过统计,发现每个站点的锁桩数均为20,锁桩数量的设置没有考虑到不同站点自行车的使用率,所以该地区应考虑在自行车使用率较高的地区,向以下列举的公共自行车使用率高的前15个站点增加公共自行车锁桩的数量.

表11 自行车使用次数

6 结语

⑴所有站点的用车量随周期性波动,且波动量较大.这时可以通过在低峰期超过一定时间少收费、不限时用车等措施鼓励居民在低峰期多使用公共自行车,避免车辆闲置而导致的资源浪费.

⑵各站点的借还车的频次存在差异.公共自行车行车系统(PBS)主要通过后台控制中心和区域调度中心来完成车辆调配.通过各服务点自行车停放情况的跟踪统计,当车辆数低于某一个阈值时,启动调度,并对站点实行实时监控,保证调度最优化.

⑶通过对数据的统计分析,发现所有的借车时间均在6:00到22:00之间.再加之夜间行车存在安全隐患,建议缩短服务每天时间,不再全天24小时,可以降低PBS的运行成本.

⑷原数据中存在不少用车时间小于1分钟的借还车记录,可能是借车人借出车辆后发现车辆损坏,于是立即将车归还.建议启动报修系统,当借车人发现车辆损坏时可以进行网上报修,修理人员就可以及时对车辆进行维修,以保障供给车辆数.

〔1〕黄建德.城市公共自行车系统发展研究[D].华中科技大学,2013.

〔2〕吕丹.“公共自行车服务系统”研究与大数据处理[J].数学建模及其应用,2013,2(11):20-41.

〔3〕姚遥,周杨军.杭州市公共自行车系统规划[J].城市交通,2009(4):30-38.

〔4〕钱俭,郑志峰,冯雨峰.杭州公共自行车设施现状调查与思考[J].规划师,2010(1):71-76.

〔5〕李黎辉,陈华,孙小丽.武汉市公共自行车租聘点布局规划[J].城市交通,2009(4):39-44.

〔6〕朱强,郭晟.广州市公共自行车交通系统实施策略研究[J].黑龙江交通科技,2009(8):199-200.

〔7〕李正浩.城市公共自行车租聘站远期发展规模分析[J].交通节能与环保,2010(2):44-46.

〔8〕杨桂元,黄己立.数学建模[M].合肥:中国科学技术大学出版社,2008(8).

〔9〕姜启源,谢金星,叶俊.数学建模(第四版)[M].北京:高等教育出版社,2011(1).

O212;U491.2

A

1673-260X(2016)08-0005-05

2016-06-11

本文属国家自然科学项目(11301001),安徽财经大学科研项目(acjyzd201429)阶段性研究成果

朱家明(1973-),男,安徽泗县人,安徽财经大学数学建模实验室主任,副教授,硕士,研究方向:应用数学与数学建模

猜你喜欢
借车用车数据处理
认知诊断缺失数据处理方法的比较:零替换、多重插补与极大似然估计法*
ILWT-EEMD数据处理的ELM滚动轴承故障诊断
2019年全国两会用车“全面体检”
微信有奖互动专栏
安防巨头借车联网东风 促智能交通发展升级
微信有奖互动专栏
基本杀法能力训练之借车使炮杀法
寻衅滋事大众T6对决奔驰V级
基于希尔伯特- 黄变换的去噪法在外测数据处理中的应用
Matlab在密立根油滴实验数据处理中的应用