基于层次聚类分析的城乡公交线路诊断*——以安宁市为例

2014-12-14 06:02谷金晶刘永超
交通信息与安全 2014年3期
关键词:安宁市判别函数公交线路

谷金晶 张 瑾 邹 毅 刘永超

(昆明理工大学交通工程学院 昆明 650000)

0 引言

在公路网逐渐完善,城乡联系日益密切的背景下,城乡公交作为联系城区和乡镇的重要载体,承担城乡间主要客流运输任务。通过诊断分析城乡公交线路现存问题,可为提高城乡公交服务水平,完善城乡公交功能、结构、规模和运营规划提供依据。

公交线路诊断的主要研究成果包括:朱海清[1]从线路特性和运输效率方面,分别选取线路长度、非直线系数、平均站距和客流量、高峰满载率、运输效益作为聚类因子,对常州市部分线路进行聚类分析,定性诊断不合理公交线路。刘阳明等[2]选取线路长度、非直线系数和日出行人数作为公交线路技术性能指标,运用聚类分析法诊断宁波市公交线路,得到线路技术性能分类结果,并提出了线路优化方案。王春雨[3]选取了车辆总数、线路长度、利润、平均发车间隔、站点数、总载客人次和平均满载率进行聚类分析,通过对比聚类结果差异定性地确定聚类属性个数。上述研究多侧重于定性诊断分析城市公交线路,笔者在分析城乡居民出行需求特征的基础上,构建基于层次聚类分析的城乡公交线路诊断流程,有效平衡公交乘客与公交企业之间的关系,提出1种定量与定性分析相结合的城乡公交线路诊断方法。

1 城乡公交服务特性分析

城乡公交加强并活跃了城市与乡镇地区间居民的互动交流,把城市与乡镇地区居民的居住、生活和游憩活动衔接为一体,推动了城市化发展的进程。

随着城乡道路设施的建设与完善,城乡居民出行需求也日益增加,城乡居民出行需求呈现出城市公交的需求特征[4]。对城乡居民出行性质和目的调查分析后,可将其出行需求分为:工作出行、学习出行、生产出行、集日出行、亲情出行和旅游出行七大类。可见,发展城乡公交衔接市、县及周边乡镇地区,为城乡居民提供舒适、经济、安全、方便的公共运输服务,符合城乡居民的切身利益要求。物理方面,城乡公交突破了短途班线客运站点少的障碍,设置固定的停靠点,方便了公交沿线居民就近上下车。运营方面,城乡公交线路有固定的发车频率,不以客流要求变化而变化,且票价统一。

城乡之间、乡镇之间的联系日益紧密,人员流动的规模和范围逐渐扩大[4]。按出行性质和目的可将城乡居民出行需求分为:工作出行、学习出行、生产出行、集日出行、亲情出行和旅游出行。结合城乡公交乘客出行需求和时空分布规律,分析居民出行OD 对是否在公交主线覆盖范围内,在方便居民出行的同时能吸引更多居民选择公交出行。城乡公交主线应满足公交乘客以下出行需求:工作日准时送达居民往返于城乡间的工作出行;接送学生准时安全上学和回家;进城购买生产资料或进行科技咨询活动的生产出行;集日购买生活用品或出售农副产品的出行;庙会、婚嫁等亲情出行;通过优质的城乡公交服务促进农村地区旅游业的发展,为居民提供1种方便、安全且活动时间自由的旅游出行等。

2 算法描述

依据城乡公交服务特性选取聚类指标,计算主成分,建立判别函数诊断各类别公交线路,提出线路优化方案。基于层次聚类分析的城乡公交线路诊断流程见图1。

图1 城乡公交线路诊断分析流程图Fig.1 Urban and rural bus lines diagnostic analysis flow chart

2.1 指标选取

诊断指标的确定应是定性和定量研究相互结合,定性分析主要考虑诊断指标的完备性、针对性和独立性等因素,定量分析则是通过检验使诊断指标体系更加科学合理。通过选取尽量少的指标,反映最主要和较全面的信息。公交线路诊断指标应侧重反映2方面内容:①注重单条公交线路本身结构特性;②注重线路自身功能发挥,即沿线居民公交出行需求满足程度、线路运送客流状态等。

城乡公交是公益与效益并存的二元结合体,运营过程中在考虑最大限度满足居民出行需求时要兼顾公交企业经营效益,使循环线路用时最少,提高支线公交效率。公交线路车辆配置数,反映了客流量多少,直接影响公交系统的整体效益。发车间隔的高低直接反映了乘客候车时间长短。通过居民出行OD 调查,基本确定城乡公交线路走向。本着公交覆盖每个行政村的原则,可确定线路长度和公交站点数。公交线路过长或过短会影响运输效率和车辆使用率,经营线路长度为线路长度与发车班次的乘积,对公交运营效益的影响至关重要,平均站距影响乘客出行方便程度。

依据全面、科学、客观和通用原则,从公交乘客与公交企业2个角度,抽取表征城乡公交线路物理特征、运营特征和公交乘客流量特征3方面的8个指标构建诊断指标体系,见表1。

2.2 主成分分析

孤立地分析每个指标会忽略指标间的相关性,盲目减少指标又会损失很多信息,甚至得出错误结论,因此采用主成分分析法定量检验诊断指标。采取把多个指标化成少数几个综合指标的统计分析方法,化简降维,找出既能反应变量信息量,相互间又不相干的综合因子[5]。使每个主成分均是原始变量的线性组合,克服了多角度、多因素诊断中的主观片面性,同时减少了公交数据的统计量和计算过程。

表1 城乡公交线路诊断指标体系Tab.1 Urban and rural bus line diagnosis index system

设随机变量x(x=x1,x2,…,xP)的相关系数矩阵为R,λ1≥λ2≥…≥λP为R的特征值,e1,e2,…,ep为对应的标准正交特征向量,第i(i=1,2,…,p)个主成分fi为[6]

若λi有重根,则ei和yi不唯一。x1,x2,…,xP的主成分是以R的特征向量为系数的线性组合,其方差为R的特征值。

设第k个主成分的方差占总方差的比例为pk,则有:

主成分f1,f2,…,fP累计方差贡献率为:,变量个数p较大时,如果前若干个主成分方差之和占了总方差很大部分(一般≥80%)时,用这些主成分代替原来的p个变量不会损失太多信息。

2.3 层次聚类分析

层次聚类分析法事先不用确定分多少类,凡具有数值特征的变量和样本都可采用层次聚类法。每个样本各成一类,度量所有样本间亲疏程度,把最亲密或最相似的样本首先聚成一小类。再度量剩余样本和小类的亲疏程度,将当前最亲密样本或小类再聚类,循环反复直到所有样本聚成一类为止[7]。

1)原始数据标准化。由于各指标的数量级相差较大,需对数据进行标准化处理,将初始测量值转换为无单位变量,才能确定各属性的权值。

计算绝对偏差。

p1i,p2i,…,pni为属性i的n个观测值,mi为各属性观测值的均值,即

计算标准化观测值Zji。

2)计算相关系数矩阵。用Pearson相关系数度量2个属性变量X、Y 线性相关性的强弱,样本计算的协方差和标准差代替总体的协方差和标准差,样本相关系数用r表示。

2.4 建立判别函数

根据变量值及其所属的类,求出判别函数。设有m类,建立1个准则对给定的任意1个样本X依据这个准则判断它来自哪个类别,判别函数的一般表达式为

式中:Y为判别值;X1,X2,…,Xn为反映研究对象特征的变量;a1,a2,…,an为各变量系数。判别函数的个数为:min{判别数-1,预测变量}。

3 实例分析

实际调查统计安宁市现有15条城乡公交线路[8],每个聚类对象分别是这15条公交线路对应的八个指标属性值,聚类对象表示如下。

对原始数据标准化处理后得到城乡公交线路指标相关系数矩阵见表2。

表2 安宁市城乡公交线路指标相关系数表Tab.2 Anning City urban and rural bus line index correlation coefficient table

从表2看到周末平均客流量与工作日平均客流量相关系数为0.989,即周末与工作日平均客流量密切相关。同理,票价与线路长度密切相关,这与实际相符。计算各指标的贡献率见表3。

特征值某种程度上可被看作表示主成分影响力度大小的指标,上表前3个主成分方差贡献率累计为92.427(>80%)。通过主成分分析将8个聚类指标重新组合成3个互相无关的综合指标来代替原来的指标,主成分的计算表达式分别为

表3 特征值及方差贡献率Tab.3 Characteristic value and variance contribution rate

用欧氏距离作为样本间距离,对安宁市15条城乡公交线路进行聚类分析得到指标聚类树状图,见图2。

图2 安宁市城乡公交线路聚类树状关系图Fig.2 Anning city urban and rural public bus line clustering tree diagram

分析图2得公交线路分为4个类别,各类别包含的公交线路见表4。

表4 安宁市城乡公交线路分类统计表Tab.4 Anning cityurban and rural public buslinesclassification statistics

运用费歇尔判别分析准则计算,得安宁市城乡公交线路聚类判别函数系数如表5所示。

依据式(9),建立形如,Y=a1X1+a2X2+…+anXn的判别函数依次为

表5 判别函数系数表Tab.5 Discriminant function coefficients

4 诊断分析

将公交线路聚类分析结果和判别函数综合考虑,对四类城乡公交线路进行诊断分析的结果见表6。

根据安宁市城乡公交聚类线路诊断分析结果,结合安宁市公交运营实际情况提出一些改进建议。

表6 安宁市城乡公交聚类线路诊断分析Tab.6 Analysis of urban and rural public busclusteringlinediagnosis of Anning City

1)I类公交线路:13 路和15 路公交线路使安宁市中心分别与县街客运站和草铺客运站连通,填补了安宁市中心以西和以南公交线路的不足,线路长度和走向布设合理。8路、12路、36路公交线路重点覆盖安宁市东北部和东部地区,是安宁客运站的补充线路。可保持现有公交线路走向和长度不变,结合客流规律,适当调整平峰时段公交发车间隔,以满足居民出行需要。

2)II类公交线路,连接安宁市区主要集散点,填补市区线路不足,可结合居民出行特征,考虑适当调整线路或公交站点的位置。

3)III类公交线路,连通了安宁市中心区与南部八街客运站和西北部交通不甚发达地区禄裱、北冲、密马龙。从地理区域上看公交线路设置合理,造成客流量过少的主要原因为:郊区客流分布稀疏,线路较长且出行乘客较少且客源不稳定。

4)IV 类公交线路,35路公交线路填补安宁市中心东南较近区域公交线路,39路连接安宁客运站与青龙中学。现有线路长度和站点基本保持不变,结合学生出行特征,高峰时段安全准时接送学生出行,合理调整发车间隔。优化运营组织,尽量避免出现高峰时段运力不足而低峰时段运力过剩的状况。

安宁市区至乡镇公交线路总长度为306km,线路布设较为完善,也比较合理,但应加强公交运营管理。

5 结束语

笔者立足于公交乘客和公交企业的利益,以城乡公交线路为研究对象,抽取了表征城乡公交线路物理特性、运营特性和公交客流流量特性的共8个指标,定量确定出3个主成分后,运用层次聚类分析方法将安宁市城乡公交线路分为4类,建立判别函数,采用定量与定性相结合的方法诊断公交线路,得出的诊断结果与实际调查相符,在实践中可很好地指导城乡公交规划运营管理工作。

[1]朱海清.城市常规公交线路优化方法研究[D].南京:东南大学,2003.

[2]刘阳明,李伟芳,颜子斌.基于聚类分析法的宁波市公交线路技术性能诊断[J].宁波大学学报:理工版,2011,24(3):120-123.

[3]王春雨.公交客流数据分析的研究[D].石家庄:河北工业大学,2006.

[4]过秀成,姜晓红.城乡公共客运规划与组织[M].北京:清华大学出版社,2011:8.

[5]吴国平,宋崇辉,旺 煜.地理建模[M].南京:东南大学出版社,2012.

[6]周玉敏,邓维斌.SPSS16.0与统计数据分析[M].成都:西南财经大学出版社,2003.

[7]谢蕾蕾,宋志刚,何旭洪.SPSS统计分析实用教程[M].北京:人民邮电出版社,2013.

[8]邹 毅,张 瑾,蔡志勇,等.安宁市城乡公交一体化规划研究[M].北京:人民交通出版社,2012.

猜你喜欢
安宁市判别函数公交线路
安宁市劳动者职业卫生权益知信行调查
安宁市老年人高血压检出率及其影响因素
Fisher判别法在个人信用风险评估中的应用
安宁市总工会:启动新时代“螳川先锋”文明宣讲
游乐设施事故与危险量化判别函数的构建
探究上市公司财务预警的数学模型
安宁市档案局贯彻落实《安宁市档案管理办法》
基于GIS的公交路线优化设计
城市轨道交通车站联合配置短驳道路公交线路的方法
基于Fisher判别函数的酒店员工离职预警研究