基于MGWR模型的城市住宅用地地价驱动因素分析

2022-05-10 12:53刘亚静李胜男
关键词:回归系数唐山市尺度

刘亚静,李胜男

(华北理工大学 矿业工程学院,河北 唐山 063210)

引言

城市地价是在土地质量、区位优劣、经济发展水平以及政策引导等多种制约因素的共同作用下形成的,能够反映出一个城市的综合实力[1]。我国自2002年实施土地招标拍卖挂牌出让管理制度以来,土地市场逐渐发育完善,区域内或城市间土地价格的空间分异现象也逐渐凸显[2]。国内学者对土地价格影响因素的探讨始于20世纪90年代,大部分学者认为城市地价的驱动因素具有多变性和复杂性[3]。在研究方法的选择上,主要运用地统计学与计量经济学模型进行研究,且多利用特征价格模型解释地价与驱动因素之间的相互关联,无法揭示驱动因子的局部影响。近年来,地理加权回归和空间自相关分析相结合的方法被广泛应用到城市地价的驱动因素研究之中。李晓进[4]等通过构建河北省147个县市地价与其驱动因素的GWR模型,探讨了各驱动因子对河北省地价的影响强度及其空间差异性。莫悦[2]等基于2016年长江经济带城市的土地均价数据,采用趋势分析与空间自相关分析探讨低价的空间分布与关联特征,通过地理探测器模型分析研究区内城市地价空间分异的成因。王爱[5]等基于2010~2014年合肥市主城区的居住用地地价数据,采用地统计和GWR模型方法分析了合肥市居住用地地价的空间格局及其影响因素。邵洪琪[6]等以2013~2018年徐州市住宅用地地价数据为基础,运用克里金法和地理加权回归法对徐州市住宅地价的空间分异及其影响因素进行了研究。常疆[7]等采用特征价格模型和计量学相结合的方法,对长沙市2003~2009年上半年的商业、住宅、工业用地地价数据进行分析,探讨3类用地的空间分布特征及其影响因素。

从现有研究来看,我国城市地价研究主要关注的内容是城市住宅地价与商业地价,对于城市地价空间分异的研究多为区域差异与城市间差异,对于城市内部土地价格在内的空间分布和差异的研究虽然也有一定的涉及,但相对而言较为有限。对于研究方法,沈体雁[8]等首次将前沿的多尺度地理加权回归(Multi-scale Geographic Weighted Regression)模型与特征价格模型相结合,对北京市二手住宅价格的影响机制进行探究。多尺度地理加权回归(MGWR)模型在2017年由Fotheringham提出,2019年由Yu等对其统计推断并进行了补充完善,目前在城市地价方面的应用研究较少。相比于经典地理加权回归模型,MGWR模型能够将不同变量对于因变量的影响尺度反映出来,回归结果更接近真实[8]。

基于此,该研究以2011~2019年唐山市住宅土地出让成交均价为基础数据,以唐山市为研究区域,借助ArcGIS10.2软件,采用全局趋势分析、克里金插值法和空间自相关分析探讨唐山市住宅用地地价的空间分布格局和关联特征,通过构建唐山市住宅用地地价及其驱动因素的MGWR模型剖析不同驱动因子对唐山市住宅地价的影响及其空间差异性,丰富地价驱动因素的研究,为政府科学制定有关地价管理政策、合理调控土地市场、优化资源配置提供理论依据[2,3]。

1研究区域与数据

1.1 研究区概况

唐山市位于河北省东部、华北平原东北部,南临渤海,北依燕山,毗邻京津,地处交通要塞,是华北地区通往东北地区的咽喉地带,总面积为13 472 km2,是中国(唐山)跨境电子商务综合试验区、中国(河北)自由贸易试验区组成部分[9]。唐山有唐钢、开滦等72条企业专用铁路线延伸至各重点厂矿企业,铁路网密度为5.83 km/百km2,是全国铁路网密度较高的地区之一[10]。

唐山市包括路南区、路北区、丰润区、丰南区、曹妃甸区、古冶区、开平区在内的7个市辖区,遵化市、迁安市、滦州市3个县级市,乐亭县、迁西县、滦南县、玉田县4个县,另外还包括汉沽管理区和芦台经济开发区。唐山市常住人口为796.4万人,地区生产总值为6 890.0亿元,其中,第一产业增加值为531.2亿元,第二产业增加值为3 613.3亿元,第三产业增加值2 745.5亿元[11]。研究区概况如图1所示。

图1 研究区概况

1.2 数据来源及预处理

1.2.1地价数据

在我国土地价格表现为出让或转让国有建设用地使用权的价格。地价数据来源于土地市场网(http://landchina.mnr.gov.cn/),以唐山市2010~2019年通过招标、拍卖、挂牌3种方式出让成交的住宅地价数据为研究对象,利用高德地图开放平台获取各成交用地的经纬度信息,剔除概念明显不符或模糊、信息缺失的样点,经过初步筛选,最终确定的有效样本点为263个,包括土地所在市县区、出让时间、面积、位置、容积率、土地用途、成交价格、成交均价、土地级别以及经纬度等属性信息。

1.2.2其他数据

涉及的城市热点数据是通过网络爬虫爬取的高德地图POI数据,主要选取了三甲医院、重点中学、公交站点和公园4种POI数据;OSM路网数据源于Open Street Map官网;城市人口密度数据源于LandScan全球人口动态统计分析数据库(https://www.satpalda.com/product/landscan/),空间分辨率接近1 km*1 km,单位为每平方公里的人口数量;基础城市矢量数据从全国地理信息资源目录服务系统获得。

运用ArcGIS10.2平台对POI数据进行邻近分析,分别获得POI点到宗地样点的最短距离,根据《城市公共交通站、场、厂设计规范》采用缓冲区分析,统计宗地样点800 m范围内的公交站点数量[12]。

2研究方法

2.1 空间自相关分析

空间自相关分析需要综合考虑宗地样点的位置与地价信息来探究空间对象间的相互关系,检验空间样点对周围样点的依赖程度[13]。通过空间自相关分析探索唐山市各县区不同用途土地价格在空间上的关联特征,Moran’s I >0表示空间正相关,空间实体呈聚集状态;反之表示空间负相关,空间实体呈离散状态;Moran’s I =0表示不相关,空间实体呈随机分布[4]。全局莫兰指数(Global Moran’s I)可以用来判断唐山市地价整体的相关程度和依赖程度,值越大则空间相关性性越大,表达式为:

(1)

局部自相关分析可进一步探索数据在空间上的聚集情况与空间异质现象,能够很好地识别出哪个区域单元的贡献高[14],可用来探究唐山市土地价格在局部区聚集的显著性及聚集模式,可用局部莫兰指数(Local Moran’s I)进行测度,其表达式为:

(2)

2.2 克里金插值

克里金插值是以变异函数理论和结构分析为基础,在有限区域内对存在空间相关性的区域化变量进行无偏最优估计,可以研究城市地价的空间分异特征。该方法综合考虑了样本点的形状、大小、空间方位和与未知样点的空间相互位置关系,充分利用已有观测值的空间结构特征,能有效避免系统误差,对评估结果进行优化[6]。其表达式为 :

(3)

式中:Z(x0)表示未知宗地地价样点的属性值,Z(xi)表示未知宗地地价样点周围已知样点的属性值,λi为第i个宗地地价样点的权重,在普通克里金法中,权重λi取决于已知样点与预测点的距离和预测样点周围的样点值之间空间关系的拟合模型;n为已知宗地地价样点的个数。

2.3 多尺度地理加权回归模型

(4)

式中:yi为第i个宗地样点的地价;xij为第i个宗地样点处第j个地价驱动因子指标值;(μi,vi)为第i个宗地样点的空间坐标;εi表示第i个宗地样本点处的随机误差;βbwj表示第j个地价驱动因子回归系数的带宽。

在GWR模型中,所有驱动因子的带宽都是相同的,而MGWR模型的每个回归系数都是基于局部回归得到的,每个驱动因子都有一个带宽。该研究在核函数及带宽的选择上与经典GWR模型相同,初始化选择经典GWR估计,选择回归系数变化比例作为收敛准则。

3唐山市住宅地价空间特征

3.1 空间趋势特征

全局趋势分析可以描述事物在空间区域上变化的主体特征,揭示总体规律,有助于识别研究区域的不同用途地价数据整体在空间上的趋势,其中x、y代表宗地样点的经纬度,z代表样点地价,x轴表示东西方向,y轴表示南北方向。运用ArcGIS10.2软件对唐山市住宅用地地价进行趋势分析,生成趋势变化图(见图2)。结果显示:唐山市住宅地价在东西方向上呈现出东部低、西部高的趋势,南北方向上呈现出南部低、北部高的趋势,为“倒U型”结构。

图2 住宅地价趋势分析图

3.2 空间关联特征

为了进一步探讨唐山市住宅地价的关联特征,利用ArcGIS10.2软件对唐山市住宅地价进行空间自相关分析。住宅地价的Moran’s I值为0.634 3,在空间上呈现出显著的正相关性。

在此基础上,根据Local Moran’s I指数测算住宅用地地价在空间上的聚类情况。图3所示为唐山市住宅地价局部自相关性,由图3可知:由于受到人口聚集和经济发展的影响,住宅用地地价的高值聚集区主要分布在路南区和路北区。经过空间数据的相关性分析可知,唐山市2010~2019年的各类用地地价样本点具有空间相关性和空间非稳定性特征,为克里金插值和构建MGWR模型奠定了基础。

图3 唐山市住宅地价局部自相关性

3.3 空间分异特征

应用ArcGIS平台,基于正态QQ分布图(Normal QQ Plot)检查数据的正态分布,对唐山市住宅用地地价进行对数变换,得到的数据图形接近一条直线,说明该数据接近于服从正态分布。结果表明,住宅用地地价样本点基本呈正态分布(见图4),说明可进行下一步的克里金插值。

图4 住宅用地地价样本点QQ分布图

采用克里金插值法对唐山市263个住宅样本地价进行插值,从而对其地价的空间分异特征进行分析。图5所示为唐山市住宅地价克里金插值分析,由图5可知:唐山市住宅用地地价以西南-东北方向的“丰南区-滦州市”为轴,上半部地区地价较高,下半部地区地价较低,在迁安市区域呈现出带状分布,丰润区呈现圈状分层分布,由内向外逐渐递减,乐亭县为主要低地价区。

图5 唐山市住宅地价克里金插值分析

4唐山市住宅地价驱动因素分析

4.1 城市地价驱动因素指标选取

城市土地价格是经济、社会、环境和区位等多重因素综合作用的结果,且不同用途土地的价格其驱动因素也有所不同。通过梳理多位学者的研究成果[12,14,16],结合唐山市社会经济发展状况和资料可获取程度,从宏观因素和微观因素2个方面,初步确定10个驱动因素,具体量化标准如表1所示,探讨唐山市土地价格空间分异原因。

表1 驱动因子选择与量化表

运用SPSS软件的方差膨胀因子法(Variance Inflation Factor,VIF)诊断各影响因子之间是否存在多重共线性,一般用VIF值表示变量之间共线性的大小。VIF值越大,说明变量间的共线性越强,若VIF≥10,则变量之间存在严重共线性,需要剔除[4]。经过检验,各影响因子的VIF值均小于4.6,即各影响因子之间共线性较弱。

4.2 唐山市住宅地价驱动因素的空间尺度和空间分异

由于唐山市住宅用地地价在空间上呈现出明显的空间自相关性和空间异质性,多尺度地理加权回归模型允许每个变量有各自特定的带宽,作为每个空间过程作用的空间尺度的指标,客观地表征地价的空间变化规律,使结果更接近真实的空间过程。运用MGWR开源软件构建多尺度地理加权回归模型,通过ArcGIS10.2平台对各驱动因子的回归系数可视化,分析不同驱动因子在不同区域位置对城市住宅地价作用的强弱及相关性,更加直观明了地分析各因素对住宅用地地价空间分异的影响。

4.2.1驱动因素的空间尺度分析

表2所示为多尺度地理加权回归与经典地理加权回归模型带宽,由表2可知,在MGWR模型中不同驱动因子的作用尺度存在差异性,而经典GWR模型只能反映出各驱动因子作用尺度的均值。通过MGWR回归结果发现,人口密度、人均GDP、宗地面积、公交便捷度、道路通达度和距重点中学的距离6个驱动因子的回归系数整体显著,而土地级别、繁华度、三甲医院和公园广场4个因子的回归系数不显著。在显著性驱动因子中人均GDP的作用尺度最小为50,占总样本的19.01%,这说明住宅用地地价随距高速公路距离的增加在空间上差异较大;人口密度作用尺度为98,占总样本的37.26%,同样尺度较小;重点中学和公交便捷度的作用尺度均为262,属于全局尺度,几乎不存在空间异质性;宗地面积与道路通达度作用尺度相似,均属于较大的尺度。

表2 多尺度地理加权回归与经典地理加权回归模型带宽

4.2.2驱动因素的空间异质性分析

MGWR模型各驱动因子的回归系数统计性描述见表3所示,图6所示为多尺度地理加权回归系数空间格局。人口密度对住宅地价影响显著,总体上呈正向影响,即住宅地价随人口密度的增加而上涨,与预期相符,如图6(a)所示。人口密度系数取值范围在[-0.083~1.288]之间,从系数绝对值来看,其影响强度在主城区地区最强。从空间分布来看,在沿海地区人口密度与住宅地价主要成正相关关系,在内陆地区主要表现为负相关关系,主要是主城区,且影响强度较弱,主要原因在于该区域住宅用地趋于饱和,且该区域经济发展较完善,住宅用地减少,使得住宅地价受人口密度的影响减弱。

人均GDP对住宅地价的影响除主城区外其他地区主要表现为正向影响,如图6(b)所示。人均GDP回归系数范围为[-1.513~1.299],既有正向作用又有负向作用,且跨度较大。由图6(b)可以看出,人均GDP不仅影响力大,且空间差异显著。从空间分异来看,唐山市人均GDP对地价的贡献最大的区域为主城区,其他绝大部分地区均为正向影响,这是由于人均GDP越高,一般居民的经济水平越高,居民购买能力较强,居住用地需求大,土地竞争激烈,带动地价的上涨。

宗地面积主要表现为正向影响住宅地价,其回归系数取值范围在[-0.014~0.070]之间,反映出由于面积大总价高,进而单价增加,其系数空间分布如图6(c)所示。除唐山市西北小部分地区外,其他区域均表现为正相关关系,且作用强度呈现出由沿海到内陆逐渐减小,宗地面积每增加1 km2,平均地价最多上涨75元。

道路通达度回归系数取值范围分布在[-0.300~0.017]之间,空间分布如图6(d)所示。从空间分布上看,大部分范围内主干道对住宅地价产生的是负向作用,主干道距离越近,住宅地价越高的规律。道路通达度对住宅地价正向作用强度最大的区域是沿海地区,这表明随着汽车数量不断增加,该区域交通拥堵常态化,主干道虽然为人们带来了便捷的交通条件,但也致使空气污染和噪声污染增加,环境质量降低,从而使该影响因素对地价的作用呈现出正相关性,起到负面影响[5]。

表3 多尺度地理加权回归系数统计表

图6 多尺度地理加权回归系数空间格局

重点中学对于住宅地价表现为显著的正向影响,重点高中对住宅地价的影响系数图如图6(e)所示。回归系数范围为[-1.627~3.467],且大部分区域省示范高中的距离与住宅地价呈负相关关系,即距离学校越近住宅地价越高,这源于高中教育是重要的学习阶段,“学区房”已成为一种稀缺的资源,优越的教育资源带动了周边地价的上涨,对住宅用地地价具有显著的提升作用。系数均值为-0.235,标准差为0.935,说明用地与重点中学的距离每缩短1 m,平均地价上涨235元。

公交便捷度对于住宅地价表现为显著的负向影响,即一定范围内公交站点数量越多,住宅地价越低,系数取值范围为[-0.237~-0.215],均值为-0.225,标准差为0.006。这说明公交站点对住宅地价产生了负面影响,且住宅用地一定范围内每增加一个公交站点,平均地价下降225元,主要原因在于随着交通方式的多样化,人们对于公共交通的依赖度降低,并且公交站点多的地段,通常交通拥堵情况严重。公交便捷度的回归系数空间分布如图6(f)所示,呈现圈层结构,在中心城区的影响强度大于其他地区。

5结论

(1)从空间趋势分析结果看,唐山市住宅地价在东西方向上呈现出东部低、西部高的趋势,南北方向上呈现出南部低、北部高的趋势,为“倒U型”结构。

(2)根据Moran’s I指数的测算,唐山市住宅地价的Moran’s I值为0.634 3,在空间上呈现出显著的正相关性,并且由于受到人口聚集和经济发展的影响,住宅用地地价的高值聚集区主要分布在路南区和路北区。

(3)通过克里金插值分析可知,唐山市住宅用地地价以西南-东北方向的“丰南区-滦州市”为轴,上半部地区地价较高,下半部较低,且在迁安市地区呈现出带状分布,丰润区呈现圈状分层分布,由内向外逐渐递减。

(4)不同驱动因子对地价的影响力存在显著的空间差异性。相比于经典GWR模型,MGWR模型能够将不同驱动因子的不同影响尺度很好地表现,通过多尺度地理加权回归分析结果可知,住宅用地地价主要受人口密度、人均GDP、道路通达度、交通通达度和重点中学的影响显著。

猜你喜欢
回归系数唐山市尺度
环境史衰败论叙事的正误及其评判尺度
小诗社大作为——唐山市祥富里拾秋诗社活动纪实
基于生产函数模型的地区经济发展影响因素分析
电导法协同Logistic方程进行6种苹果砧木抗寒性的比较
电导法协同Logistic方程进行6种苹果砧木抗寒性的比较
以长时间尺度看世界
唐山市档案局荣获国家档案局“2014‘走进档案’征文活动组织奖”
9
城镇居民收入差距主要因素回归分析
室外雕塑的尺度