基于GM(1,1)模型及BP神经网络的四城市房价分析与预测

2018-07-20 01:40綦文彬侯宗润李贵熙
电脑知识与技术 2018年13期
关键词:马尔萨斯流动人口房价

綦文彬 侯宗润 李贵熙

摘要:房价趋势分析、预测对于研究我国国民经济趋势具有重要意义。本文主要讨论了国内房价的预测问题,通过建立数学模型对近三个月国内一、二线样本城市(北京、上海、重庆、青岛)的房价进行预测。该文通过建立GM(1,1)模型、拟合时间序列,建立关于人口与房价的马尔萨斯模型,建立关于经济总量、职工平均工资、商品房施工面积、城市居民可支配收入等因素的BP神经网络模型等方式对历年各城市房价进行多角度分析,并得到最优预测模型。综合以上模型的结果,预测所选样本城市未来三个月房价走势,并得出有关结论。

关键词:GM(1,1)模型;神经网络;房价预测;马尔萨斯模型;数学建模

中图分类号:TP183 文献标识码:A 文章编号:1009-3044(2018)12-0179-07

Analysis and Prediction for Housing Price of Four Cities Based on GM(1,1) Model and Neural Net Methods

QI Wen-bin, HOU Zong-run, LI Gui-xi

(Qingdao No.2 Middle School, Qingdao 266000,China)

Abstract: House pricing tendency analysis and prediction are very important for national economy. This article is mainly focused on the discussion of domestic cities housing price prediction. Through building mathematical models make the price prediction for first-tier and second-tier sampling cities (Beijing, Shanghai, Chongqing, Qingdao) in the latest three months. By building GM(1,1) model to integrate time sequence and Malthus model about population and housing price as well as BP neural net model about many aspects which includes economic total quantity and staff average salary and constructed commercial housing area and disposable income for urban dwellers etc. Make analysis on the housing price from multi-aspects in last years, so as to get the best predicting model. Study all the results from above three models and predict the housing price tendency for the sampling cities in the next three months and get the conclusions eventually.

Key words: GM (1, 1) model; Neural network; Housing price prediction; Malthus model; Mathematical modeling

房地產行业作为基础性、支柱型产业,向来在国民经济中占据重要地位,在中国,房价更是经济水平的重要体现,它关乎百姓冷暖,关系国家兴亡。而房产价格作为房地产行业水平、规模的集中量化体现,对本行业趋势分析以及预测具有重要影响。

近年来,随着大数据的普及,研究房价趋势渐渐成为热门。传统的房价分析方法主要是以回归分析为主,按照时间序列分析各项因素。然而在分析中,定性分析较多,从系统的高度定量认识当前房地产行业态势的研究相对较少。依据较为准确的定量分析对房地产行业进行有效调控是房地产行业永续发展的有效途径。因此,对房价建立数学模型进行研究是研究房价趋势的新兴热门方向。例如,李东月、马智胜等人对房价预测模型进行算法研究[1];马千里等人探讨了房价预测问题。[2]

在接下来的文章中,本文从GM(1,1)模型分析时间序列影响入手,综合以人口为变量影响房价的马尔萨斯模型,最后运用bp神经网络等学习性研究方式深入研究流动人口及其他各项因素与房地产价格的关系,量化各因素影响。同时,本着辩证的精神,本文也会对各因素评估中出现的问题以及突出的优势进行说明。

1 提出模型假设

(1)本文对解决问题的方式以及实际情况进行以下合理的假设,以便进行趋势分析和预测。

1)近期内没有巨大外来影响(如金融危机等)影响房地产行业;

2)房地产行业短时间内仍将是国民经济的支柱产业;

3)以房地产(商品房)施工面积作为供给量指标;

4)流动人口可以用常住人口与本地户籍人口衡量;

5)开工建设的房屋全部建成且投入房地产市场;

6)所挖掘的数据均准确无误;

7)不受房屋出租行情影响。

(2)符号说明:表1为本论文中使用的符号以及其说明。

2 利用房价历史金额与目前的价格情况之间的关联性做出房价预测

2.1 模型的建立与求解

2.1.1 灰色系统GM(1,1)模型

早在1982年,我国学者邓聚龙提出了灰色系统学说,该学说将一切随机过程看作是在特定范围内与时间变化有关的灰色过程1。对此过程创立的模型称为灰色模型,即GM模型。GM(1,1)模型是由一个仅包括单变量的微分方程所组成的模型,仅需要较少的样本数据就可以完成行为决策与过程控制,具有很强的预测性。该模型将离散随机数经过一次累加生成算子2,得到有规律的生成数,建立白化微分方程,解方程而建立模型[3]。

其定义式如(1)式:

[x0k+αx(1)k=β] (1)

根据以上定义式,建模过程分为以下几步:

i. 构建原始数据列:

[X(0)=x01,x02,…,x0n],其中[x0k>0],k=1,2,…,n.

ii. 作[X0]的1-AGO序列

[X(1)=x11,x12,…,x1n],其中[x1k=i=1kx0(i)],k=1,2,…,n.

iii. 对[X0]进行准光滑性检验:计算级比,如(2)式:

[σk=x0(k-1)x0(k)] (2)

如果级比[σk]满足覆盖[σk∈(e-2n+1,e2n+1)],则认为模型满足准光滑性条件。

iv. 作[X1]的紧邻均值生成序列[Z(1)=z11,z12,…,z1n],其中 [z1k=-0.5[x1k+x1k-1]],k=2,3,…,n.

v. 设矩阵

[Y=[x02x03 … x0n]T] (3)

[G=x02 x03 … x0n 1 1 … 1T] (4)

通过对参数列[α=[a,b]T]进行最小二乘估计

[α=(GTG)-1GTY] (5)

以确定模型

[dx(1)dt+ax(1)=b] (6)

以及解的时间响应式

[φ1k=x01-bae-ak-1+ba] (7)

(6)(7)两式中,a称为发展灰数,b称为内生控制灰数。

vi. 根据第v步求出的[φ1k]得到[X1]的模拟值[φ1=φ11,φ12,…,φ1n],并根据(8)式还原出[X0]的模拟值[φ0=φ01,φ02,…,φ0n].

[φ0k=1-eax01-bae-ak-1] (8)

2.1.2 建立时间预测的GM(1,1)模型(以北京为例)

房地产行业系统由于其不断波动变化的特点,适宜使用GM(1,1)模型进行时间序列预测。本文在这里以北京房价预测为例进行灰色模型的预测[4]。下表2为北京市2010-2017七年房价[5]表3:

[X(0)=23327.3,26076.3,26808.6,37402.7,38508.8,39336.6,47197.8,56189.9],计算出级比[σk=]

[0.8946,0.9727,0.7768,0.9713,0.9790,0.8334,0.8400],滿足准光滑性检验要求。其拟合程度的决定系数[R2=0.9301>0.9],证明其拟合程度较为优异。

接下来用matlab软件综合求解模型,求得a=-0.1244,b=21365,即北京市房价的灰色系统GM(1,1)模型预测结果如(9)式:

[dx(1)dt-0.1244x(1)=21365] (9)

按照(9)式所预测的北京市2010-2017预测房价以及原房价如图1所示。

2.2.2 模型评价

总体来看,GM(1,1)模型在房地产的时间序列预测上可信度较高,这主要是因为房地产系统中的信息兼有可量化性及不确定性,适合灰色过程进行预测。但有些预测仍然不尽如人意,这时可以通过适当减少噪声点、进行回归分析并比较等方法找出模型中存在的不足并加以改正。

3 城市的流入流出人口对城市房价预测的影响

3.1 模型的建立

3.1.1 马尔萨斯模型

本文接下来将横向比较流动人口对房价的影响。提及人口,马尔萨斯人口模型往往是研究的重点。该理论由英国科学家Thomas Robert Malthus(1766-1834)提出,表征一类变量总数的变化率与其总数成正比的情况[9],即有下式(13):

[dM(t)dt=rM(t)Mt0=N0] (13)

方程的解一般为

[Mt=N0er(t-t0)] (14)

本模型所要研究的是流动人口数量与房价的关系,由于一个城市本身特征以及吸引力不同,流动人口在城市人口中的总比例大致为一个定值,而房价受流动购买力的影响也会相应波动,因此可以近似的使用此模型进行描述。

3.1.2 模型约定

由于统计问题,流动人口数据很难直接查到,本文中近似使用(15)式对流动人口进行规定,并在此基础上探究流动人口与房价的关系:

[P0=P1-P2] (15)

则比率[move%]使用下式计算。

[move%=1-P2P1] (16)

本论文中所使用的马尔萨斯模型的形式如(17)式。

[Mt=N0(1+move%r)t-t0] (17)

3.1.3 建立流动人口的马尔萨斯模型:以上海为例

接下来以上海为例建立流动人口的马尔萨斯模型。表5为上海2010-2017常住人口、户籍人口及比率[move%]统计表[10]。

从上表5中可以看出,上海市流动人口占总人口的比例稳定在0.4左右,这对其房价近年来的上涨有着助推作用。通过方程求解,当[r=3.2]时拟合效果较好。下表6表示上海市2010-2017平均房价与人口预测房价4。

3.1.4 模型延伸:横向对比

本文还注意到,各城市之间流动人口占常住人口比例不同,对房价高低也存在一定影响。计算得知重庆[move%=0.2],重庆市房价较为低迷,且上升缓慢,与该系数较低不无联系。通过进一步的一、二线城市之间的流动人口比率与房价上涨速度研究,发现这两者存在正相关关系。

3.2 模型评价

此模型针对流动人口与城市房价的关系进行了研究,原理明确,效果较好。但是由于数据来源较为复杂,指数模型刻画这一灰色过程较为困难,预测不能完全准确。本文在研究时也注意到流动人口数量与房价关系之间应存在一定滞后性,此滞后性符合客观规律。基于上述考虑,此模型在这里仅以上海为例进行初步探讨,希望能够充分说明流动人口与房价之间存在一定的正向推动作用,更多的是一种理论化推导。

4 房价的其他影响因素

4.1 模型背景

通过第二部分的论述,总体来看,GM(1,1)模型在房地产的时间序列预测上可信度较高,但有些预测仍然不尽如人意,出现了误差较大、拟合程度不高等情况[11]。可以考虑使用bp神经网络修正模型[12]。

4.2模型的建立与求解

bp神经网络是基于误差反向传播的多层前馈神经网络,它由输入层、隐含层、输出层构成,且相邻两层的神经元完全连接,如图5所示。

考虑到一个城区的房价还受该城区经济发展水平和政策等客观因素的影响,本文选取北京2002-2015年的城市GDP、城镇居民可支配收入、商品房施工面积和职工平均工资作为输入层数据,城区2010-2017年的平均房价作为输出层数据,利用bp神经网络模型滚动地预测房价,即利用第一年和第二年的数据预测第三年的房价。共14组输入数据,8个输入层神经元选取10组数据作为训练样本,4组数据作为测试样本,隐含层神经元数量设置为15个,初始权值和阈值是系统默认值。北京2002-2015城市GDP、人均可支配收入、商品房施工面积及职工平均工资4项主要指标和2004-2017平均房价[13][14][15]如下表7所示5。

4.3模型推广与模型评价

4.3.1 模型推广

比照4.2中方法,用相同的方式将上海市、重庆市、青岛市的GDP、人均可支配收入、商品房施工面积、职工平均工资作为输入数据,预测房价作为输出数据,建立神经网络,进行房价预测。预测房价与实际均价对比图如图8、9、10所示。

4.3.2 模型评价

由上文可见,使用BP神经网络,利用城市的GDP、人均可支配收入、商品房施工面积和职工平均工资对房价做出的预测是十分准确的。BP神经网络模型在预测房价方面能够做到方便、快捷,降低了计算误差,提高了计算效率。在非线性的房价预测中体现出了明显的优势。但此模型较为复杂,这也是它美中不足的地方。

5 结论

5.1 预测结果

论文中针对时间序列、流动人口以及其他可量化因素选用了三种不同的模型进行分析,由于马尔萨斯模型中对于流动人口的數据存在缺陷,无法使用此模型对北京、上海、重庆、青岛四座城市近三个月房价做出预测。在这里,论文给出灰色GM(1,1)模型和bp神经网络预测模型下的预测结果。

根据时间序列进行预测的GM(1,1)模型预测结果如表8所示。

可以看出,GM(1,1)模型计算的2018年1、2、3月的房价中,北京、上海、重庆的房价均比2017年平均房价低,青岛的房价比2017年平均房价高。这说明北京、上海、重庆的房价在2018年初会有下跌。同时bp神经网络计算的四个城区2018年房价均比2017年房价高。这说明北京、上海、重庆的房价在下跌之后会有回弹、上涨,青岛的房价会一直上涨。

5.2各模型中要素对房价的影响

文中使用的多种模型中的各个要素对房价有不一样的影响。其中,历史房价是对该城市房价最直接的影响因素;流动人口数量通过影响该城市经济的流动性影响各地区房价;量化经济水平对于房价的影响则通过职工平均工资、城市GDP、人均可支配收入三个指标加以体现;政策的影响比较具有突变性,由于政策的收窄/放宽对房地产商的开工具有直接影响,选用商品房施工面积这一要素考虑其对房价的影响可以量化政策以及纯粹的供求关系层面对于房价的影响。其中,GDP、职工平均工资、商品房施工面积和人均可支配收入四个指标对于房价的具体贡献可以通过bp神经网络中权值和阈值体现。

5.3 总结

文章中所预测的房价反映的不只是一个城市安身立命的成本,更是这个城市的经济实力与政策情况。从实际与预测的情况中都可以看出,北京、上海等一线城市的房价远远高出以重庆、青岛为样本的二线城市,而且呈上升趋势。在政策的影响下,各城市商品房施工面积有过较大的震荡,但对购房刚需的影响不够显著,收入与消费水平才是一个城市房价相对重要的影响因素,它代表了这个城市居民的消费意愿及消费能力。历史房价与流动人口也对房价有所影响,主要体现在基数、流动性等方面。

论文中提出的模型实现了对房价的定量分析,并且与实际的契合度较好,可以指导消费者合理分析房价,具有较强的实用性,这是本文预测的优势所在。在现实中,房价由于政策等影响具有突变性等对预测不利的因素,克服这些不利因素,提出更完善的模型也将会成为房价数据挖掘与预测中更为重要的目标。

注释:

1. 在控制论中,将部分信息不明确的处理过程称为灰色过程.

2. 也即1-AGO,下文使用1-AGO代指.

3. 表中数据均为该年12个月份全市房价均值.

4. 即通过马尔萨斯模型预测的与流动人口有关的房价值。

5. 表中“前年”“去年”指的是表格横栏所在年份的上一年和上两年,比如北京2010年一栏的数据为2008/2009两年指标;但房价为2010年当年房价。

参考文献:

[1] 李东月, 马智胜. 灰色GM(1,1)模型在房价预测中的算法研究[J].企业经济,2006(9):96-98.

[2] 马千里. 对房价预测方法的探讨[J].潍坊工程职业学院学报,2014,27(2):59-61.

[3]刘思峰,曾波,刘解放,谢乃明.GM(1,1)模型的几种基本形式及其适用范围研究[J].系统工程与电子技术,2014,36(3):501-504.

[4] 孟洁, 张文博. 基于GM(1,1)模型的北京商品房房价预测[J].中国市场,2014(46):112-114.

[5] 北京市统计局.北京2008-2016统计年鉴[EB/OL].http://www.bjstats.gov.cn/tjsj/,2018-03-19.

[6] 上海市统计局.上海2008-2016统计年鉴[EB/OL].http://www.stats-sh.gov.cn/html/sjfb/tjnj/,2018-03-19.

[7] 重慶市统计局.重庆2008-2016统计年鉴[EB/OL].http://www.cqtj.gov.cn/tjsj/shuju/tjnj/,2018-03-19.

[8] 青岛市统计局.青岛2008-2016统计年鉴[EB/OL].http://www.stats-qd.gov.cn/statsqd/Columns/tjnjx.shtml,2018-03-19.

[9] 张洪方,王林山.关于马尔萨斯(Malthus)增长定律的研究[J].生物数学学报,2006,21(4):543-548.

[10] 上海市统计局.上海市2010年第六次全国人口普查主要数据公报[R],2011-05-03.

[11] 王倩,王莹,邱继勤. 基于灰色 GM(1,1)和 BP 神经网络的房价预测[J].时代金融,2012(36):331.

[12] 杭晓亚, 柳叙丰, 赵泽昆. 基于GA-BP神经网络的青岛房价预测[J]. 四川建筑,2015,35(6):233-236.

[13] 北京市人力资源和社会保障局.历年北京市职工年平均工资[EB/OL].

http://www.bjrbj.gov.cn/bmfw/ywml/201601/t20160112_55858.html,2016-01-12.

[14] 青岛市人力资源和社会保障局.1990-2016青岛市在岗职工社会平均工资[EB/OL].

http://www.qdhrss.gov.cn/pages/zwgk/gkzx/gknb/index.html

[15] 重庆市人力资源和社会保障局.重庆市历年社会平均工资标准[EB/OL].http://www.cqhrss.gov.cn/zwxx/ywfl/,2018-03-19.

猜你喜欢
马尔萨斯流动人口房价
两大手段!深圳土地“扩权”定了,房价还会再涨?
马尔萨斯的忧虑与当代国人的困惑
防范未然 “稳房价”更要“稳房租”
新形势下的人口增长
漫画
去库存的根本途径还在于降房价
2016房价“涨”声响起
给流动人口更多关注目光
比较分析马恩人口原理与马尔萨斯人口原理