基于房地产大数据的自动估价系统研究

2019-10-21 17:54朱兵
中国房地产业·中旬 2019年10期
关键词:爬虫估价自动

朱兵

江苏先河房地产资产评估测绘造价咨询有限公司

摘要:数据时代的来临加快我国整体经济的快速发展。大数据颠覆了人们对吃、穿、行的思考方式与习惯。而在“住”的方面,房地产一直以来都和金融业有着千丝万缕的联系,房地产大数据对于金融业来说有着至关重要的意义。依托于房地产大数据的自动股价平台可以为银行等金融机构带来决策性的意义,降低自身持有抵押品的风险。

关键词:房地产大数据;自动估价系统

我国整体经济的快速发展使得我国快速进入互联网数据时代。数据是房地产估价师进行价值评估的核心要素,大数据时代的到来,不仅为房地产行业提供了海量数据,更重要的是对于数据估价处理方式的改变。

一、中国房地产大数据存在的问题分析

目前,中國对房地产大数据的管理是匮乏的,没有专门的机构来整理记录房地产大数据,房地产大数据仍处于杂乱无章的状态,具有真实性低、规范性差等特点,这给房地产大数据的应用造成了巨大的困难。网络中的挂牌和出售数据需经过去重、清洗后才能在日常实际生活中投付使用。本项目在清洗与去重中采用了时间与空间相结合的方法,并在数据中根据不同属性采用了取极值的操作,去重率在80%以上。

二、相关理论基础

(1)特征价格理论,特征价格理论将房地产视为一种产品,房地产的某一方面特征代表了该商品的一个效用,房地产价格就是由每个特征所带来的效用总和组成。本质上这些房地产的特征相应的代表了房地产市场的一个方面,而这些特征的不同组合即构成了不同的房地产。换言之,房地产价格就可以通过确定房产特征的价格及数量来间接获得。(2)BP神经网络理论,人工神经网络(ArtiifeialNeuralNe饰orks,ANN)主要由大量与自然神经细胞类似的人工神经元互联而成的模仿人脑行为特征的网络算法数学模型。其工作过程具有循环特征,并同时具备自学习和自适应的能力,通过预先提供的特征(输人项)与预测项(输出项)数据,充分学习、掌握两者之间的内在关系,使新输人的特征来推算出我们想要的结果。BP(aBckrP叩agatio动网络是一种多层前馈网络,是目前应用最广泛的神经网络模型之一。它按误差逆传播训练,能学习和存贮大量的特征与结果的映射关系,而无需事前揭示描述这种映射关系。通过最速下降法反向传播来不断调整网络的权值和闽值,使网络的误差平方和最小。通过动态迭代搜索一组权向量,使网络误差函数达到最小值,从而完成信息提取和记忆过程。

三、通过网络爬虫抓取地产大数据

研究中,获取数据的方法主要为网络爬取。网络爬虫,又被称为网页蜘蛛、网络机器人,是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外,一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。在各种以数据作为设计运行基础的实验中,数据重要性是不言而喻的。不仅需要数据作为各种模型的基本计算和训练依据,产生更多、更准确的特征来构建和模拟构建效用相当的仿真模型,通过这些模型对新产生的数据进行预估和处理,从而提高模型的利用效果。随着网络的迅速发展,互联网成为大量信息的载体,如何有效地找到自己需要的信息,并加以提取和利用即成为一个巨大的挑战。定向抓取相关网页资源的聚焦爬虫可以帮助研究者解决这一问题。聚焦爬虫是一个自动下载网页的程序,可根据既定的抓取目标,有选择地访问互联网上的网页与相关的链接,获取所需要的信息。与通用爬虫(generalpurposewebcrawler)不同,聚焦爬虫并不追求大范围的覆盖,而将目标定为抓取与某一特定主题内容相关的网页,为面向主题的用户查询准备数据资源。

四、信息数据服务的方向与趋势

房地产业已成为当今中国经济的支柱产业之一,与我们的工作生活紧密相关,因此,房地产信息数据服务具有广泛的市场需求。随着我国金融、房地产、政府管理等方面的不断发展,突破创新,对于信息数据的需求不断提高,房地产数据公司所面对的客户会越来越多。对于不同客户的需求,房地产相关信息数据需不断分类细化,以满足不同客户的关注点。当前国内各房地产数据平台所拥有和能提供的信息数据产品都较为单一、产品同质化,主要集中在房地产楼盘库、价格走势、挂牌交易信息等,信息数据的服务领域、广度和深度都有较大的发展空间。首先,房地产信息数据的服务领域可以有以下几方面:①数据研究与分析:包括价格指数、价格趋势等研究与分析;②ft价服务:为估价机构和估价师提供交易实例、房地产基本状况、数据研究与分析成果等;③经纪服务:通过交易信息等为房地产经纪人提供服务;④抵押风险控制服务:为金融机构提供房地产基本状况、交易情况、趋势分析等风险控制参考数据;资产管理服务:通过房地产基本信息、交易量与成交价格等进行物业评级,、变现能力分析等。其次,在数据的广度方面可提高的地方有:①增加非住宅房地产的信息数据:目前大多数据公司的信息数据还以公寓住宅为主,鲜少有非住宅的信息,考虑房地产数据的完整性,应增加非住宅的信息;②房地产租赁数据:房地产租赁和房地产买卖都是房地产市场的重要组成部分,但目前租赁市场的信息却相对欠缺,而租赁数据对于经营性物业的招商运营是非常有价值的;③土地信息数据:目前大多数房地产信息数据还是以房屋信息为主,土地状况信息较少,而土地的用途管制、权益、开发状况等对于房地产的价值至关重要,是非常必要的。最后,在数据的深度方面需要完善现有信息数据的完整性,对现有数据进行精细化的处理,探索打通房地产全生命周期这一链条,将零碎、独立的信息数据进行串联,提升数据的利用价值。

五、自动估价系统的实现

在数据日渐开放、并已全面进入大数据时代的背景下,审时度势的实践者可以利用自动估价技术对中国的房地产估价和经纪行业带来变革。事实证明,AVM并没有使估价机构丢失了原有的业务而受到威胁,反而使其可通过利用AVM技术为客户提供更加丰富全面的估价服务,同时也保证了自己的收益,创造了良好的客户关系。大数据是房地产估价方法的基础。房地产估价方法包括比较法、收益法、成本法、假设开发法。例如,比较法中交易实例的搜集、房地产状况调整,收益法中的资本化率的确定,全部需要大数据。本项目实质为一个垂直搜索模型,通过输入房屋的具体地址信息,评估房子的价格,展示房子的属性。基于房地产大数据的自动估价可以为房地产实现更为精确的自动估价,可以解决各级信贷审批人员缺乏便捷全面的房地产综合全景信息工具的问题。自动估价在提供房地产自动估价、人工估价和价格走势等多维度分析的同时,还可呈现相关的楼盘综合信息、市场动态和周边设施配置,可以有效地提高信贷审批业务的工作效率。

六、结语:

房地产行业产业链长、生产周期长、不确定因素多、涉及内容广、产品地域性强、文化背景差异大等,导致新技术应用相对困难。一方面,应该支持参与政府大数据产业发展规划,大力推进政府部门数据共享,积极响应与推动公共数据资源开放,实现资源整合。另一方面,提升自身获取数据的方法与途径,企业与企业之间形成战略合作,企业利用自己的资源库,开展科研工作,利用自身的数据库与大学、科研机构等共同合作,开发与丰富房地产大数据。房地产大数据资源的核心是开放和共享。

参考文献:

[1]维克多·迈尔-舍恩伯格,肯尼思·库克耶.大数据时代—生活、工作与思维的大变革[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013.

[2]金宗泽,冯亚丽,纪博,等.大数据分析中的关联挖掘[J].计算机与数字工程,2014,42(10):1924-1928.

[3]罗刚,王振东.自己动手写网络爬虫[M].北京:清华大学出版社,2010.

猜你喜欢
爬虫估价自动
基于Python的网络爬虫和反爬虫技术研究
Python反爬虫设计
基于Scrapy框架的分布式网络爬虫的研究与实现
谁抢走了低价机票
英国粉钻
房地产估价的常见风险以及防范措施
让小鸭子自动转身
“颜值爆表”的拍卖会
关于自动驾驶
傍晚,路灯为什么能自动亮起来?