2种森林资产批量评估模型的构建与比较

2014-12-24 10:00赖晓燕颜桂梅宁正元陈平留
关键词:中龄林批量小班

赖晓燕,颜桂梅,宁正元,陈平留

(1.福建农林大学金山学院;2.福建农林大学计算机与信息学院;3.福建农林大学林学院,福建 福州350002)

批量评估方法于上世纪70年代兴起,它是以收益现值法、重置成本法和市场法三大基本评估方法为理论基础,应用数理统计技术、计算机技术等对大量处于同一市场区域的样本数据进行建模,并利用模型对目标资产进行评估.借助计算机软件技术,批量评估方法较传统的评估方法更快速,可以大幅度地降低成本.在国外,批量评估方法已在农业用地、房地产及抵押贷款等评估领域得到了广泛应用[1-2].在国内,批量评估方法的研究较少且主要集中在金融方面[3-5].

森林资源资产评估是指评估人员以森林资源资产为对象,在分析动态、市场化资料的基础上,评定、估算森林资源资产所具有的市场价值[6-7].2003年以来,随着我国集体林权制度改革的不断深入,森林资源资产的交易越来越频繁,集体林区的森林资源资产评估需求日益上升.但林权改革后,评估对象为大量的林农散户,林地面积小,林农的小班个数少.对同一个林区批量的散户小班进行评估,传统评估方法计算繁琐复杂,工作量大,效率极低,已无法满足大量的评估需求.将批量评估方法引入森林资源资产评估,建立批量评估模型,利用模型对目标资产进行快速、高效的评估,可以达到降低成本的目的.本研究尝试将2种主流的评估工具,即多元回归分析技术、人工神经网络技术应用到森林资源资产批量评估建模,并对2种模型的预测效果及可操作性进行比较分析.

1 数据收集与指标选取

同一龄组的小班具有相同或相近的特征,符合批量评估方法的样本数据要处于同一市场区域.本研究以中龄林组评估为例,其它龄组评估可参照本研究方法.按不同经营类型,分年龄收集了同一集体林区的部分用材林小班数据.数据来自福建永安林业股份有限公司的2007-2010年的小班数据.删除其中不适合作为中龄林组评估的数据,如速生阔叶树中径材的中龄林范围为6-10龄,一般将其划为幼龄林组.经过预处理后共收集了200条中龄林小班数据,有杉木和马尾松2种树种.其中,选取190条作为样本数据,以10条作为测试数据.

除了市场价格外,森林资产单位评估值与小班固有属性相关.为了构建模型,必须合理地选取相关属性作为自变量.小班属性主要有乡名、二类调查林班、小班面积、林种、起源、年龄、平均胸径等.本研究选取了影响中龄林单位评估值的8个指标,即年龄、平均胸径、平均树高、蓄积量、原木销售价格、综合材销售价格、主伐年龄及树种.

2 多元线性回归批量评估模型的构建

2.1 多元线性回归批量评估模型

多元线性回归是基于一组样本数据,建立多元线性回归模型,估计模型中的各个参数,并对参数及回归方程进行统计检验,利用所建立的模型来预测特定变量的取值.

多元线性回归的一般形式为:

其中 y为因变量,xi(i=1,2,…,k)为自变量,βi(i=0,1,2,…,k)为 k+1 个未知参数,ε 为随机误差.为了建立多元回归模型,假定随机误差满足零均值、等方差及序列独立性条件.

在建立多元回归模型之前需对数据进行统计分析,以检查是否具备建模条件,包括正态性和线性检验.例如,为了保证建立的线性模型是有效的,在建模前应对每一个单独变量进行正态性检验.当检验结果出现偏离系数较大,即不符合正态性要求时,可以采取对数变换、平方根变换或倒数变换等方法改进正态性.对收集的样本数据的8个自变量进行统计分析后发现,蓄积量、年龄和主伐年龄这3个变量的偏度系数较大,对3个变量分别取自然对数.以蓄积量为例,改进前后正态性检验结果分别见图1、2.从图2可知,蓄积量的正态性得到很大改善.

图1 蓄积量的直方图Fig.1 Histogram of volume of per unit

图2 求自然对数后的蓄积量的直方图Fig.2 Histogram of natural logarithm of volume of per unit

2.2 多元线性回归批量评估模型的建立

由上述分析可知,中龄林批量评估模型可以描述为如下形式:

其中,d、h、yprice、zprice分别表示平均胸径、平均树高、原木销售价格与综合材销售价格.lv、lage、lzage分别表示取完自然对数后的蓄积量、年龄和主伐年龄.变量x8表示树种的哑变量,x8=0表示树种为杉木;x8=1表示树种为马尾松.

在SPSS软件中采用逐步回归法推导系数,每引入一个新变量时都要进行模型适用度分析,并反复进行残差分析.当8个自变量都引入模型后,回归方程的Durbin-Watson统计量为1.908,模型调整的判定系数为0.94,所建立回归方程中的7个自变量可以解释因变量单位评估值总变化的94%.将SPSS计算所得的各个系数代入方程,得到如下多元回归模型:

2.3 多元线性回归模型的检验

在建立多元回归模型前,假定模型所具有的误差满足正态分布、同方差和方差独立性要求,但很难获得误差项的真实值,可通过分析误差的估计值残差来对模型进行相关检验.本研究利用SPSS软件提供的工具进行残差分析.

步骤1:进行正态性检验.经检验双侧显著性水平等于0.87,大于0.05,故符合正态性.

步骤2:检验零均值与等方差性.从图3可以看出,大多数点随机落在由直线y=-2及直线y=2所构成的平行带域内,在图形上残差未构成明显的模式.残差的方差为一个恒值,不受自变量取值的影响,零均值,故等方差性的假设成立.

步骤3:检验序列独立性.SPSS软件所给出的DW统计量为1.908,接近2,故满足独立性要求.

图3 残差的散点图Fig.3 Scatter of residual

3 BP神经网络批量评估模型的构建

3.1 BP 神经网络

BP(back propagation)网络是采用误差逆传播算法训练的多层前馈式神经网络[8].BP神经网络模型拓扑结构由输入层、输出层及1个或多个隐含层构成.根据Kplmogorov定理,只有1个隐含层的3层BP网络可以实现任意非线性映射.

BP网络的学习规则是梯度下降法.样本数据在学习过程中,为了使BP网络误差平方和最小,需要不断调整网络的权值和阈值.梯度下降法可以确保BP网络在起初几步下降快,但随着网络接近最优值,速度变慢,导致网络收敛慢.另外,BP网络还存在易陷入局部最小点、网络泛化能力弱等缺陷.针对这些不足,本研究采用基于LM(levenberg-marquardt)算法的BP网络[9-10],同时为了防止神经网络出现过度训练的现象,利用正则化方法提高网络泛化能力[11].

3.2 BP神经网络批量评估模型的建立

选用MATLAB软件作为建模工具,在编写BP网络训练程序及预测程序时,充分利用其神经网络工具箱所提供的丰富函数.

建立3层BP神经网络模型.以影响中龄林单位评估值的8个指标作为网络模型的输入层,以单位评估值作为网络模型的输出层.输入层、输出层节点数分别为8和1.为了避免试探过程,设置隐含层节点数为输入节点数和输出节点数之和.因此,确定了中龄林资产批量评估模型网络结构为8-9-1.

为了确保稳定收敛及训练的顺利进行,可选取较小的网络训练参数.BP网络训练的学习速率采用神经网络工具箱中的默认值0.01.BP网络的初始权值选取[-1,1]之间均匀分布的随机数.

3.3 BP 网络训练

中龄林批量评估模型的网络结构是8-9-1.利用中龄林样本数据对BP神经网络模型进行学习训练.训练结果如下:

从图4可知:当训练迭代至第226步时,网络的误差平方和(SSE)和网络权值的平方和(SSW)达到恒值,有效权值和阈值的个数为85.4344,网络训练收敛,训练结束.

4 2种模型预测效果的比较

选取所收集数据中的10条小班数据作为测试样本,对模型的有效性进行检验.测试样本见表1.

4.1 多元回归批量评估模型的检验

从表2可知,多元线性回归批量评估模型对测试样本的预测效果总体不错,但个别小班数据的预测效果不佳,如第2条、第5条小班数据的相对误差均在10%以上.

图4 BP网络训练的收敛曲线Fig.4 The convergence curve of BP network training

表1 测试样本Table 1 Test sample

4.2 神经网络批量评估模型的检验

从表3可知,BP网络批量评估模型对测试样本的测试效果好,所有小班数据的预测值与实际值的误差控制在±4%以内.

表2 多元线性回归模型测试结果Table 2 Test result of multiple regression model

表3 BP网络模型测试结果Table 3 Test result of BP network model

4.3 2种模型预测效果的比较

将2种模型的测试结果进行比较,发现对于同样的测试样本,BP网络批量评估模型的预测效果较多元回归模型的预测效果有较大提高,平均绝对误差由11.61 元·m-3降到1.92 元·m-3,且前者不存在模型对某些小班数据不适合的现象,相对误差比较均衡(表4).

表4 2种方法预测结果对比Table 4 The comparison of test results between two methods

5 小结

本研究以用材林林木资产评估为例,将批量评估方法应用到森林资源资产评估.分别建立了基于多元线性回归分析的批量评估模型和BP神经网络批量评估模型.从预测结果可知,2个批量评估模型都可以对测试小班的评估值进行预测,但多元回归模型对于个别小班数据的预测误差较大,且预测精确度不如BP神经网络模型好.在可操作性方面,多元回归分析方法在使用时有较多的限定条件,如各个变量应满足正态性、线性要求,模型残差必须满足基本假设等.当这些条件或者假设不成立时,需要对模型进行反复调整及检验.而神经网络不需要精确的数学模型,可操作性更强,应用范围更广.

[1]WONG K C,ALBERT P S,HUNG Y C.Neural network vs.hedonic price model:appraisal of high-density condominiums[J].Real Valuation Theory,2002,8(2):181-198.

[2]JOHN D,BENJAMIN,RANDALL S,et al.Mass appraisal:an introduction to multiple regression analysis for real estate valuation[J].Journal of Real Estate Practice and Education,2004,7(1):65-77.

[3]纪益成,傅传锐.批量评估:从价税的税基评估方法[J].中国资产评估,2005,11:5-9.

[4]陈滨.金融不良资产批量评估初探[J].中国资产评估,2005(7):18-19.

[5]耿继进,张晖.基于GIS的房地产批量评估数据库构建研究——以深圳市为例[J].遥感技术与应用,2012,27(3):479-486.

[6]罗江滨,陈平留,陈新兴.森林资源资产评估[M].北京:中国林业出版社,2002:12-20.

[7]赖晓燕.基于多元回归分析的森林资源资产批量评估模型研究[J].福建电脑,2009,25(11):94-95.

[8]缪新颖,褚金奎,杜小文.LM-BP神经网络在大坝变形预测中的应用[J].计算机工程与应用,2011,47(1):220-222.

[9]黄健,黄习培,李金铭.基于BP神经网络和纹理特征的马尾松图像分割方法[J].福建农林大学学报:自然科学版,2009,38(6):649-652.

[10]侯亚丽,李铁基.LM优化算法的BP神经网络目标识别方法[J].探测与控制学报,2008,33(1).53-57.

[11]徐建伟.基于贝叶斯正规化算法的BP神经网络泛化能力研究[J].数理医药学杂志,2007,20(3):293-295.

猜你喜欢
中龄林批量小班
批量提交在配置分发中的应用
小班教学 有效交流
如何在幼儿园小班开展区域活动
新时期森林抚育经营技术与措施
米槠中龄林施肥试验研究
抚育间伐强度对兴安落叶松中龄林测树因子的影响
马尾松中龄林采脂效益分析
在数控车床上批量钻铰孔类工件的实践
小班幼儿语言交往能力的培养
基于AUTOIT3和VBA的POWERPOINT操作题自动批量批改