建筑因素与区域温度的二元回归建模

2022-07-10 13:49刘珂妍武新乾刘鹏
四川建筑 2022年3期
关键词:聚类分析绿色建筑建筑设计

刘珂妍 武新乾 刘鹏

[摘  要]:为了探究建筑因素与区域环境温度之间的统计关系,文章先对原始数据做预处理,包括剔除奇异值和标准化转换,并运用聚类分析方法对标准化变换之后的数据实现控制变量。再运用回归分析的方法,探究绿化率、密度和高度与区域环境温度之间的统计关系,利用SAS软件建立了温度与密度和高度、温度与绿化率和高度的二元回归模型,并对建立的模型进行拟合优度检验、参数显著性检验和残差检验,检验结果表明,所建立的模型是合理有效的。

[关键词]:绿色建筑;建筑设计;聚类分析; 线性回归分析; 非线性回归分析

TU111.19A

建筑行业作为我国社会经济建设中的三大主要行业之一,对社会资源的消耗大。近几年,随着我国绿色建筑的迅速发展[1],生态理念在建筑行业[2]中愈发重要,若能探究出建筑因素与区域环境温度之间关系,就能够在建筑设计方面提供科学有效的依据,并对于推动建筑经济可持续发展[3]、高效实现健康建筑[4]、提高生态环保的质量具有重要的意义。

为了探究建筑因素与区域环境温度之间的定量关系,本文在聚类分析和控制变量的基础之上分析了绿化率、密度和高度这3个建筑因素与区域环境温度之间的关系,建立二元回归模型,并对建立的模型进行检验,确保所建模型的有效性。

1 数据预处理

本文使用河南科技大学建筑学院实测数据进行分析,数据包含440组绿化率、密度和高度3个建筑因素及其对应的环境温度。首先对各因素数据进行奇异值处理、极差正规化变换,使得变换后的数据与量纲无关。之后,对于标准化处理之后的数据,采用K-means聚类分析的方法对样本数据进行控制分类,并使用手肘法[5]确定最优K值。

1.1 标准化处理

极差正规化变换公式为

xij=xij-minxijmaxxij-minxiji=1,2,3;j=1,2...439;

式中:xij为第i个因素的第j个样本的原始数据,xij为变换后的数据,且0≤xij≤1,极差为1,无量纲。

1.2 K-means聚类分析

为建立二元回归模型,需控制第三自变量的影响。采用K-means法对第三自变量聚类,之后再使用其中某一类的数据进行建模。在此,利用Python编程实现手肘法,得到K值的最优可能取值。

根据手肘图(图1、图2),绿化率的最优K值可能为3、4、5;密度的最优K值可能为3、4、5;高度的最优K值可能为4、5、6。本文选用3个因素的K值都为5,即都聚为5类,并利用R软件实现聚类。

2 回归分析

令y为温度,x1为绿化率,x2为密度,x3为高度。由于在预处理中将3个因素都聚为5类,利用SAS软件对聚类后的各类族数据中对应的因变量(温度)进行正态性检验,选择满足正态性检验的类族进一步进行回归分析。

2.1 因变量正态性检验

绿化率聚类的第3类、密度聚类的第4类和高度聚类的第5类所对应的因变量(温度)满足正态性检验,结果如表1所示。

根据表1可知,因变量y1,y2,y3对应的P值均大于0.05,因此可认为因变量均服从正态分布,于是,选择这3个类对应的数据进行回归分析。

2.2 因变量与自变量的相关性分析

利用SAS软件,分别对温度与绿化率、密度、高度进行相关性分析,检验结果如表2所示。

建筑论坛与建筑设计刘珂妍, 武新乾, 刘鹏: 建筑因素与区域温度的二元回归建模

从表2可以看出,在控制绿化率的情况下,温度与密度的相关系数绝对值在0.0~0.2之间,且P值等于0.5519>0.05,即认为变量之间是极弱相关或无线性相关关系;温度与高度的相关系数为0.827 10,且P值小于0.000 1,即认为温度与高度之间是存在强的正相关关系。在控制密度的情况下,温度与绿化率的相关系数绝对值在0.0~0.2之间,且P值等于0.9689>0.05,即認为变量之间是极弱相关或无线性相关关系;温度与高度的相关系数为0.769 15,且P值小于0.000 1,即认为温度与高度之间是存在强的正相关关系。在控制高度的情况下,温度与绿化率、密度的相关系数绝对值在0.0~0.2之间,且P值均大于显著性水平0.05,即认为变量之间是极弱相关或无线性相关关系。

2.3 散点图

利用SPSS软件,分别画出温度与绿化率和高度、温度与密度和高度、温度与密度和绿化率的散点图(如图4~图12所示)。

从图4~图9中可以看出,温度与密度、绿化率、高度之间存在非线性关系,且温度与高度之间的非线性关系十分类似对数函数。

由图10~图12并结合相关分析的结果可以得到,单独考虑温度与绿化率和密度之间的关系较弱,因此,不再建立温度与绿化率和密度之间的模型。

3 模型建立

根据上述分析,设建立温度与密度和高度的二元回归模型为

y1=α11+α12x2+α13log(x3)+ε1(1)

温度与绿化率和高度的二元回归模型为

y2=α21+α22x1/21+α23log(x3)+α24x1x3+ε2(2)

3.1 温度与密度和高度线性回归模型

利用SAS进行模型拟合[6],结果如表3和表4所示。

根据方差分析表3可得,P值小于0.0001<0.05,说明温度与密度和高度模型通过显著性检验;根据R2为0.906 5、调整R2为0.904 9,可知拟合精度高。

根据参数估计表4可得,α11和α13的P值小于0.0001<0.05,满足显著性要求;而α12的P值为0.063 4,不满足显著性要求,但仍考虑拟合模型为:

y1=25.72966+0.76843x2+1.00090log(x3)+ε1(3)

利用式(3)计算残差,见图13。由于残差图13有明显的趋势,可能是因为残差中的非随机模式表明模型的确定部分(预测变量)没有捕获一些“泄露”到残差中的一些可解释的信息。

3.2 温度与密度和高度非线性回归模型

改进模型(3),由于前6个数据对应的残差在-1.5以外,故先剔除前6个数据,再尝试加入密度和高度的交互作用项,拟合模型为[7-10]

y1=β11+β12x2+β13log(x3)+β14x2x3+ε3(4)

利用SAS进行模型拟合,结果如表5和表6所示。

根据方差分析表5可得,P值小于0.0001<0.05,说明温度与密度和高度模型通过显著性检验;根据R2为 0.958 2、调整R2为0.957 1,可知拟合精度比模型(3)更高。

根据参数估计表6可得,模型(4)中β11、β12、β13、β14的P值小于0.05,满足显著性要求。根据Vif<10,Condition Index<10,可知变量之间不存在多重共线性[11]。因此,拟合模型为

y1=25.48385+1.24099x2+

3.24655log(x3)-0.06998x2x3+ε3(5)

模型(5)表明,在建筑绿化率相当时,温度与密度和高度之间正相关,与密度和高度的交互作用负相关。

对所建的模型(5)进行残差检验,结果见表7。根据表7,模型的残差检验P值大于0.05,即通过残差检验,因此模型(5)的拟合是有效的。

3.3 温度与绿化率和高度非线性回归模型

利用SAS进行模型拟合,结果如表8和表9所示。

根据方差分析表8可得,P值小于0.0001<0.05,说明温度与绿化率和高度模型通过显著性检验;根据R2为0.899 7、调整R2为0.894 8,可知拟合精度高。

根据参数估计表9可得,模型(2)中α21、α22、α23、α24的P值小于0.05,满足显著性要求,根据Vif<10,Condition Index<10可知自变量之间不存在多重共线性。因此,拟合模型为

y2=24.08427+3.22525x1/21+

3.57499log(x3)-0.25349x1x3+ε2(6)

模型(6)表明,在建筑密度相当时,温度与绿化率和高度之间正相关,与绿化率和高度的交互作用负相关。

4 结论

本文通过采用聚类分析和线性回归分析、非线性回归分析相结合的方法,对温度与绿化率、密度、高度之间的统计关系进行了分析,最终建立了2个较为合理的模型(5)和(6)。这2个模型表明,在设计建筑时,可以通过同时考虑建筑密度和高度这2个因素的规划,或者同时考虑绿化率和高度这2个因素的规划,达到控制建筑物的区域环境温度的目的。

参考文献

[1] 全世海.我国绿色建筑发展现状及展望[J].重庆建筑,2020,19(12):14-16.

[2] 朱旭.绿色建筑的可持续生态设计——析《可持续设计》[J].环境保护,2020,48(24):71-72.

[3] 嚴瑞青.绿色经济理念下建筑经济可持续发展研究[J].商讯,2020,37(36):152-153.

[4] 王焯瑶,钱振澜,王竹,等.健康建筑评价标准比较分析与认知框架[J].西部人居环境学刊,2020, 35(6):32-39.

[5] 王建仁,马鑫,段刚龙.改进的K-means聚类k值选择算法[J].计算机工程与应用,2019,55(8):27-33.

[6] 王赫.基于多元线性回归的经济发展影响因素分析[J].商讯,2020,37(36):146-147.

[7] 王林.消防员受伤人数非线性回归模型建立及分析[J].科技与创新,2020,6(23):23-24.

[8] 王蕊,董祥旻,何卫苹.一种多元非线性回归模型的建立方法及其应用[J].中国考试,2010,7(11): 17-22.

[9] 赵莹,李纯良,马义茹,等.基于多元非线性回归对合金收得率的预测[J].数学的实践与认识,2020,50(17):297-304.

[10] 赵晓晴. 基于债券成交额的中国债券市场实证研究[D].济南: 山东大学,2019.

[11] 高惠璇.处理多元线性回归中自变量共线性的几种方法——SAS/STAT软件(6.12)中REG等过程增强功能的使用[J].数理统计与管理,2000,18(5):49-55.

猜你喜欢
聚类分析绿色建筑建筑设计
安东尼·高迪建筑设计研究
叙事思维下的建筑设计与表达
传统建筑设计元素在现代商业建筑设计中的运用
剧院建筑设计指南之哥本哈根歌剧院
绿色建筑煤矸石资源化利用新技术的应用分析
农村居民家庭人均生活消费支出分析
绿色建筑技术节能分类探讨
基于省会城市经济发展程度的实证分析
基于聚类分析的互联网广告投放研究
绿色建筑暖通空调设计的技术分析