徐鹏涛, 刘吉彩, 郑 鹭, 岳荣先
(上海师范大学 数理学院,上海 200234)
上海市大型公共建筑能耗的贝叶斯统计分析
徐鹏涛, 刘吉彩, 郑 鹭, 岳荣先*
(上海师范大学 数理学院,上海 200234)
在建筑能耗的计量过程中,积累了大量的实时能耗数据.这些数据的特点是数量大、噪声大,存在缺失和测量误差等.如何分析和应用如此海量数据,是一个极具挑战性的问题.以2015年上海市大型建筑的电耗数据为研究对象,通过建立多层贝叶斯模型,对各类型大型建筑的月平均单耗、年平均单耗进行估计.该结果将可以帮助政府监管部门对建筑节能工作进行有效评价.
大型公共建筑; 多层贝叶斯模型; 平均单耗估计; MCMC抽样
中国的建筑能耗已经成为工业能耗、交通能耗之后的第三大社会能源消耗主体,其中大型公共建筑高能耗是我国建筑能耗快速增长的最主要原因.资料显示,我国单体规模大于2万平方米的大型公共建筑,总面积不足城镇建筑总面积的4%,总能耗却占全国城镇总耗电量的22%,用电量在70~300 kWh/(m2·a),为普通居民住宅的5~10倍.因此,全面地了解大型公共建筑能耗的特征,以及对其能耗趋势进行有效地估计,是我国建设大型公共建筑节能监管体系的基础.上海作为财政部、住建部建筑能耗监测平台示范城市.截至2015年底,该平台中已经积累了超过500栋大型公建的总用电量及分项、分系统用电量数据,近600栋建筑能源审计数据和1400栋建筑实时能耗统计数据.这些数据的特点是数据量大,存在缺失和测量误差,常规的统计方法无法有效使用.如何有效分析和应用如此海量数据,就成为一个极具挑战性的问题.
本研究的目的是估计2015年上海市大型公共建筑的月平均单耗以及年平均单耗,因为这两个量是政府监管部门对节能减排工作进行评价的重要指标,具有重要的指导意义.本文作者将使用贝叶斯统计统计方法进行统计建模.贝叶斯统计是现代统计学的一个重要分支,有别于经典的统计推断方法.该方法以贝叶斯公式为核心,通过综合利用先验信息和后验信息,进行有效的统计推断[1-2].在平均单耗的估计中,首先通过初步的数据筛选办法,确定711栋大型建筑作为研究对象.然后,计算每栋建筑的单位面积的月耗电量(月单耗)将以此数据作为样本进行统计分析.接着,对先验分布以及总体分布进行模型假设,推导出月单耗的后验分布.最后,使用MCMC抽样技术,获得月、年平均单耗估计.
本文作者发现将贝叶斯统计方法运用于大型公共建筑月、年平均单耗的估计在国内、外的研究与应用中并不多见.在已有文献中,对于大型公共建筑能耗的研究一般都使用描述性统计方法和线性回归模型[3-5].然而,因为本研究的数据存在大量缺失和测量误差,普通线性回归模型一般不能直接使用.作者提出一种新的多层贝叶斯模型,直接用于月、年平均单耗的估计,无需进行额外缺失值的插补.
就在我的干哕声中,软管顺利地插入气管中。还没听到段主任和护士说什么,先听到王姐的惊呼声:老妹,老妹,你快看,是牙,是牙。老婆干脆捧起我的念起了阿弥陀佛,搞得我也跟着委实激动了一回。
1.1 数据预处理
《秀才胡同》典故共11种,《东风破》用典8处。且前者多引入典故完整的氛围,而后者倾向于仅适用典故片段的情绪,这也是两曲听来,《东风破》令人耳目一新,《秀才胡同》却使人产生时代交错感觉的缘由。
按建筑功能的不同分为:办公建筑、政府办公楼、宾馆饭店、教育建筑、其它建筑、商场建筑、体育建筑、文化建筑、医疗卫生和综合建筑.数据包括:每栋楼宇的有效面积、所属区县,建筑类型以及该楼的每小时耗电量.本研究的目的是估计各类型建筑的月平均单耗以及年平均单耗,这里的月单耗指的是该类型建筑每月单位建筑面积的电耗,年单耗指的是该类型建筑每年单位建筑面积电耗.
由于所提供每栋建筑的小时数据存在大量缺失,首先需要根据一定规则选取样本建筑,计算每天电耗和每月电耗.该挑选样本建筑规则如下:
其中,θ=(θ1,…,θ12)T.
(2)对于有效月中有日数据缺失的,通过补差计算出当月完整能耗数据,补差公式为当月监测能耗数/当月实际采集天数×当月天数;
尘世之间,绝色美女不在少数,但能够后世流芳的并不多。所谓时势造美女,能够让人们口口相传的美丽,多半与名人奇事密切相关。“沉鱼”缘于西施浣纱,“落雁”缘于昭君出塞,“闭月”缘于貂蝉拜月,“羞花”缘于贵妃醉酒。
(3)剔除异常值(过大或过小).异常值判断为该栋建筑最大月能耗数/该栋建筑最小月能耗数>10,则该栋建筑月能耗数中存在异常,将异常值的月份数据记为缺失值.
(4)有效月数≥6的数据为样本参与计算,2015年最终参与计算的有711栋.
1.2 多层贝叶斯模型
将基于711样本建筑的月单耗数据进行建模.首先,定义第i栋样本建筑j月份的月单耗为:
基于数据{yij,i=1,…,nj;j=1,…,12}和特定建筑类型,考虑如下多层贝叶斯模型:
其中一位被访者说:“我们单位一对老职工,孩子很大了都不让他知道爸妈在殡仪馆工作。孩子在父母工作单位一栏中,填入的是‘民政局’。这个情况很常见,也很无奈。”
(1)在具体给定月份下,假设每栋建筑(相同类型建筑)的耗电量服从正态分布.具体而言,考虑第j月份某类型建筑单耗
其中,θj为某类型建筑第j月的平均单耗,σ2为未知方差;
对学生要重在引导,引导学生明事理,理明则心顺、则自觉,从根本上提高学生的认识能力和思想觉悟,调动学生专业学习的自觉性和主动性。引导学生学习榜样,尤其是本专业的优秀毕业生,引导学生辨析、接受和改变现状才是进步,而不是一味地消极抵制或者厌学等。
(2)假设12个月的平均单耗(θ1,…,θ12)T服从多元正态分布.注意:同一栋建筑各月单耗之间存在相关性,所以假设
其中I=(1,…,1)T为12维的向量,τ2为超参数,Σ0为已知的相关矩阵.为了减少模型参数的估计,假设Σ0是已知的.并且假设θj具有一阶自相关结构:θj=ρθj-1+ε.由此可得:
2)督导评价。教学督导人员通常由校内专业技术水平高、教学经验丰富的高年资教师担任,监督“教”“学”并引导教师提高教学水平和指导学生提升学习效率。高校成立专门的教学督导队伍,督导人员通过随机听课、跟踪听课、观摩教学、教学检查等形式参与实践教学,对教学质量进行评价,并及时将评价意见反馈给师生,指出存在问题,提出改进建议,帮助教师和学生增强“教”“学”效果。
其中,超参数ρ假定是已知的;
(3)对于参数μ,τ2,σ2,假设:
估计2015年各类型建筑12个月的平均单耗,就相当于考虑估计上面多层贝叶斯模型中的参数θj,j=1,…,12.根据贝叶斯统计理论知,θj,j=1,…,12的后验分布的数学期望可以作为其参数估计[1].然而,因为θj,j=1,…,12的后验分布形式非常复杂,所以其期望一般没有显式解.将采用Gibbs抽样方法,产生θj,j=1,…,12后验分布的随机数,再使用这些随机数的样本均值作为其估计.
利用多层贝叶斯模型,以2015年上海市大型公共建筑能耗数据作为统计依据.筛选有效数据,将上海市大型公共建筑分为十大类.运用R软件,分别对十类上海市大型建筑2015年度的月平均单耗、年平均单耗进行估计.由于考虑到各月的平均单耗之间存在相关性,通过定义θj=ρθj-1+ε的一阶自相关结构,进行相关性调整.基于专家建议和历史经验,可以确定ρ的取值,从而最终获得比较合理的平均单耗估计.
所以,总体年平均单耗的估计为
(1)
(1)当月采集天数≥20 d(2月份采集天数≥18 d),则当月记为有效月,否则当月数据记为缺失值;
特别地,当Σ0=I12(I12为12×12维单位矩阵),即ρ=0时
(2)τ2的满条件后验分布为:
为了增强同学们的校园文明意识,我校学生会和团委联合举办校园文明标志征集活动,请你设计一个标志,附上设计说明,上交到班主任老师处。
(2)
特别地,当Σ0=I12时,
(3)θj的满条件后验分布为:
(3)
其中,θ-j=(θ1,…,θj-1,θj+1,…,θ12)以及I-j=(1,…,1)T为11维的向量.另外,上面分布中的Σ11,Σ12Σ21,Σ22的定义见附录(A.2)式.
特别地,当Σ0=I12时,
(4)σ2的满条件后验分布为:
(4)
基于上面各参数的满条件分布,可以使用下面的Gibbs抽样得到各参数的后验分布的随机数:
1.给定参数θ=(θ1,…,θ12)T,μ,σ2,τ2的初始值,记为θ1(0),…,θ12(0),μ(0),τ2(0),σ2(0);
b)根据(2)式,从分布
a)根据(1)式,从分布
中产生μ(t+1);
2.设第t步迭代值为θ1(t),…,θ12(t),μ(t),τ2(t),σ2(t)(t=0,1,2,… ),进行下面的更新
中产生τ2(t+1);
c) 根据(3)式,从分布
中产生θj(t+1),j=1,…,12;
d) 根据(4)式,从分布
π(σ2|θ1(t+1),…,θ12(t+1),μ(t+1),τ2(t+1),y11,…,y12n12),
中产生σ2(t+1);于是获得θ1(t+1),…,θ12(t+1),μ(t+1),τ2(t+1),σ2(t+1);
很多企业在二次创业阶段会遇到一些问题。这个阶段最根本的问题是组织能力与战略发展的缺口,这是必然的发展缺口。因为经营增长拉动管理,管理滞后于经营半步。那么,怎么去解决组织能力和战略发展的缺口呢?要提升组织能力,主要是四个方面:
当Σ0=I12时,
由Gibbs抽样理论中,该马尔科夫链经过充分的大步长后,即可收敛.在实践中,可以通过画路径图观察期收敛情况,更多细节可参考文献[1].基于上面的随机数θ1(t),…,θ12(t),μ(t),τ2(t),σ2(t),t=0,1,2,…,可以获得月平均单耗的θ1,…,θ12的估计:
其中,T取充分大值.进一步,基于年单耗与月单耗之间的关系,可以获得年平均单耗的估计.考虑下面的事实:由年单耗的定义知
教师在小学阶段的数学学科课程中,合理地使用数字化的教学资源,能够有效地扩充数学课堂的容量性。数字化的这些资源能够在一定程度上,刺激学生各种感官,促使学生主动吸收知识,缩短了对知识的接受时间。由于传统的课堂教学方式严重束缚了课堂的容量,因此,教师应利用数字化的教学资源打破这一局面,加快教学的进程,减少大量的课堂时间浪费在课堂的板书上,从而优化课堂的结构[2]。
当天下午,我就来到了周书记的办公室,周书记墙上那幅“静水流深”的字不见了,换成了毛泽东同志的题字“为人民服务”,虽然,毛泽东同志的题字是印刷出来的,却也装裱得很精致,挂在周书记头顶的上方,倒也显得很像那么回事的。
=该建筑1月份单耗+…+该建筑12月份单耗
对于特定类型的建筑,设总体年单耗为随机变量X以及总体月单耗为随机变量X1,…,X12,则由上式知X=X1+…+X12.从而,年平均单耗与月平均单耗之间的关系为
E(X)=E(X1)+…+E(X12).
(1)μ的满条件后验分布为:
欧阳橘红把玩具汽车和洋娃娃,默默地递给雷钢和雷红,明知叫他们不会答应,就没把小钢,小红几个字叫出口了,但她内心里,在痛苦地嘶喊着,小钢,小红,仿佛声声都沾着血丝,带着痛苦。她弯下腰,一手将雷钢和雷红揽进怀里,眼泪无声地往下掉。
根据上节的Gibbs抽样方法,可以获得平稳分布为后验分布的马尔科夫链样本.在下面计算中,模拟重复1 000次,每次模拟都设定迭代次数为30 000次,其中前10 000次剔除,后20 000次作为后验样本给出各参数的估计.首先,以办公建筑为例,基于不同的自回归系数ρ来估计其平均月、年的平均单耗,结果见表1.
从表1可以看出,对于不同的ρ,年平均单耗基本相同,但是月单耗之间略有差异.为了进一步比较ρ对各月平均单耗影响,可以画出不同ρ的月平均单耗的轮廓曲线.为了避免视觉混乱,只画出了ρ为0,0.5,0.8下的轮廓图(见图1).从图1可以看出,随着ρ的不断增加,月平均单耗的季节性在不断调整.整体而言,3种情况下的季节性趋势基本相似.但是,个别月份存在一些差异,诸如,2、3月份和7、8月份.
表1 ρ不同取值下办公建筑建筑平均单耗估计(样本量为268)
可以采用两种方法确定ρ的取值.方法一:直接观察比较.比如说,考虑7、8月份的变化情况.因为办公建筑的耗电量一般主要依赖气温,查阅2015年上海7、8月份的气温数据,发现8月气温比7月气温稍高,但是差异不会太大.所以,结合图1,可以认为取ρ=0.5比较合理.方法二:类似第二节的分析,将ρ看成超参数,对其假定一个先验分布,给出其后验分布的满条件分布,再通过Gibbs抽样,得到其后验均值的估计.由于第二种方法需要确定ρ的先验分布,以及后验抽样会加大计算量.为了方便起见,本研究采用第一种方法确定ρ的取值.
总而言之,在地质条件复杂的情况下,为了确保煤矿中的巷道能够在掘进过程中保持稳定,就必须要选择合理的掘进支护技术。在本应用案例中,首先是对巷道区域进行了划分,然后针对不同的巷道区域采用不同的掘进支护技术,并通过切顶卸压的方式来降低顶板给巷道造成的压力,从而大大提高了巷道的稳定性,保证了煤矿掘进开采工作的顺利进行。
图1 办公建筑月平均单耗
图2是关于θ1的马尔科夫链路径图和遍历均值图,图2(b)中的遍历均值计算如下:
通过图2,可以发现马尔科夫链在迭代10 000 次基本上是收敛的.因此所抽取的后验样本是有效的,所得的参数估计是可信的.其他参数的收敛诊断图可以类似考虑.
图2 马尔科夫链的收敛诊断图.(a)Trance Polt theta 1;(b)Ergodic Mean Plot of theta 1
最后,基于专家建议和历史经验,取ρ=0.5,得出2015年上海市各类建筑的月平均单耗和年平均单耗的估计(表2).
Gibbs抽样的关键步骤是计算参数θ1,…,θ12,μ,τ2,σ2满条件后验分布,这里列出各参数的满条件分布(详细过程见附录):
表2 2015年上海市各类建筑的月平均单耗和年平均单耗 (kWh·m-2)
各参数满条件分布的推导过程
首先考虑(θ1,…,θ12,μ,τ2,σ2|y11,…,y12n12)的联合后验分布:
π(θ1,…,θ12,μ,τ2,σ2|y11,…,y12n12)
∝π(μ,τ2,σ2)π(θ1,…,θ12|μ,τ2,σ2)π(y11,…,y12n12|θ1,…,θ12,σ2)
∝π(μ)π(τ2)π(σ2)π(θ1,…,θ12|μ,τ2)π(y11,…,y12n12|θ1,…,θ12,σ2),
(A.1)
注:为了简洁,这里假定超参数μ,τ2是相互独立的,对于非独立情况,可类似考虑.
下面分别求μ,τ2,θj的满条件后验分布:
(2)日本灯桩设计建设。日本海上保安厅在灯桩设计建设方面,全部推行标准化建设。其发展的思路是:灯桩设计建造模块化、通用化、标准化。
(1)μ的满条件后验分布求解:
π(μ|θ1,…,θ12,τ2,σ2,y11,…,y12n12)
∝π(μ)π(θ1,…,θ12|μ,τ2)
因为
其中,c是与μ无关的常数.
特别地,当Σ0=I12(I12为12*12维单位矩阵),即ρ=0时,
(2)τ2的满条件后验分布求解:
由(A.1)式知:
π(τ2|θ1,…,θ12,μ,σ2,y11,…,y12n12)
∝π(τ2)π(θ1,…,θ12|μ,σ2)
迭代上述过程,产生一条马尔科夫链.
(3)θj的满条件后验分布求解:
由τ2Σ0的定义知,θj与θ-j的协方差矩阵为:
(A.2)
θj|θ-j,μ,τ2~N(A,B).
由(A.1)式知:
π(θj|θ-j,μ,τ2,σ2,y11,…,y12n12)
∝π(θj|θ-j,μ,τ2)π(θ-j,μ,τ2)π(yj1,…,yjnj|θj,σ2)
∝π(θj|θ-j,μ,τ2)π(yj1,…,yjnj|θj,σ2)
特别地,当Σ0=I12时,
(4)σ2的满条件后验分布求解:
由(A.1)式知:
π(σ2|θ1,…,θ12,μ,τ2,y11,…,y12n12)
∝π(σ2)π(y11,…,y12n12|θ1,…,θ12,σ2)
所以,
[1] 茆诗松,汤银才.贝叶斯统计 [M].北京:中国统计出版社,2012.
Mao S S,Tang Y C.Bayesian statistics [M].Beijing:China Statistics Press,2012.
[2] 吴喜之.现代贝叶斯统计学 [M].北京:中国统计出版社,2000.
Wu X Z.Modern Bayesian statistics [M].Beijing:China Statistics Press,2000.
[3] 马媛,于军琪,杨柳,等.大型公共建筑能耗动态模型的研究与应用 [J].计算机工程与应用,2011,1(6):214-217.
Ma Y,Yu J Q,Yang L,et al.Study on dynamic energy consumption model and application of large-scale public building [J].Computer Engineering and Applications,2011,47(16):214-217.
[4] 孙立新,闫增峰,杨丽萍.西安市公共建筑能耗现状调查与分析 [J].建筑科学,2008,24(6):25-28.
Sun L X,Yan Z F,Yang L P.Investigation and analysis on energy consumption of public buildings in Xi’an [J].Building Science,2008,24(6):25-28.
[5] 徐强,庄智,朱伟峰,等.上海市大型公共建筑能耗统计分析 [C].第七届国际绿色建筑与建筑节大会论文集,2011,28(3):322-326.
Xu Q,Zhuang Z,Zhu W F,et al.Statistical analysis on energy consumption of large-scale public buildings in Shanghai [J].International Green Building and Building Energy Conservation Conference,2011,28(3):322-326.
(责任编辑:冯珍珍)
Bayesian statistical analysis on energy for consumption oflarge-scale public buildings in shanghai
Xu Pengtao, Liu Jicai, Zheng Lu, Yue Rongxian*
(College of Mathematics and Science,Shanghai Normal University,Shanghai 200234,China)
In the process of measuring the power consumed in buildings,massive quantity of real-time energy consumption data have been accumulated.Salient features of these data include large samples,noise accumulations and the presence of measurement errors,etc.Thus,how to analyze and apply these massive data becomes a very challengeable problem.In this paper,based on the dataset which include the consumption of large-scale public buildings in Shanghai for 2015,we establish a hierarchical Bayesian model to estimate the average monthly consumption and the average annual consumption of large public-scale buildings in 2015.The results will help government regulators to conduct effective evaluation on energy saving for buildings.
large-scale public buildings; Bayesian hierarchical model; estimation of the average consumption; MCMC sampling
2016-04-20
上海市科学技术委员会科研计划项目(14DZ201902)
岳荣先(1958-),教授,主要从事数理统计方面的研究.E-mail:yue2@shnu.edu.cn
O 212.8
A
1000-5137(2017)02-0169-09
*通信作者