支持向量机在热带地区的建筑能源消耗中的应用外文翻译资料

 2022-08-11 11:08

英语原文共 9 页,剩余内容已隐藏,支付完成后下载完整资料


支持向量机在热带地区的建筑能源消耗中的应用

摘要

预测建筑能源的消耗在建筑模型消耗基础模型的发展以及计量检测协定(MVP)中变得越来越重要。本论文提供了“支持向量机”(SVM)——一种全新的神经网络算法——来预测在热带地区的建筑能源消耗。本论文的目标在于检测SVM在建筑预测方面的可行性与适用性。我们随机选取了四个在新加坡的商业建筑作为研究案例。天气其指标包括了每月平均室外干球温度、相对湿度以及全球太阳辐射作为三个输入特征。平均月度业主公共设施费用被选来建立并测试模型。此外,SVM模型的表现往往取决于两个重要的参数:C和e,在本文中我们将会使用基于径函数(RBF)核的方法来逐步找出它们。最后,所有的预测结果的变异系数(CV)都小于3%,且错误率(%)都在4%内。

关键词:建筑能耗预测;支持向量机;天气数据;热带地区

目录

摘要 1

第 1 章 绪论 3

第 2 章 用于回归估计的支持向量机 4

2.1 SVM回归理论 4

2.2 用于回归估计的SVM模型的特征 6

2.3 归一化处理的必要性 7

第 3 章 将SVM运用到对建筑能源消耗的预测中 7

3.1 数据收集 7

3.2 公共设施账单日期 8

3.3 模型定义 9

3.3.1 衡量模型表现的标准 9

3.3.2 核的选择 9

3.3.3 选取参数C和 10

3.4 将SVM用于预测房东能源消耗的结果 12

第 4 章 结论 14

参考文献 15

绪论

以往的研究表明,建筑能源消耗基准是对于能源效益合同和测量鉴定协议(MVP)的一个非常重要的因素之一。此类基线模型可以直接决定那些可以在一个建筑经历了翻新工作之后的能源节约情况。人们已经在建立和改进基线模型上付出了很大的努力以尽可能使这个模型变得精确。Fels利用可变基度日法去预估住宅翻新的能源使用。Kissock建立了一个算法来计算商务楼的翻新所损耗的能源。Krarti等人使用神经网络去估计在商务楼的翻新过程中节约的能源和损耗。Dhar等人将傅里叶级数运用到了模拟在商务楼每小时的能源消耗。然而,在大多数的实际情况中,公共账单数据会由于它们可以广泛运用且获得与处理成本低而被广泛使用。在热带地区,Dong等人使用了两年的公共设施账单并且结论在很高的区间内表现出了很小的误差。

非常著名的是,对于建筑能耗而言,有一个确定的恒定负载,例如灯光负载、风扇负载和插头负载等,这些负载不会因为天气情况的变化而发生改变,尤其是业主能源消耗。业主能源消耗指的是在建筑的各个公寓中,典型的部分有:(1)控制建筑内的空气情况的中央空调系统;(2)垂直运输服务,例如自动扶梯和电梯;(3)通风设施,例如排风扇或其他通风设备;(4)位于公共区域的人工照明系统,即走廊或者公共服务区域例如厕所和电梯。很显然,对于这些系统的使用与建筑能源使用和天气数据之间存在着确定的非线性关系。此外,业主经常只会收到来自房东的账单。而对于不管是业主还是能源效率测量(ECMs)翻新合同而言,处理基线房东能源消耗而不是整栋建筑的能源消耗是相对而言更有益的。因此,出于实际理由,我们决定做一个关于如何估计房东能源消耗的非线性表现方面的探索。Dong等人已经尝试使用神经网络去预测同等类型的建筑能源消耗,然而它们约有20%的预测结果表现出了低误差率但是却有着较高的变异系数。

本论文展现了一种新的神经网络技巧,称为“支持向量机”(SVM)用以估计房东能源消耗。SVM,由Vapnik和他的同事于1995年建立,现已被广泛运用于分类、预测和回归等领域。这些实践的成功大多可以归功于基于vc理论的可靠的理论基础。本研究的目的,首先在是要检验将SVM模型运用于预测建筑能源消耗的可行性,然后研究不同SVM参数对预测精确度的影响。我们从位于中心商业区的写字楼中随机选取了四个用以对细节的研究。整个建筑的能源消耗被选于建立和检测模型。天气数据,即所谓的室外干燥温度、相对湿度以及全球太阳辐射被选为三个参数。

本文的主要结构如下:第二部分我们简单地介绍SVM回归过程;第三部分将SVM应用到四个我们选定的建筑中;对于用于数据处理和统计性能指标也会在第三部分中被提及;最后结论会在第四部分中展现。

用于回归估计的支持向量机

支持向量机(SVM)是基于结构风险最小(SRM)的归纳原则,其目的在于使一个由训练集的误差和置信水平组成的泛化误差的上界最小。这个与我们一般广泛使用的经验误差最小化(ERM)不同,后者只考虑如何使训练集的误差最小。基于这样的理论,在解决机器学习的问题时,相较于传统的使用ERM原则的神经网络,SVM往往会得到一个更好的泛化结果。SVM的另一个关键性的特点在于,训练SVM等价于解决一个线性约束的二次规划问题,因此一般来说,SVM问题的解是唯一的且为全局最优解,而不像别的神经网络的训练需要冒着可能陷入局部最小的非线性优化。在SVM中,问题的解取决于训练集的一个子集,该子集也就会被当作“支持向量”来参考。当我们只使用支持向量时,我们获得的结论会与当我们使用所有训练数据点所获得的结论相同。SVM其中的一个缺点是训练时间复杂度往往是训练样本而二次方乃至三次方。所以当我们需要解决一些大规模的问题的时候,我们往往需要大量的计算时间。但是在这个研究中,我们只会考虑一个小规模的数据库。

SVM回归理论

给定一组数据点,,hellip;,(是训练样本的数量)是从一个未知函数中随机获取且都相互独立的,而SVM会用下式来近似估计这个函数:

(2.1)

其中表示一个高纬度的、从输入空间中非线性映射到的一个特征空间。此处的系数和分别通过最小化正则项和风险函数来进行限制:

(2.2)

其中第一项被称为正则项,使该项尽可能地小可以让模型尽可能地平稳,因此它扮演着一个控制函数容量的角色。第二项是通过-敏感的损失函数来计算的经验误差,它有如下定义:

(2.3)

这定义了一个通道(如图2.1)。如果我们的预测值在这个通道内的话,我们就假定损失是零,而如果在这个通道外的话,损失就会被设计为预测偏差与这个通道的半径之间的差值。C被称为正则化常数,它们都是由使用者定义的。

为了获得估计的和,等式(2.2) 可以通过引入松弛变量转化为下式:

图2.1 The parameters for the support vector regression

(2.4)

在大多数情况下,引入(2.4)式的对偶函数(2.5)式可以帮助我们更简单地解这个问题:

(2.5)

此处,L是拉格朗日函数,都是拉格朗日乘子,因此(2.5)式必须要满足不等式限制:

(2.6)

原式的最优点在L的鞍点中,对L的各个变量求偏导,即可得到下式(表示和,同):

(2.7)

(2.8)

(2.9)

将(2.7)、(2.8)、(2.9)依次代入(2.5),便可得到对偶式:

(2.10)

此外,将(2.8)式代入到(2.1)式中,可以得到:

(2.11)

而引入核函数后,(2.11)又可以写为:

(2.12)

的值等两个向量和在各自的特征空间和中的内积,即。通过使用核函数,所有需要的消耗都可以非常直观地展现在输入空间中,而不必计算映射函数。一些常用的核函数包括:线性核、多项式核以及径向基函数(RBF)核,其中和是核参数。使用不同的核函数,就可以在任意类型的决策面上构造出不同的学习机。

基于二次规划的Karush-Kuhn-Tucker(KKT)条件,在等式(2.5)中,满足系数不为零的数量是可以事先确定的,而与它们相关且近似误差等于或大于的数据点便被称为支持向量。这些数据便是落在我们讨论的函数边界上或边界外的数据。根据等式(2.5),很显然支持向量是所有的数据点中仅有的会被用于决定目标函数的元素,因为对于其它的数据点而言,的值等于零。一般来说,过大也有可能会降低训练点的精度。出于这个理由,本质上也是一个模型表现的稀疏性与数据的精确性之间的一个权衡。

用于回归估计的SVM模型的特征

基于对SVM的理论的描述,我们可以列出几个关于SVM模型的特征。

首先,SVM估计回归使用了一系列定义在高纬度特征空间的线性函数,然而我们的输入的内容却具有非线性特征。这些函数被称为和函数。

其次,SVM模型具有通过使风险最小化的方式来得出回归结果,基于统计学习理论,即这里的风险是使用Vapnik的-不敏感的损失函数。

最后,SVM模型使用了SRM原则,即最小化的风险函数是由整体误差即置信等级组成的。

归一化处理的必要性

在使用SVM前和应用神经网络时对数据进行归一化处理是十分重要的。这一步的主要目的在于避免那些本身变化幅度就比较大的数据对于模型的影响覆盖掉那些本身变化幅度较小的数据对模型的影响。另一个好处在于它可以避免那些在计算过程中遇到的一些数值困难。较大的属性值有可能会导致数值上的问题,这是因为像线性核或者多项式核这样的核函数往往会依赖于特征向量的内积结果。一般来说我们会把数据的范围线性地缩小到[-1,1]或者[0,1]之间。相似的,在实验之前,我们会用相同的方法把实验数据进行归一化处理。例如:假如数据原本的范围是[-10,10],那么我们就会把它转化到[-1,1]之间;而如果原本的范围是[-11,8],那么我们在实验时就会把它缩小到[-1.1,0.8]。

将SVM运用到对建筑能源消耗的预测中

数据收集

我们从新加坡的中心商业区所有地建筑中随机地选取了四栋建筑。它们都是同等级的商用写字楼。我们通过调查分析早期的关于能源消耗的研究,获得了这四栋写字楼的公共设施账单。为了保证私人建筑的隐私,这四栋写字楼分别以建筑A-D来代指。最早的调查开始于1996年10月,并且调查过程长达两年之久,而第二个调查开始于2000年至2001年为止。相对应的,整个土地设施公共账单也被分为了两个部分。事实上,电力消耗数据可以从业主的电表中读取。表3.1展示了四栋建筑的体积以及四栋建筑的平均年度能源消耗。我们将四栋建筑自1996年至1998年以及2000年的数据作为训练集,而把2001年的数据作为测试年。

表 3.1 Size and annual energy consumption of four buildings

Building

Training year

Test year

Total building area (m2)

Landlord area (m2)

Total landlord

energy consumption (MW/yr)

A

October 1996 to October 1998 and 2000

2001

36,629

14,938

5291

B

October 1996 to October 1998 and 2000

2001

46,400

22,627

6024

C

October 1996 to October 1998 and 2000

2001

60,895<!--

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[237423],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。