短期负荷预测: 一种幂回归方法外文翻译资料

 2022-12-17 02:12

英语原文共 6 页,剩余内容已隐藏,支付完成后下载完整资料


短期负荷预测:

一种幂回归方法

G. De Nicolao Universitagrave; degli Studi di Pavia: Dip. Ingegneria

Industriale e

dellrsquo;Informazione Pavia, Italy

M. Pozzi

CESI S.P.A: 意大利米兰输电系统运营部

E. Soda

CESI S.P.A: 意大利米兰输电系统运营部

M. Stori

CESI S.P.A: 意大利米兰输电系统运营部

摘要 - 采用幂回归方法解决了短期负荷预测问题。利用解释变量的高度相关特性,只有两个负荷被认为足以提供预测所需的信息:一天前和一周前。“相似日”的概念随后被用来从历史记录中提取有意义的训练集。多年以来,我们得到的一个显著趋势表明,应在负荷率中搜索不变性,这一趋势让我们能够对经过对数转换的负荷数据加以运用,从而得出幂回归模型。在2011年和2012年对意大利国民消费水平进行测试时,新的List-4预测指标表现优于意大利TSO目前使用的预测指标Sibilla。

关键词-预测;短期负荷;幂回归;学习;预测(关键词)

  1. 综述

发电、输电和配电领域的不断创新,加上能源部门的自由化以及电网系统的日益互联,使得电力系统的运行日益复杂。监测电网的充分性和安全性需要先进的数学工具,从状态估计、用于实时运行的最佳有功/无功功率流分析,到用于规划实施的长期负荷预测和维护优化。

短期负荷预测(STLF)与未来几个小时/天的能耗估算有关,其对于维护系统安全和发电的有效分配至关重要;此外,在能源交易时代,从经济的角度来看,采用先进的统计方法完成预测的准确性已经变得越来越重要。

在本文中,我们将前使用的预测算法(Sibilla)作为参考,为意大利电网提出STLF。特别地,我们通过一种相对低复杂度的算法,研究挑战技术水平现状的可能性,这种算法从1990年以来的大量历史数据库中提取出了相关信息。

在最后一次衰减期间,研究出了几种用于负荷预测的方法[1]。电力负荷预测算法主要分为两类[2],即基于参数模型的算法和基于人工智能(AI)技术的算法。参数化方法包括ARIMA模型、傅立叶级数、线性回归模型、随机过程模型,这些模型的参数是通过历史数据估计得到的[3]。相反,许多基于人工智能的方法使用是人工神经网络(ANN)对负荷进行建模的。人工神经网络的一个主要优点是,其提供了灵活的通用模型,这种模型可用于计算电力需求序列的非线性,以及天气和负荷变量之间的非线性关系。此外,人工神经网络可被直接用来从历史数据中学习依赖关系,而无需明确选择适当的模型[2]。一些研究者发现,将神经网络与小波变换技术相结合,可以进一步改善预测结果[4]-[5]。在预处理阶段,对输入数据进行小波变换[6],然后将数据插入神经网络,从负荷曲线[1]中去除冗余信息。此外,其他机器学习技术和模糊逻辑方法也被用于负荷预测和/或分类,也取得了相对良好的性能结果[7]。

与许多其他现实预测问题一样,成功预测算法的关键是在基础模型的灵活性和简约性之间实现最优(或近乎最优)权衡。使用基本的线性回归模型是注定要失败的,因为这类模型不够灵活,无法捕捉到模型的所有细节和非线性。另一方面,更复杂的模型需要对更多参数进行估计,并且很容易受到多帧化问题的影响,这些问题会降低预测性能。有趣的是,解释变量,尤其是之前负载的时间序列,彼此之间有很大的关联。这意味着,

978-1-4799-3561-1/14/$31.00 copy;2014 IEEE 1 PMAPS 2014

通过适当选择或对输入数据进行预处理的方法来提取适当的“总结”,对于在不影响性能的情况下保持模型的低复杂度至关重要。这些观察结果得以让我们继续目前的工作,在这项工作中,低复杂度预测器的使用由两个关键选择实现的。首先,将解释变量分解为两个变量,即预测日前一天和预测日前一周的电力负荷。然后,通过在历史记录中搜索“相似时期”,形成一组足量的学习范例[8]。一旦获得学习集,就可以应用不同的机器学习方法来获得一个预测因子。接下来是第二个关键选择:在应用一个简单的线性回归模型之前,负载数据是一个对数变换,而不是去寻找过于复杂的模型。由于使用了线性对数-对数模型,因此结果预测者的核心即 LIST-4(线性短期预测器)是一个幂回归模型。在根据意大利2011年和2012年的能源消耗数据进行测试时,LIST-4与当前使用的预测器进行了非常有利的比较。这证明了一种简化的建模方法的潜力,而且,这种方法可以很容易地演变为包含更复杂的对解释变量非线性依赖。

论文的组织结构如下。在第二节里,我们确定了需要短期预测的问题,并给出了可用的历史记录。我们在第三节讨论了预测算法的方法论。第四节给出了结果和比较。第五节在论文结尾给出了一些结论。

  1. 可用数据和当前预测者

Terna是意大利输电系统运营商(TSO),负责能源输送和调度,因此,也负责电力供需平衡的安全管理,每年365天、每天24小时地工作。作为意大利国家统计系统(Sistan)统计办公室成员,意大利TSO(TERNA)得以收集并分享从电力部门那里获得的数据。在所有数据中,TERNA提供了意大利总耗电量的记录,采样周期为15分钟[9]。每个样本表示特定15分钟的平均耗电量。除了能源需求的最终数据外,一些目前被预测器使用(Sibilla)的气象数据也是可以使用的,但本文新开发的预测器将不使用这些数据。Terna开发了一种称为Sibilla的短期负荷预测方法,可以预测第二天96个特定“十五分钟”值的满载曲线。底层算法依赖于“相似日”原则。更准确地说,在过去几年里也出现了一些“相似日”。在每个相似日计算得到的预测结果也会考虑到天气信息,这些预测结果会输入到一个加权平均值,以产生最终的预测值。请注意,在实际发布预测之前,可能会进一步做一些手动调整。请注意,在进行任何手动调整之前,将根据Sibilla发布的原始预测与新预测器进行比较。

  1. 方法论

在这一节中,短期负荷预测问题是根据一个学习框架来提出的。更确切地说,我们假定一个可用的学习集,由数据对(xi, yi)组成,i =1,hellip;,n,其中xi Rp是自变量(也称为解释变量),并且yi R1表示因变量。学习集用于学习因变量与独立变量之间相关联的关系y x。一旦 估计得出,新的数据对x*, y* 的因变量y* 将被预测为y = f(x*)。如果这个学习问题是在概率框架下进行的,那么预测就可以简化为对条件期望值的计算。事实上,如果xi, yi 是从给定的联合概率密度函数px, y中提取出的、独立且相同分布的随机样本,那么由y = f(x) = E[y*|x*]将均方误差E[(y-y*)2|x*)]最小化。然而,在负荷预测问题中,数据对(xi,yi)可能并不认为是从全年的一个特定分布中获取的,因为每年的电力消耗都有一个明显的趋势。因此,采用统计学习方案需要进行初步的减损以及其他必要的规范化,以从数据中删除时变模式。在此,我们探索另外一种方法:不是引入可靠的统计假设,或通过或多或少的复杂规范化来强制实施。在独立向量x的基础上,我们直接探讨了目标变量y的可预测性。学习这种关系的通常方法是考虑各种模型,例如参数模型或具有不同复杂性的神经网络。在考虑复杂模型之前,对简单回归模型的性能进行研究是一种不错的实践方法。第一步即是本文的目标。不言而喻,一旦建立了学习集,对更复杂的非线性预测因子的评估将是值得进一步探索的。

预报器的实际实施需要经过四个步骤:

  1. 解释变量的选择。 在所有可能的解释变量中,选择将形成回归向量x的变量子集。由于模型随后可能出现过参数化,因此包含太多的变量(取自之前负载的时间序列)并不是一个可行的解决方案。
  2. 学习集的构造。 请注意,由于工作日可能对电力消耗产生影响(例如,星期日与星期一的情况明显不同),这点必须特别注意。
  3. 变量转换。 使用适当的坐标变换可以大大提高(可能是一个很简单)学习方案的有效性(在此,将成功应用对数变换)。
  4. 回归模型的估计。 一旦定义了回归向量,即将回归算式应用到在学习集中收集到的历史数据。

下面,我们将对这四点分别进行讨论。关于对移动假期进行实际处理的一些进一步实施细节,参见第III.F分节。

  1. 解释变量的选择

关键是选择最小的历史数据集,该数据集能够捕获能够干扰、影响负载的所有相关信息。考虑两个时间尺度:每日和每周。获取这两个尺度信息的最简单方法是,将x作为二维向量,其条目为:

在前几年里,这项工作一直重复进行,直到获得23个实例,这些实例是在1990年至2012年期间获得的。注意,在学习集的构建过程中,我们需要将假期剔除,如11月1日。

在形式上,“相似日”是函数 sim_day(past_year, current_year, day) 的输出,其中 day  [1, 366]. 例如,在我们的例子中,

    • x1: 24小时前的负载
    • x2: 一周前的负载

例如,如果要预测2013年11月4日(星期一)11:45的负载y*,则这两个条目将是:

    • x *: 2013年11月3日11:45的负荷

1

    • x * 2013年10月28日(星期一)11:45的负荷

2

关键思想是,一旦二维向量x可用,其余历史数据的信息量就会很弱,其不需要包含在预测器。

  1. 学习集的构建

为了解释学习集的构建过程,再次考虑2013年11月4日11:45的负荷预测问题。正如我们已经得到的,这个对数-负荷是未知的目标变量y*,其需根据解释向量x*=[x1 x2 ]进行预测。

现在我们需要一个学习集,这是一组例子(xi, yi),i = 1, hellip;, n,可以用来学习x* 和y*之间的关系。

1 2

在我们的例子中,学习集如表1所示。

i

yi

xi1

xi2

1

11:45

2012/Nov/05 Monday

11:45

2012/11/04

Sunday

11:45

2012/Oct/29 Monday

2

11:45

2011/Nov/07 Monday

11:45

2011/Nov/06 Sunday

11:45

2011/Oct/31 Monday

14

11:45

1999/Nov/08 Monday

11:45

1999/Nov/07 Sunday

11:45

1999/Nov/15 Monday

23

11:45

1990/Nov/07 Monday

11:45

1990/Nov/06 Sunday

11:45

1990/Oct/31 Monday

表 I.

  sim_day    

其中2013年第308天为11月4日(星期一),1999年第312天为11月8日(星期一)。

如果出现假期,如复活节和其他法定假日,需要相同及特殊的转换,如第III.E小节所述。

  1. 变量转换

众所周知,坐标的初步变换可以提高预测性能。例如,如果从联合正态分布中抽取学习数据,则最佳预测因子是独立变量的线性函数。因此,在对数正态分布数据存在的情况下,对数-变换数据是一种常用的方法,可以为变换后的数据设计一个最

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[20537],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。