英语原文共 6 页，剩余内容已隐藏，支付完成后下载完整资料

短期负荷预测：

一种幂回归方法

G. De Nicolao Universitagrave; degli Studi di Pavia: Dip. Ingegneria

Industriale e

dellrsquo;Informazione Pavia, Italy

M. Pozzi

CESI S.P.A: 意大利米兰输电系统运营部

E. Soda

CESI S.P.A: 意大利米兰输电系统运营部

M. Stori

CESI S.P.A: 意大利米兰输电系统运营部

摘要 - 采用幂回归方法解决了短期负荷预测问题。利用解释变量的高度相关特性，只有两个负荷被认为足以提供预测所需的信息：一天前和一周前。“相似日”的概念随后被用来从历史记录中提取有意义的训练集。多年以来，我们得到的一个显著趋势表明，应在负荷率中搜索不变性，这一趋势让我们能够对经过对数转换的负荷数据加以运用，从而得出幂回归模型。在2011年和2012年对意大利国民消费水平进行测试时，新的List-4预测指标表现优于意大利TSO目前使用的预测指标Sibilla。

关键词-预测；短期负荷；幂回归；学习；预测（关键词）

综述

发电、输电和配电领域的不断创新，加上能源部门的自由化以及电网系统的日益互联，使得电力系统的运行日益复杂。监测电网的充分性和安全性需要先进的数学工具，从状态估计、用于实时运行的最佳有功/无功功率流分析，到用于规划实施的长期负荷预测和维护优化。

短期负荷预测（STLF）与未来几个小时/天的能耗估算有关，其对于维护系统安全和发电的有效分配至关重要；此外，在能源交易时代，从经济的角度来看，采用先进的统计方法完成预测的准确性已经变得越来越重要。

在本文中，我们将前使用的预测算法（Sibilla）作为参考，为意大利电网提出STLF。特别地，我们通过一种相对低复杂度的算法，研究挑战技术水平现状的可能性，这种算法从1990年以来的大量历史数据库中提取出了相关信息。

在最后一次衰减期间，研究出了几种用于负荷预测的方法[1]。电力负荷预测算法主要分为两类[2]，即基于参数模型的算法和基于人工智能（AI）技术的算法。参数化方法包括ARIMA模型、傅立叶级数、线性回归模型、随机过程模型，这些模型的参数是通过历史数据估计得到的[3]。相反，许多基于人工智能的方法使用是人工神经网络（ANN）对负荷进行建模的。人工神经网络的一个主要优点是，其提供了灵活的通用模型，这种模型可用于计算电力需求序列的非线性，以及天气和负荷变量之间的非线性关系。此外，人工神经网络可被直接用来从历史数据中学习依赖关系，而无需明确选择适当的模型[2]。一些研究者发现，将神经网络与小波变换技术相结合，可以进一步改善预测结果[4]-[5]。在预处理阶段，对输入数据进行小波变换[6]，然后将数据插入神经网络，从负荷曲线[1]中去除冗余信息。此外，其他机器学习技术和模糊逻辑方法也被用于负荷预测和/或分类，也取得了相对良好的性能结果[7]。

与许多其他现实预测问题一样，成功预测算法的关键是在基础模型的灵活性和简约性之间实现最优（或近乎最优）权衡。使用基本的线性回归模型是注定要失败的，因为这类模型不够灵活，无法捕捉到模型的所有细节和非线性。另一方面，更复杂的模型需要对更多参数进行估计，并且很容易受到多帧化问题的影响，这些问题会降低预测性能。有趣的是，解释变量，尤其是之前负载的时间序列，彼此之间有很大的关联。这意味着，

978-1-4799-3561-1/14/$31.00 copy;2014 IEEE 1 PMAPS 2014

通过适当选择或对输入数据进行预处理的方法来提取适当的“总结”，对于在不影响性能的情况下保持模型的低复杂度至关重要。这些观察结果得以让我们继续目前的工作，在这项工作中，低复杂度预测器的使用由两个关键选择实现的。首先，将解释变量分解为两个变量，即预测日前一天和预测日前一周的电力负荷。然后，通过在历史记录中搜索“相似时期”，形成一组足量的学习范例[8]。一旦获得学习集，就可以应用不同的机器学习方法来获得一个预测因子。接下来是第二个关键选择：在应用一个简单的线性回归模型之前，负载数据是一个对数变换，而不是去寻找过于复杂的模型。由于使用了线性对数-对数模型，因此结果预测者的核心即 LIST-4（线性短期预测器）是一个幂回归模型。在根据意大利2011年和2012年的能源消耗数据进行测试时，LIST-4与当前使用的预测器进行了非常有利的比较。这证明了一种简化的建模方法的潜力，而且，这种方法可以很容易地演变为包含更复杂的对解释变量非线性依赖。

论文的组织结构如下。在第二节里，我们确定了需要短期预测的问题，并给出了可用的历史记录。我们在第三节讨论了预测算法的方法论。第四节给出了结果和比较。第五节在论文结尾给出了一些结论。

可用数据和当前预测者

Terna是意大利输电系统运营商（TSO），负责能源输送和调度，因此，也负责电力供需平衡的安全管理，每年365天、每天24小时地工作。作为意大利国家统计系统（Sistan）统计办公室成员，意大利TSO（TERNA）得以收集并分享从电力部门那里获得的数据。在所有数据中，TERNA提供了意大利总耗电量的记录，采样周期为15分钟[9]。每个样本表示特定15分钟的平均耗电量。除了能源需求的最终数据外，一些目前被预测器使用（Sibilla）的气象数据也是可以使用的，但本文新开发的预测器将不使用这些数据。Terna开发了一种称为Sibilla的短期负荷预测方法，可以预测第二天96个特定“十五分钟”值的满载曲线。底层算法依赖于“相似日”原则。更准确地说，在过去几年里也出现了一些“相似日”。在每个相似日计算得到的预测结果也会考虑到天气信息，这些预测结果会输入到一个加权平均值，以产生最终的预测值。请注意，在实际发布预测之前，可能会进一步做一些手动调整。请注意，在进行任何手动调整之前，将根据Sibilla发布的原始预测与新预测器进行比较。

方法论

在这一节中，短期负荷预测问题是根据一个学习框架来提出的。更确切地说，我们假定一个可用的学习集，由数据对（xi, yi）组成，i =1，hellip;，n，其中xi Rp是自变量（也称为解释变量），并且yi R1表示因变量。学习集用于学习因变量与独立变量之间相关联的关系y x。一旦估计得出，新的数据对x*, y* 的因变量y* 将被预测为y = f(x*)。如果这个学习问题是在概率框架下进行的，那么预测就可以简化为对条件期望值的计算。事实上，如果xi, yi 是从给定的联合概率密度函数px, y中提取出的、独立且相同分布的随机样本，那么由y = f(x) = E[y*|x*]将均方误差E[(y-y*)2|x*)]最小化。然而，在负荷预测问题中，数据对(xi,yi)可能并不认为是从全年的一个特定分布中获取的，因为每年的电力消耗都有一个明显的趋势。因此，采用统计学习方案需要进行初步的减损以及其他必要的规范化，以从数据中删除时变模式。在此，我们探索另外一种方法：不是引入可靠的统计假设，或通过或多或少的复杂规范化来强制实施。在独立向量x的基础上，我们直接探讨了目标变量y的可预测性。学习这种关系的通常方法是考虑各种模型，例如参数模型或具有不同复杂性的神经网络。在考虑复杂模型之前，对简单回归模型的性能进行研究是一种不错的实践方法。第一步即是本文的目标。不言而喻，一旦建立了学习集，对更复杂的非线性预测因子的评估将是值得进一步探索的。

预报器的实际实施需要经过四个步骤：

解释变量的选择。 在所有可能的解释变量中，选择将形成回归向量x的变量子集。由于模型随后可能出现过参数化，因此包含太多的变量（取自之前负载的时间序列）并不是一个可行的解决方案。
学习集的构造。 请注意，由于工作日可能对电力消耗产生影响（例如，星期日与星期一的情况明显不同），这点必须特别注意。
变量转换。 使用适当的坐标变换可以大大提高（可能是一个很简单）学习方案的有效性（在此，将成功应用对数变换）。
回归模型的估计。 一旦定义了回归向量，即将回归算式应用到在学习集中收集到的历史数据。

下面，我们将对这四点分别进行讨论。关于对移动假期进行实际处理的一些进一步实施细节，参见第III.F分节。

解释变量的选择

关键是选择最小的历史数据集，该数据集能够捕获能够干扰、影响负载的所有相关信息。考虑两个时间尺度：每日和每周。获取这两个尺度信息的最简单方法是，将x作为二维向量，其条目为：

在前几年里，这项工作一直重复进行，直到获得23个实例，这些实例是在1990年至2012年期间获得的。注意，在学习集的构建过程中，我们需要将假期剔除，如11月1日。

在形式上，“相似日”是函数 sim_day(past_year, current_year, day) 的输出，其中 day  [1, 366]. 例如，在我们的例子中，

- x₁: 24小时前的负载
- x₂: 一周前的负载

例如，如果要预测2013年11月4日（星期一）11:45的负载y*，则这两个条目将是：

- x ^*: 2013年11月3日11:45的负荷

- x ^* 2013年10月28日（星期一）11:45的负荷

关键思想是，一旦二维向量x可用，其余历史数据的信息量就会很弱，其不需要包含在预测器。

学习集的构建

为了解释学习集的构建过程，再次考虑2013年11月4日11:45的负荷预测问题。正如我们已经得到的，这个对数-负荷是未知的目标变量y*，其需根据解释向量x*=[x1 x2 ]进行预测。

现在我们需要一个学习集，这是一组例子（xi, yi），i = 1, hellip;, n，可以用来学习x* 和y*之间的关系。

1 2

在我们的例子中，学习集如表1所示。

i	yi	xi1	xi2
1	11:45 2012/Nov/05 Monday	11:45 2012/11/04 Sunday	11:45 2012/Oct/29 Monday
2	11:45 2011/Nov/07 Monday	11:45 2011/Nov/06 Sunday	11:45 2011/Oct/31 Monday

14	11:45 1999/Nov/08 Monday	11:45 1999/Nov/07 Sunday	11:45 1999/Nov/15 Monday

23	11:45 1990/Nov/07 Monday	11:45 1990/Nov/06 Sunday	11:45 1990/Oct/31 Monday

表 I.

  sim_day    

其中2013年第308天为11月4日（星期一），1999年第312天为11月8日（星期一）。

如果出现假期，如复活节和其他法定假日，需要相同及特殊的转换，如第III.E小节所述。

变量转换

众所周知，坐标的初步变换可以提高预测性能。例如，如果从联合正态分布中抽取学习数据，则最佳预测因子是独立变量的线性函数。因此，在对数正态分布数据存在的情况下，对数-变换数据是一种常用的方法，可以为变换后的数据设计一个最

剩余内容已隐藏，支付完成后下载完整资料

资料编号：[20537]，资料为PDF文档或Word文档，PDF文档可免费转换为Word

原文和译文剩余内容已隐藏，您需要先支付 30元 才能查看原文和译文全部内容！立即支付

免费ai写开题、写任务书：免费Ai开题 | 免费Ai任务书 | 免费降AI率 | 免费降重复率 | 论文免费排版

注册

找回密码

短期负荷预测：一种幂回归方法外文翻译资料

M. Pozzi

E. Soda

M. Stori

您可能感兴趣的文章

登录

注册

找回密码

M. Pozzi

E. Soda

M. Stori

您可能感兴趣的文章