基于EEMD-ICA方法的金融时间序列因子分析外文翻译资料

 2022-08-22 11:08

英语原文共 5 页,剩余内容已隐藏,支付完成后下载完整资料


基于EEMD-ICA方法的金融时间序列因子分析

简要

金融时间序列分析最重要的目标之一是资源提取和降维。它们可以帮助提取特征,并探索具有复杂特征的高维数据中的潜在因素。近年来,对其潜在特征的认识一直是研究者和实践者关注的焦点。关于金融时间序列中挖掘潜力因素的研究已有很多。这些方法大多可以分为两类:基本分析方法和计量经济学和统计学方法。基础分析方法主要基于因果关系理论。他们调查影响金融市场的各种因素,分析金融市场变量的行为特征,探索其内在规律,预测其未来的变化趋势。计量经济学和统计学方法包括许多线性和非线性模型,如自回归移动平均模型(ARMA)、自回归条件异方差型模型(ARCH)、人工神经网络、支持向量回归等。

金融时间序列往往表现出高频、非线性、非平稳和长记忆等特性。因此的用传统方法对其进行分析预测这是困难的。近年来,集成经验模态分解(EEMD)和独立分量分析(ICA)被发展来处理非线性和非平稳时间序列。它们在财务时间序列分析中得到了广泛的应用,并取得了积极的绩效提升[1,13,14,18,23,29,34]。为了进一步分析,介绍了一种将EMD和ICA相结合的新技术(称为EMD-ICA)和改进的EEMD-ICA[6,15,16,24]。

在本文中,我们将EEMD-ICA模型应用于单个金融时间序列分析,以识别潜在的因素。该方法首先将原始时间序列分解为统计独立分量,然后研究各分量的变化趋势。通常,对于每个分量,我们都能找到导致其振荡的主导经济因素。这些经济因素对原始时间序列的重构非常重要。(本文的组织结构如下:第2节简要介绍EEMD和ICA。同时,详细介绍了基于EEMD-ICA的分析方法。为了说明和验证,在第3节中对原油价格进行了分析和建模。)

2.方法

2.1 整体经验模态分解

经验模态分解(EMD)是Huang 等人针对非线性、非平稳时间序列提出的一种新的自适应数据处理方法。与小波分析等其他数据分析方法不同,EMD中的分解过程不基于任何先验基函数。它将一个复杂的时间序列分解为几个更简单的数据组件,通常称为固有模式函数(IMFs)和剩余序列。利用筛选过程提取IMFs和残差序列。依次从原始数据序列的残差和提取的IMF中提取频率最高的IMF,然后提取频率次之的IMF。迭代过程不断重复,直到条件终止,无法提取新的IMF。如果我们表示,,...,合成的一组货币基金和残余系列,原始时间序列的分解EMD方法可以表示如下:

(1)

EMD一经提出,就得到了广泛的应用,并得到了许多研究者的重视[29,38]。但是EMD有一个固有的缺点,那就是模态混合的频繁出现。它被定义为一个单一的货币基金组织,由广泛不同比额表的信号或驻留在不同货币基金组织组成部分的一个类似比额表的信号组成。为了解决这个问题,Wu和Huang(2008)提出了集成经验模态分解(Ensemble empirical mode decomposition, EEMD)。EEMD假设观测数据是实时序列和噪声的组合。通过在实时序列中加入不同的噪声,得到的总体均值更接近于实时序列。基于这一思想,EEMD的主要改进是在原有EMD方法的基础上增加了预处理过程。首先将原时间序列加入白噪声序列中,得到新的时间序列;然后利用EMD对新序列进行分解,得到一系列的imf和残差。再次重复这两个过程,将新的白噪声时间序列加入到原来的时间序列中,然后进行EMD分解。最后,对同一时间尺度的分解后的IMF进行平均,以IMF的平均值作为最终的IMF,以残差的平均值作为最终残差。

EEMD可以显著缓解模式混合问题。增加的白噪声对结果的影响可以通过统计规则来控制,如 (2) 其中N是乐团成员的数量,ɛ添加噪声的振幅。ɛn误差标准差。在文献中,合奏团成员的数量通常设置为100人。标准偏差通常设置为0.1或0.2。

2.2独立分量分析

独立分量分析(ICA)是一种不需要事先了解混合机制就可以识别隐藏在多变量观测数据下的隐藏因素的新技术。它可以看作是主成分分析(PCA)和因子分析的扩展。假设随机变量的大小,,,所产生的线性混合的未知因素表示如果大小,我们可以获得 (3)

,是假定的静态混合矩阵,的第列列和大小。ICA模型旨在估计都使用,和,与简化的假设和约束。事实上,总是有两个假设,一个是未知分量在统计上是独立的,另一个是独立分量(ICs)中最多只有一个高斯分布。现有的例如Infomax、FastICA、FJADE和CICA等算法可用于ICA的建模。其中,采用FastICA算法估计去混合矩阵和。

2.3 EEMD-ICA模型

Mijović等。[6]提出了单通道信号处理最初EMD-ICA模型。近年来,该模型在新的EMD-ICA模型中进行了两个方面的改进:(1)EEMD代替原有的EMD模型,对财务时间序列进行分解,以获得更好的业绩;(2)为了减小不重要IMFs的影响,加入了重组程序。

改进的EEMD-ICA方法一般包括以下四个步骤:

  1. 金融时间序列,分解为,IFMs,和剩余系列。
  2. 利用变异性相对汉明距离(RHD)求出第k项 IMF和残差序列的贡献系数:

(4)

例如当时,,否则;。

  1. 比较所有的贡献系数和硬阈值,这是一个固定的小值(如0.2或0.3)。所有贡献系数较小的模型合并成一个新的数据序列。保留和合并数据系列形成一个新的数据集,称为VIMFs,和。
  2. 将ICA应用于VIMFs,得到统计上独立的成份和。通过线性变换,我们可以将金融时间序列重构为估计的ICs为

(5)

其中为混合矩阵第k列的和,称为第k个IC的变换系数。

2.4 基于EEMD-ICA的分析方法

EEMD-ICA模型为探索和模拟单一金融时间序列的潜在因素提供了一种新的方法。在我们确定了单个感兴趣的财务数据之后,探索其潜在因素的整体过程如下:

2.4.1 确定研究的时间段

第一步是确定要分析的单个财务时间序列的周期。特别是对于复杂的金融时间序列,在不同的[21]时间段有许多不同的驱动因素。首先确定兴趣期有助于更准确地发掘潜在因素。我们可以使用一些特殊的方法来确定具有一定特征的周期,如结构断点测试[4]、事件研究方法[25]等。

2.4.2 基本面分析

基础分析法是一种基于经济供求理论和经验分析的方法。它克服了纯数据驱动分析方法缺乏经济意义的问题。因此,通过考察单一金融时间序列的结构特征,可以初步分析可能的波动驱动因素。

图1所示 1986年1月- 2015年12月EEMD-ICA原油价格ICs。

bi

的意思是

偏态

峰度

相关系数

赫斯特指数

jb检验统计量

C1

12.72

0.40

minus;0.20

5.56

0.42 (0.00)

0.79

100.6 (0.00)

C2

14.26

4.08

minus;0.01

3.88

0.47 (0.00)

0.95

11.7 (0.01)

C3

13.53

0.28

minus;0.91

11.88

0.44 (0.00)

0.65

1232.3 (0.00)

C4

5.52

2.40

minus;0.47

1.74

0.51 (0.00)

0.99

37.2 (0.00)

C5

11.95

1.10

minus;1.51

5.30

0.39 (0.00)

0.98

217.1 (0.00)

表1 ICs估计值的描述性统计(括号内为p值;bis是第i个IC的变换系数)

2.4.3 EEMD-ICA进行数据分解

在确定周期和数据分析之后,我们使用EEMD和ICA将单个金融时间序列的利息分解为几个统计上独立的成分。

2.4.4 比较与经济分析

我们假设每个IC在经济学上都有一个具体的含义。在这一步中,我们将每个IC与第二步中提到的经济变量进行比较,并识别潜在的匹配和对应。比较的方法主要有两种,一种是趋势对比,另一种是观察主点的显著变化。

在ICA模型中,由于S和A都是未知的,我们无法确定ICs[2]的方差,因此将矩阵A调整为每个IC 1的方差。因此,我们的比较是基于每个IC的变化趋势,而不是其振幅。

2.4.5 验证

在这一步中,我们分析了经济因素与提取出的独立成分之间的相关性,以检验和验证每个独立成分的经济含义。

3.实证分析:探讨原油价格的潜在影响因素

在本节中,我们将通过对原油价格的分析来说明和验证基于EEMD-ICA的分析方法。我们使用来自美国能源情报署(EIA)的西德克萨斯中质油(WTI)原油现货价格月度数据。我们的分析是以美元每桶报价的。

3.1 确定研究的时间段

我们研究的时间段是1986年1月到2015年12月。我们选择时间段是基于以下原因。一方面,近30年来石油价格变化更加剧烈。另一方面,该数据集的长时间范围为提取和建模提供了更多的信息。如果我们对某一时间段的原油价格特征感兴趣,我们也可以选择其他更短的时间段。

3.2 基本面分析

不同的金融时间序列总是考虑不同的背景和不同的驱动因素。石油具有许多不同的属性,如资源属性、商品属性、金融属性、政治属性等。这些不同的属性使得油价波动更加复杂。通过文献研究了原油价格与不同属性驱动因素之间的关系。油价背后的主要因素包括:供求关系、世界经济发展、股票市场、黄金市场、美元、投机、地缘政治环境等。

3.3 通过EEMD-ICA分解数据

采用EEMD-ICA对WTI原油现货价格进行分解,共360个数据点。在我们的分析中,集合成员的数量设置为100,白噪声序列的标准差设置为0.2,硬阈值设置为0.3。将原油价格分解为5个ic。图1显示了可视化结果。

2000年

0

-1000年

-2000年

-3000年

-4000年

-5000年

-6000年

1986

1990

1995

2005

2010

2015

图2所示 1986年至2015年的原油产量减去消费量。

拦截

系数

R2

调整R2

F-stat

IC1美元

3.77

lowast;lowast;lowast;

0.11lowast;lowast;lowast;

/minus;0.04

lowast;lowast;lowast;

0.29

0.29

72.5lowast;lowast;lowast;

IC2关于供应和需求

2.21

3.8 e-04/3.25e-04/2.38e-03lowast;lowast; lowast; lowast;

0.53

0.48

9.43lowast;lowast;lowast;

关于地缘政治和投机

minus;0.98lowast;lowast;

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[409427],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。