关于高维空间符号协方差矩阵的特征值外文翻译资料

 2023-03-14 06:03

本科毕业设计(论文)

外文翻译

关于高维空间符号协方差矩阵的特征值

作者:李伟明,王勤文,姚剑锋,王舟

国籍:中国

出处: ResearchGate

中文译文:

摘要:本文研究高维样本空间符号协方差矩阵的极限谱性质。数据具有足够的普遍性,可以包括流行的独立分量模型和椭圆分布族。本文的第一个结果表明高维样本空间符号协方差矩阵的经验谱分布收敛于广义分布。其次,建立了一类线性谱统计量的中心极限定理。

关键词:中心极限定理,特征值分布,线性谱统计,空间符号协方差矩阵.

  1. 导言

所谓的空间符号协方差矩阵起源于稳健统计领域。是一个独立的同分布序列来自共同总体的观测结果

(1.1)

其中是一个已知的位置向量,是一个确定性正定矩阵,和是两个(可能相关的)随机量。这种结构包括流行的独立分量模型(,当随机变量减少到某些固定常数时)和椭圆分布族(当随机向量被限制为标准正规时)作为特例(详细讨论见注2.1和2.2)。本文中由示例(称为)形成的样本定义为

, (1.2)

其中,是将向量投影到中单位球面上的空间符号变换。在[20],以及[28]的著作中,作者证明能够减轻极端离群值对稳健主成分分析的影响。这之后被广泛应用于统计推断,特别是当样本数据像表现出强烈的尾部依赖时,就像椭圆分布一样。有关的最新工作包括:的性质及其应用包括和[22],和[11],和[19],和[12],,和[13],和[9]。虽然很受欢迎,但是它的特征值的渐近行为在高维状态下并没有得到充分的发展,这是本文研究主题的起始点。

本文研究了具有一般数据结构(1.1)的样本在渐近状态[25]下的一阶和二阶谱极限,其中种群的维数随着样本数目的增大而发散到无穷大,即

这种渐近机制在随机矩阵理论中被普遍采用。本文的第一个结果是样品的经验谱分布的一个新的广义的定律。定律最初是在[25]中对高维样本协方差矩阵的极限谱引入的,然后在文[30]、[26]和[6]等工作中对其进行了改进和推广。在此基础上,通过与其相关的比较,得到了在一定矩条件下的结果。本文的第二个研究是的一般线性谱统计量的一个新的中心极限定理。近几年来,随机矩阵的一直是研究的热点。这方面的大部分早期工作都涉及(对称)矩阵,文[17]给出了给定高斯型随机矩阵特征值的联合密度的的。利用矩量法,[27]导出了型矩阵多项式函数的,[1]得到了一类带随机矩阵的。文[5]首次通过变换导出了广义矩阵的,给出了极限高斯分布的均值函数和协方差函数的显示公式。文[21]提出了矩阵和矩阵的高斯插值方法。对于,对它的研究可以追溯到[18]矩阵。开创性论文[3]在框架下建立了,并在[24]和[31]中进行了扩展,在[16]和[15]中为椭圆分布提出了关于的的其他扩展。

从技术角度看,样品的结构与一般研究的有很大的不同。虽然可以通过将原始数据的空间符号变换作为新的数据样本来考虑为类型,但空间符号变换通过欧式范数在分母中的归一化引入了的坐标之间的复杂非线性相关性。这种新的关联使得分析在高维上更加复杂。具体来说,让我们比较一下这个情形,即样本协方差矩阵(让(1.1)中的随机变量是某种常数)。样本向量的坐标之间的相关性只有一个,来自形状矩阵。但是,对于样本时,的坐标之间的相关性既可由分母中的形状矩阵和归一化因子产生。因此,我们分析的一个主要任务是在中找到将这两个相关源解耦的新方法。为此我们给出对某一阶的渐近展开式,给出了关于某些二次型的协方差和随机阶的新引理,这是建立新的线性矩阵的基石之一(见节)。与文[3]中的经典方法相比,本文的另一个技术创新之处在于我们引入了一种新的、更直观的方法来求的极限平均函数,参见第3.2节中给出的证明中的步骤3。

论文的其余部分组织如下。第二节给出了我们的主要理论成果,包括的收敛性和的线性谱统计量的收敛性。这些渐近结论的证明见第3.1节和第3.2节。一些支持引理及其证明被归入附录。

  1. 样本特征值的高维理论

2.1.初期

设是具有特征值的对称矩阵或矩阵,其在定义上是概率测度

其中表示处的狄拉克质量,当时,如果序列有一个极限,这个极限称为极限谱分布。对于概率测度,它的变换定义为

其中。这一定义可以推广到整个复平面,但从变换到相应的概率测度的反演公式的支持集可以在[4]中找到。

2.2.模型假设

我们考虑一个序列,观察允许下列随机表示

, (2.1)

其中

(ⅰ)假定位置向量已知;

(ⅱ)标量随机变量是满足

(ⅲ)矩阵称为种群的形状矩阵或散度矩阵,它是确定性的、正定的,归一化为,用于三乘积中的辨识,因为我们总是可以将任何与有关的标量因子移动到标量随机变量中;

(ⅳ)向量是的一个数组,标准化随机变量和可能依赖于标量随机变量。

我们的主要假设如下。

假设(a)样本大小和总体维数都趋向于无穷大,使得和。

假设(b)形状矩阵的具有有界支持,即对某些的,并且弱收敛到概率分布作为。

假设(c)随机变量为满足

对来说。

假设(a)和(b)在中是标准的,而假设(c)比【3】中研究的样本协方差矩阵的矩限制略高。本文在(1.2)中对的分母中的归一化因子的涨落施加了较强的矩条件。

注2.1. 在有关高维的文献中,通常会考虑下列【3,24,31,29】

(2.2)

当和与模型(2.1)相同时,是一个正定种群协方差矩阵。显然模型(2.2)是模型(2.1)的一个特殊情况,其中退化为常数参数。

注2.2 模型(2.1)还包括椭圆分布族。实际上,广义椭圆分布的样本具有以下形式

(2.3)

其中是标量随机变量,是中单位球面上均匀分布的随机向量。设,和在(2.3)中,我们有

.

当然,对于这类标准高斯随机向量,假设(c)中的矩条件满足。因此,(2.3)所描述的广义椭圆分布也是我们模型(2.1)的特例。

2.3. 的极限谱分布

我们的第一个结果是关于(1.2)中定义的样本的的收敛性。

定理2.1.1. 假定假设(a)-(c)成立。然后几乎可以肯定的是,经验谱分布弱收敛于一个概率分布,其变换是方程的唯一解

(2.4)

在集合中。

定理2.1证明了收敛于通过方程(2.4)定义的广义定律,参见[25]。设是的伴随分布,是的变换。然后(2.4)可以重写为

(2.5)

见[26]。关于从(2.4)或(2.5)处求的密度函数及其支承的程序,参见文[4]。在第3.1节给出了这个定理的证明。

2.4. 用于线性谱统计量的方法

在这一小节中,我们研究了的波动。在给定可测函数的情况下,定义了与相关的的为统计量

(2.6)

为了集中这个统计量,我们引入了一个与形状矩阵密切相关的矩阵,

, (2.7)

其中表示两个矩阵的积(关于矩阵的更详细讨论参见注2.3)。设表示和的是的有限视界代用在(2.5)中的有限对应,也就是(2.5)中的解来代替的两个极限

, (2.8)

这样的唯一的定义了一个概率分布,由表示,通过

, (2.9)

通过这个分布,(2.6)中的可以集中在

, (2.10)

此外,我们假定存在以下三个辅助量的极限,即

(2.11)

其中和是中的两个复变量。当第四时刻时,这样的限制将有助于的。

定理2.2. 假定假设(a)-(c)的,设是包含区间的开集上解析的函数

同时使

是关于的个归一化的向量。然后在分布上收敛到维高斯随机向量具有均值函数

其中

以及协方差函数

其中

其中。等高线和是不重叠、封闭的,逆时针方向在复平面上,并包围区间.

在第3.2节给出了这个定理的证明。

注2.3. 定义在(2.7)中的矩阵实际上是种群的一个近似。在定理2.2中假定的条件即的情况下,我们可证明从谱范数的角度见引理。这就是我们可以通过依赖于矩阵的谱的(见(2.10))来集中的的原因。注意,在我们(2.1)中的一般模型设置下,矩阵的谱不仅依赖于形状矩阵的特征值,且取决于它的特征向量。然而,对于注2.2中讨论的和第四矩的椭圆分布,矩阵的谱仅取决于的特征值。事实上,、和[10]已证明,对于这些椭圆分布,形状矩阵与总体具有相同的特征向量,它们的特征值具有一对一的对应关系,可以通过一定的积分来表示。我们的近似,即(2.7)和引理中给出的近似是显式的,并不仅限于椭圆分布。

注2.4. 当形状矩阵相同时,即,我们从(2.7)注意到。定义在(2.11)的和这三个辅助量等于它们的极限。经过一些位的计算,我们得到了定理2.2中涉及因子等于零的所有量,这就给出了它实际上独立于基础形状矩阵为恒等式的第四时刻这一事实。

注2.5. 定理2.2包含高维相关矩阵的[14]。要了解这一点,最简单的情况是(2.1)和,那么所研究的样本可以写成

将其伴生矩阵表示为

, (2.12)

它与具有相同的非零特征值。因此,定理2.2的结果给出了的的。将数据矩阵表示为,其中是的第列(观测值),是的第行(第坐标)。此外,表包括跨的行和列的独立且相同分布的条目,这样排列中的条目不会改变其分布。另一方面,与数据集相关联的相关矩阵可表示为

, (2.13)

它具有与(2.12)中的相同的结构(不超过一个常数因子),通过交换和的作用来实现。因此在的情况下,的的是由定理2.2对矩阵的应用导出的。

2.5. 例子

我们展示了一个广泛使用的的作为一个例子,它是特征值的第二矩,表示为

我们考虑种群形状矩阵是对角的情况。因此(2.7)中给出的矩阵可简化为

(2.14)

它的光谱就只取决于的特征值。设,那么根据(2.14)。此外,(2.11)中的三个辅助量也有限制。

它们也是的特征值的函数。

根据(2.8)和(2.9)的关系,统计量的中心项是

.

利用留数定理可以求出的极限均值和方差。为了举例说明,我们计算了中的第一个项对应的积分,即

(2.15)

在(2.8)的两边取关于的导数,得

接下来

类似的程序可以重复以找到剩余的轮廓积分值。因此通过定理2.2,的分布收敛于高斯分布,其中均值和方差参数由

  1. 主要结果的证明

本节给出了定理2.1和定理2.2的证明。在所有的证明中,假设位置向量,否则可以从样本中直

剩余内容已隐藏,支付完成后下载完整资料


英语原文共 29 页,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[596338],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。