湖北省城镇化影响因素的统计分析外文翻译资料

 2022-09-14 04:09

英语原文共 312 页,剩余内容已隐藏,支付完成后下载完整资料


2单向误差模型

2.1 简介

面板数据回归与一般的时间序列回归或者截面回归在有一点处有差别。它的变量是双下标。例如,

(2.1)

表示家庭,个体,公司,国家等;代表时间。因此,的下标代表截面范围代表而代表时间序列范围。是一个标量,是的而且是解释变量的第个观测值。大多数面板数据的应用程序通过公式(2.2)来运用单向误差模型从而判断误差

(2.2)

在此,表示不可见的细化效果,表示其余的干扰项。例如,在一个劳动经济学中的收入公式中,将衡量家庭的主要收入, 而可能包括一系列变量,比如经验,受教育水平, 工会会员,性别,种族等。标记为不变时的,并且其组成回归中不包含的任何细化效果。在这种情况下,我们可以把它当作是独立个体不可见的能力。其余干扰项随着个体和时间而变化,并且可以被认为是回归中的常见的干扰项。或者,对一个利用基于公司的时间截面数据的生产函数,将会计算产出,将会计算出投入。不可见的公司效应将会由而表现,并且我们可以把他们当作该企业决策者不可见的企业家能力或者管理层能力。经济中误差分量的早期应用包括投资决策中的Kuh (1959),生产函数中的Mundlak (1961)和 Hoch (1962) 和自然气需求中的Balestra 和Nerlove (1966) 。(2.1)式的矢量形式如下:

(2.3)

此处是, 是,,, 是维的一个矢量。此外,(2.2)也可以被写做:

(2.4)

此处的观测值堆积,并且相对较慢的指标根据个体堆积,相对较快的指标根据时间堆积。此处,指维度为的密度方阵, 是维度其中的一个矢量 ,代表克罗内克积。是由0和1组成的选择方阵,或者是包含在回归方程中用来估计是否假设为固定参数的个体方阵。和 。注意方程,此处是维度为的一个方阵,并且, 上的投影矩阵,减少到,此处。是平均各个体时间观测值的一个矩阵,而是包含个体的偏差的一个矩阵。例如,当基于模拟矩阵来回归时,变量得到含有典型元素的预测价值,其中每个个体重复次。这个回归方程的残差由含有特殊元素的给出。和是 (i)对称的幂等阵,即,。它说明而且它使用了幂等阵的秩等于其迹这一结论。(见Graybill,1961,theorem 1.63) 此外,(ii)和是正交的,即而且(iii)它们相加等于单位矩阵。事实上,这些性质任两个可以推出第三个(见 Graybill, 1961,theorem 1.68)。

2.2 固定效应模型

在这种情况下,被假设为固定参数来估计,含的随机干扰项与和独立同分布。假设与独立。如果我们在研究特别的个公司的序列,比如说是IBM,GE,Westinghous等,而且我们的推断限制在这些公司的行为中,那么固定效应模型将是一个合适的选择。或者,它可以是一个的经合组织国家的序列,或者是个美国州名。这种情况下的推断是基于个公司,国家或者州的观测值。我们可以用(2.3)式来替代(2.4)中所给的干扰项从而得到

(2.5)

然后在(2.5)式中使用普通最小二乘法(OLS)从而得到, 和的估计值。 既然是 的,而且个体虚拟矩阵,是的。 如果很大,(2.5) 将包含太多个体虚拟信息,而由OLS转变的矩阵会很大,而且维度为。事实上,因此和是利息的参数,其中一个可以包含由(2.5)式中通过将模型左乘并且在所得模型上使用OLS而估计得来的LSDV(最小二乘虚拟变量):

(2.6)

此处运用这个结论,因为。也就是说,矩阵消除了个体效应。这是对于第个回归值,基于含有典型元素的的含有元素的回归方程, 。它与一个矩阵的转置相关而不是(2.5)式中的矩阵。其对应的OLS估计值为:

(2.7)

而且 。可以在(2.5)式中使用Davidson和MacKinnon (1993, p. 19)讨论的分块矩阵结论或者弗里希沃洛弗尔定理。此处运用了是基于的投影矩阵和这一结论(见问题 2.1)。此外,(2.6)式中的广义最小平方法(GLS) ,使用了广义逆,也将生成(见问题2.2)。

注意在这个简单回归模型

(2.8)

并且平均时间得到

(2.9)

因此,由(2.8)式减去(2.9)式可得,

(2.10)

然后,平均所有(2.8)式中的观测值可得

(2.11)

此处我们利用的限制。这是对于虚拟变量的强制性要求,目的在于避免虚拟变量产生多重共线情况;观察(2.8)式中的合适值,除非限制类似于这个限制的可选公式化(1984),事实上,在这个情形下只有和是可估的,不要将和分开, 由回归方程(2.11)得到,可以从(2.11)式中重新获得。而且通过(2.9)式可得。对于大量的劳动力或者消费者面板数据,此处是一个很大的值,类似于(2.5)式的回归方程可能是不可行的,因为其中有一个在回归方程中包含了个虚拟变量。这个固定效应(FE)最小二乘法,也被认为是最小二乘虚拟变量(LSDV),承受着自由度的大量损失。我们估计了个额外参数,而且过量的虚拟变量将会加大回归方程中的多重共线性问题。 此外,这个固定效应估计值不可以估计任何不变时变量的效应,例如性别,种族,信仰,学校或者工会参与。这些不变时变量在矩阵变形时被消除,以及方式变形是产生的偏差(见(2.10))。或者,你可以看见这些不变时变量根据(2.5)式中的个体虚拟值而旋转,从而任何回归方程中的尝试的方法(2.5)将会失败,这意味着完全多重共线性的发生。如果(2.5)式是正确的模型,只要是标准均值为0,协方差矩阵为的经典干扰项,LSD是最好的线性无偏差估计值(BLUE)。 注意当, 固定效应估计值是一致的。然而,如果是固定值且作为短期劳动面板数据的典型情况下, 然后只有的固定效应估计值是一致的;个体效应的固定效应估计值不是一致的,因为这些参数随着的增加而增加。这是Neyman和Scott (1948)所提出的偶发参数问题,而现在Lancaster (2000)提到的更为频繁。注意当(2.5)式中的真实模型是固定效应时,基于公式(2.1)的OLS将产生偏差值,回归方程参数的不一致估计值。这是由于OLS在相关情况下删除个体虚拟值而产生的遗漏变量偏差。

(1)固定效应测试。 我们可以检验这些虚拟值的联合显著性,比如, 通过进行检验。 (个体效应检验将在第四章展开说明)。这是一个简单的具有在面板模型中使用OLS方法获得限制残差之和的平方(RRSS)和在LSDV回归模型中的无限制残差之和的平方(URSS)的Chow 检验。如果很大,我们可以在转换中进行,并且可以将残差和的平当做URSS。在这种情形下,

(2.12)

(2) 计算警告。谨慎计算回归模型(2.10)式中所给的式子使。这个回归方程中作为从一个特殊回归包中得来的通过分配残差和平方,因为截距和虚拟变量不被包括在其中。合适的,例如说从(2.5)式中的LSDV回归式中得来的,将通过被分成相同的残差和平方。因此,我们必须通过乘以协方差矩阵)或者简单地乘以

从而对回归方程(2.10)式中的方差进行调整。

(3)标准误差的稳健估计。对于内估计,Arellano (1987)建议用一个简单的方法,通过White (1980)提及的基于的广义协方差矩阵来获得标准误差的稳健估计。我们可以堆积面板数据作为每个个体的等式:

(2.13)

此处是 的,, 是的,是一个标量,,是维度为的矢量,而且是的。一般来说,,其中, 此处是一个维度为的正定矩阵。我们仍然假设 其中。被假设为很小,而作为家庭或者公司面板中很大,而且在且固定的情况下得到其渐进结果。在这一系列公式(2.13)中进行内转换,我们可以得到

(2.14)

此处,而且,,。在这个系统中所产生的稳健最小平方值,如 White (1980)所描述的,在限制以下。所有的公式得到相同的,我们得到 的内估计值拥有以下渐近分布:

(2.15)

此处 , 。注意而且 (见 题 2.3)。在这种情况下,通过来进行估计,此处。 因此,的稳健渐进协方差矩阵由下式来估计:

(2.16)

2.3 随机效应模型

在固定效应模型中有太多的参数,而且如果被假设为随机的,那么将可以避免自由度的损失。在这种情况下,,并且 与是相互独立的。此外,与和相互独立。如果我们从一个大量的人口中随机的取出个个体,那么随机效应模型将会是一个合适的选择。这种方法经常在家庭面板数据学习中使用。我们应该注意如何设计面板数据来让我们想进行推断的人口具有“代表性”。在这种情形下,一般很大,而且固定效应模型将会导致大量的自由度丢失。将个体效应看作是随机的,然后基于关于人口的随机抽取的样本中进行推断。

但是在这个情形下什么是人口呢?Nerlove和Balestra (1996) 强调了Haavelmo(1944)的观点,他们认为人口是指“那些不是由无穷多个个人组成的,一般来讲而是由无穷多个决策组成的”,而每个个体都可能做出这些决策。 这个观点与随机效应的特性相一致。从(2.4)式中,我们可以计算出协方差矩阵

(2.17)

这意味着对于所有的和,一个同质方差满足这个公式,而且一个展示了时间序列相关性的等相关对角协方差矩阵只存在于相同个体的扰乱项之间。事实上,

而且0除外。这同样意味着和之间的相关系数为

而且0除外。 为了得到回归系数的GLS估计值,我们需要,这是典型面板数据的巨型矩阵,而且它的维度为。 即使研究者的实例中的和值很小,也不能尝试总体倒装。我们将根据Wansbeek和 Kapteyn (1982b, 1983)进行一个简单的设计方法,这个方法允许和的倒装。本质上来说,用来代替,用来代替 。此处由来定义。在这种情形下

收集具有相同矩阵的式子,我们可以得到

(2.18)

此处。 (2.18)式是频谱分解代表,其中是的第一个且唯一一个重特征根,而是第二个且唯一一个重特征根。 此处易证,运用 和 的性质 ,即

(2.19)

(2.20)

事实上,,此处为任意标量。现在我们可以将GLS作为一个加权最小平方。Fuller 和Battese (1973, 1974) 建议通过左乘(2.3)式中给出的回归公式然后在转置回归模型的结果上进行OLS计算。在这种情况下,中含有特别元素。 此处 (见题 2.4)。这个转置回归模型倒装了矩阵的维度并且可以在任何回归包中使用。方差分量的最优二次无偏 (BQU)估计值 自然而然地根据的谱分解增大。事实上,, 而且

(2.21)

(2.22)

分别提供和的最优二次无偏估计值 (见题2.5).

这是变异类型的方差分量的估计值的分析,而且在正常干扰下它是最小无偏方差的。(见Graybill, 1961) 真实干扰项是未知的,因此 (2.21) 和(2.22)是不可行的。 Wallace 和Hussain (1969) 建议用 OLS的残差项代替真实的值。毕竟,在随机效应模型中,OLS估计值是无偏且一致的,但是不再具有有效性。Amemiya (1971)表示这些方差分量的估计值与真实干扰项已知情况下拥有不同的渐近分布。他建议用LSDV残差项来代替OLS残差项。在这个情况下此处,是一个的所有平均值的一个矢量。取代(2.21)式和(2.22)式中的那些,我们可以得方差分量的Amemiya类型估计值。 方差分量估计所得结果同已知的真实干扰具有相同的渐近分布:

(2.23)

此处。

Swamy和Arora (1972)建议用两个回归方程从这些回归方程中相对应的均值平方误差中得到方差分量的估计值。第一个回归方程是组内回归,在(2.10)式中给出,它得到了以下: (2.24)

第二个回归方程为组间回归,它计算了平均时间回归,例如

(2.25)

通过用(2.5)式中的模型左乘,然后计算OLS可等于以上式子。唯一需要注意的是第二个回归方程有个观测值,因为它的每个个体重复了平均次,而(2.25)式中截面回归式基于个观测值。为了纠正这个模型,我们可以进行截面回归

(2.26)

此处,我们易得。 这个回归方程可以由下式得到

(2.27)

注意堆积下列两个转型回归方程我们便可得到

(2.28)

而且这个转型误差

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[145974],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。