英语原文共 256 页,剩余内容已隐藏,支付完成后下载完整资料
4.1 用S拟合线性模型(1或者1列)
如图1,混合效应模型为分析平衡与不平衡的分组数据提供了有效工具,这些模型在过去十年里很受欢迎,一部分原因是软件的发展使数据拟合分析更加方便。S线性与非线性混合效应(nlme)是软件应用的一个例子。在这一章我们描述1me函数建立线性混合效应模型。
第一部分回顾用S建立标准线性模型,来介绍用S模型的一般形式,函数,阶数和理论,用来非线性混合效应模型。1mlist函数,用来获得单独的1m,依据一个小组变量水平,通过例子举例描述。
接下来的部分用S描述线性混合效应模型,用1me进行描述包括理论,用单组、多组数据举例说明。
模型拟合数据后,检验潜在假设是否违背很重要,4.3节用图解理论和和数字总结评价一个线性混合模型假设的有效性。
这里一个由内而外“inside-out”模型建立方法被采用,开始用组中的个体拟合,用个体系数图决定随机效应的结构,最后拟合一个全部数据的混合效应模型。我们对例子做了广泛的应用来介绍可用函数和方法。
这一章,我们研究组内误差相互独立并且拥有相同的方差的模型情况。
4.1 用S拟合1m与1mlist线性模型
S两个主要模型函数分别是线性回归模型1m和方差分析模型aov,这两个有相似的语法,形成相似的拟合目标。我们在这里研究1m。一个典型1m命令形式
lm(formula, data),
其中,formula表示拟合的线性模型,data给了一个数据结构,data中formula中的变量要评估,1m中几个其他参数是可以获得的在Chambers and Hastie (1992, Chapter 4) and also in Venables and Ripley (1999, Chapter6).
formula语言用于formula参数给了1m很大灵活性说明线性模型。这个公式语法版本被
Wilkinson and Rogers (1973)定义,将一个线性模型y=beta;0 beta;1x1 beta;2x2 用S表示
y~1 x1 x2
~表示建立模型为,。。。这种表示中系数为隐含的。
如果一个模型不需要截距项,公式中必须包含-1,协变量可以是因素,有序因素,连续因素,矩阵或者数据结构,一个协变量的任何一种函数形式也可以用于公式中,如
log(y) ~ exp(x1) cos(x2)也是有效的。
1m函数操作适用于大部分S函数,特别是1me和nlme,1m的一个命令返回1m等级的拟合目标,几个一般函数可以适用。得到结果为the fit (print and summary), produce diagnostic plots (plot),return predictions (predict), extract components (fitted, residuals, and coef), update the original model (update), or compare different fitted objects (anova).
例子一
假设一开始忽视了数据的分组方法,对所有数据,用一个简单的距离与年龄单一线性回归方程拟合(第一步),相关的1m命令为
gt; fm1Orth.lm lt;- lm( distance ~ age, Orthodont )
对结果简单描述
gt; fm1Orth.lm # equivalent to print( fm1Orth.lm )
Call:
lm(formula = distance~age, data = Orthodont)
Coefficients:
(Intercept) age
16.761 0.66019
Degrees of freedom: 108 total; 106 residual
Residual standard error: 2.5372
用plot函数评价拟合好坏的诊断图像
gt; par( mfrow=c(3,2) ) # arrange 6 separate plots on a page
gt; plot( fm1Orth.lm ) # Figure 4.1
拟合以后还有可以考虑的可变性,如残差图所示。这并不惊讶,我们知道简单线性回归模型不能很好地表现数据结构,显然拟合中有些观测值有不一般的影响,特别是39和104观测值。此外,残差正态概率图暗示误差分布厚尾。
假设现在想要测试男孩和女孩截距和斜率可能的差异,用以下模型
distance =beta;0 beta;1Sex beta;2age beta;3agetimes;Sex , (4.1)
sex为-1表男孩,为1表示女孩,参数beta;1 和beta;3 表示性别影响的截距和斜率,现在用S的1m另一个命令拟合或者校正原始拟合模型重新定义公式
gt; fm2Orth.lm lt;- update( fm1Orth.lm, formula = distance ~ Sex*age )
其中Sex*age相当于Sex age Sex:age.
结果中summary展现了很多细节,特别的,它给出了参数估计的边际效益的信息
gt; summary( fm2Orth.lm )
Call: lm(formula = distance ~Sex age Sex:age, data = Orthodont)
Residuals:
Min 1Q Median 3Q Max
-5.62 -1.32 -0.168 1.33 5.25
Coefficients:
Value Std. Error t value Pr(gt;|t|)
(Intercept) 16.857 1.109 15.194 0.000
Sex 0.516 1.109 0.465 0.643
age 0.632 0.099 6.394 0.000
Sex:age -0.152 0.099 -1.542 0.126
Residual standard error: 2.26 on 104 degrees of freedom
Multiple R-Squared: 0.423
F-statistic: 25.4 on 3 and 104 d.o.f., the p-value is 2.11e-12
Correlation of Coefficients:
(Intercept) Sex age
Sex 0.185
age -0.980 -0.181
Sex:age -0.181 -0.980 0.185
Sex和Sex:age的 P值显示畸齿矫正尺寸增长与性别无关,因为t检验仅仅测量模型每一项的边际效应,我们应该谨慎继续,从模型中一次删除一项。
gt; fm3Orth.lm lt;- update( fm2Orth.lm, formula =.~.-Sex)
gt; summary( fm3Orth.lm )
...
Coefficients:
Value Std. Error t value Pr(gt;|t|)
(Intercept) 16.761 1.086 15.432 0.000
age 0.640 0.097 6.613 0.000
Sex:age -0.107 0.020 -5.474 0.000
...
按规定,.~.表示公式矫正,-操作用于从模型中删减项目。
Sex:age现在变得有效了,显示男孩与女孩增长模式是不一样的。因为1m拟合不适用于这些数据,当描述线性混合模型时,我们将进一步的讨论这些模型问题。
这些数据的分组性质,四年每一个科目的重复测量,违背了使用1m的基本假设中的独立性,fm2Orth.lm残差的箱形图gt; bwplot( getGroups(Orthodont)~resid(fm2Orth.lm) ) # Figure 4.2
图4.2中最重要的特征观测是相同科目的残差相关性趋向相同的符号。这表明为了精确表明线性混合模型的动机,这个模型有必要考虑“科目效应”。
4.1.1适合每组的单独1m:1mlist函数(第二步)
第一步建立模型为线性混合模型,模型的功能形式确实以后,选择模型的参数,如果有的话,应该有解释组间变化的一个随机效应组成成分。1mlist函数和理论对这些有用,典型1mlist命令为
lmList( formula, data )
其中formula右边用|分为了两个部分,第一部分明确了对每一个数据集拟合的线性模型,第二部分明确了组的因素。任何一个在1m中被允许的线性公式也可以作为1mlist的模型公式。数据讨论给了寻找公式中变量的数据结构。
继续分析正常牙齿数据,我们可以看到一个年龄与距离的简单线性回归模型可能是适当的。我们拟合
gt; fm1Orth.lis lt;- lmList( distance ~ age | Subject, Orthodont )
如果数据是分组数据(第三章),分组变量会被公式遗漏,从分组公式中提取数据
gt; getGroupsFormula( Orthodont )
~ Subject
所以1mlist中替换的获取相同拟合对象的命令为
gt; fm1Orth.lis lt;- lmList( distance ~ age, Orthodont )
因为1mlist函数是一个一般函数(Chambers and Hastie,1992, Appendix A),对有差异的不同借机有不同的理论,相同拟合可以有更加简单的表明方式。如果1mlist的第一论据是一个分组数据目标,这个目标的表示公式被用于建立一个缺省的模型公式并且提取小组变量表达。因为我们1mlist拟合使用相同的组,回答和协变量,公式
gt; formula( Orthodont )
distance ~ age | Subject
我们可以用更简单的命令得到相同的拟合模型
gt; fm1Orth.lis lt;- lmList( Orthodont )
1mlist返回目标为等级1mlist,可获得几个显示和图形
表4.1列出了等级1mlist的重要理论,我们在下面列举几个理论
Print理论给出了拟合目标的最少信息
gt; fm1Orth.lis
Call:
Model: distance ~ age | Subject
Data: Orthodont
Coefficients:
(Intercept) age
M16 16.95 0.550
...
F11 18.95 0.675
Degrees of freedom: 108 total; 54 residual
Residual standard error: 1.3
M05 13.65 3.2882 4.15124 1.1817e-04
...
F11 0.675 0.29293 2.30428 2.5081e-02
Residual standard error: 1.31 on 54 degrees of freedom
这个输出的标准残差图是对每组用个体1m计算的标准误差估计合并而成的。更多细节输出可用summary理论
gt; summary( fm1Orth.lis )
Call:
Model: distance ~ age | Subject
Data: Orthodont
Coefficients:
(Intercept)
Value Std. Error t value Pr(gt;|t|)
M16 16.95 3.2882 5.15484 3.6952e-06
用plot理论可以得到诊断图,在amp;4.3中描述.
用1mlist进行初步分析的主要目的是给出线性混合模型使用什么随机效应结构的指示,我们必须决定模型包含哪一种随机效应,这种随机效应应该有什么协方差结构。Pairs理论给我们提供了一种随机效应协方差结构
gt; pairs( fm1Orth.lis, id = 0.01, adj = -0.5 ) # Figure 4.3
Id用来定义异常值——在估计概率为1-id/2等高线外的点会被标记,我们看到,M13有不寻常的低截距,被一个大斜率补偿。这表明截距与斜率有负相关的关系。那些经验分析回归模型可能已经推测了这种图形发生的原因,这是因为所有数据都是在8岁-14岁之间,但是截距代表0岁的测量值。这使得斜率与截距有很高的负相
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[145972],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。