结构化面试:额外的研究和荟萃分析外文翻译资料

 2022-03-18 22:32:50

Journal of Occupational Psychology (1989), 62, 191-199 Printed in Great Britain copy; 1989 The British Psychological Society

191

The structured interview: Additional studies and a meta-analysis

Patrick M. Wright*

Department of Management, University of Notre Dame, Notre Dame, IN 46556, USA

Philip A. Lichtenfels

Bristol-Myers Corporation, Evansville, IN

Elliot D. Pursell

Human Resource Systems, New Bern, NC

Hunter Sc Hunter (1984) recently performed a meta-analysis on research on the interview for selection purposes and concluded its validity to be 0.14. The structured interview may be a promising alternative to the traditional unstructured interview. A review of structured interview studies is discussed and six additional validations are presented. A meta-analysis performed on structured interview validities resulted in an estimated validity of 0.39. Research implications are discussed.

Few people would question the popularity of the employment interview as a selection tool in industry. This has resulted in its becoming the most widely used employment technique in America (Guion, 1976) and the United Kingdom (Robertson amp; Makin, 1986). Reviews of the selection interviewing research (Arvey amp; Campion, 1982; Schmitt, 1976), however, have found that its popularity is not matched by its validity. Recently, Hunter amp; Hunter (1984) used the meta-analysis technique to compare the validities of a number of predictors used in personnel selection. Even after correcting for statistical artifacts these authors concluded that the validity for the interview is only 0.14. While this still has utility over random selection, it falls below such predictors as cognitive ability tests (0.53), assessment centres (0.43), biodata (0.37) and reference checks (0.26).

Reilly amp; Chao (1982) presented more discouraging evidence of interview validity. These authors reviewed a number of selection devices in an effort to discover selection techniques which might be as valid while having less adverse impact than traditional paper-and-pencil tests. Their exploration of research on the interview led them to conclude that the interview was not a promising alternative. They did, however, note the situational interview (Latham, Saari, Pursell amp; Campion, 1980) as a possible exception among the rest of the interviewing research.

The situational interview is a subset of what has come to be known as structured interviewing. Pursell, M. Campion amp; Gaylord (1980) defined the structured interview as lsquo;a series of job related questions with predetermined answers that are consistently applied

bull; Requests for reprints.

192 Patrick Al. Wright, Philip A. Lichtenfels and Elliot D. Pursell

across all interviews for a particular jobrsquo; (p. 908). Structured interviews usually contain four types of questions. Situational questions ask an applicant how he/she would respond to various situations. Job knowledge questions assess if an applicant has the basic knowledge necessary to perform the job. Job sample/simulation questions range from mock-ups of job samples to questions using the terminology of the job. Finally, worker requirements questions ask applicants their willingness to perform certain tasks under certain working conditions.

An additional type of question has recently been used in structured interviewing. Janz (1982) and Orpen (1985) demonstrated the validity of the lsquo;Patterned Behaviour Description Interviewrsquo; (PBDI) in two separate studies. The development and administration of these types of interviews follow closely the procedures adopted in the situational interviews used by Latham etal. (1980). Both are based on a thorough job analysis, and ask only job-related questions. Both ask the same questions of all interviewees, and have predetermined scales for scoring answers.

The major difference between the two lies in the fact that, rather than asking how one would respond to a situation in the future as in the lsquo;situationalrsquo; interview, the PBDI questions ask how one has responded in the past to these situations. Latham amp; Saari (1984) stated that the situational interview is based on the premise that peoplersquo;s intentions are related to their behaviour, and that these intentions are in part determined by their past behaviour. In fact, these authors found a correlation of 0.47 between situational questions and questions based on past experiences. (It should be noted that the past experience questions were not PBDI-type questions. An even higher correlation would probably be observed between situational questions asking for future and past responses.)

In reality, the same situations and same scoring keys might be used for both types of interviews, the only difference being in whether the candidates are asked how they would respond or have responded in the past. Thus, for the purpose of this study, structured interviewing is treated as encompassing both the situational and PBDI-type interviews.

The validity of these two types of interview has received considerable research attention. Heeding Schmittrsquo;s (1976) recommendations for the use of structured interviews, Latham et al. (1980) showed the usefulness of the situational interview in three studies. The first two studies consisted of concurrent validations of situational interviews for hourly paid workers and foremen. The interview scores were correlated with Behavioural Observation Scales (BOS) (Latham amp; Wexley, 1981) scores filled out by each individualrsquo;s superior. Validity coefficients of 0.46 and 0.30 were found for two groups respectively. The third study consisted of administering the situational interview for hourly paid workers to 56 applicants for entry-level production work. The scores were correlated with scores on BOS completed 12 months later by supervisors and resulted in validity coefficients of 0.39 and 0.33 for wom

剩余内容已隐藏,支付完成后下载完整资料


结构化面试:额外的研究和荟萃分析

Hunter Sc Hunter(1984)最近对基于选择目的的访谈进行了荟萃分析,得出其有效性为0.14。与传统的非结构化面试相比,结构化面试可能是一个很有前途的选择。讨论了结构化面试研究的回顾,并提出了另外六个验证。对结构化面试有效性进行元分析,结果估计有效性为0.39。对研究的意义进行了讨论。

很少有人会质疑作为行业选择工具的求职面试是否受欢迎。这使得它成为美国(Guion, 1976)和英国(Robertson amp; Makin, 1986)使用最广泛的雇佣技术。选择访谈研究综述(Arvey amp; Campion, 1982;然而,施密特(Schmitt, 1976)发现,它的受欢迎程度比不上它的有效性。最近,Hunter amp; Hunter(1984)使用元分析技术来比较人员选择中使用的许多预测因子的有效性。即使在对统计伪影进行校正之后,这些作者也得出结论:访谈的有效性仅为0.14。虽然这仍然比随机选择有用,但它低于认知能力测试(0.53)、评估中心(0.43)、生物数据(0.37)和参考检查(0.26)等预测指标。

Reilly amp; Chao(1982)提出了面试有效性的更令人沮丧的证据。这些作者回顾了许多选择设备,试图发现一些选择技术,这些技术可能同样有效,但与传统的纸铅笔测试相比,其负面影响更小。他们对面试研究的探索让他们得出结论:面试不是一个有前途的选择。然而,他们注意到情景面试(Latham, Saari, Pursell amp; Campion, 1980)可能是其他面试研究中的一个例外。

情境面试是结构化面试的一个子集。Pursell, M. Campion amp; Gaylord(1980)将结构化面试定义为“一系列与工作相关的问题,其预先确定的答案在所有特定工作的面试中都得到了一致的应用”(p. 908)。结构化面试通常包含四种类型的问题。情景问句询问应聘者在不同情况下的反应。工作知识问题评估求职者是否具备完成工作所需的基本知识。工作样本/模拟问题的范围从工作样本的模拟到使用工作术语的问题。最后,工人需求问题问求职者在一定的工作条件下是否愿意完成某些任务。

最近在结构化面试中使用了另外一种类型的问题。Janz(1982)和Orpen(1985)在两项独立研究中证明了“模式行为描述访谈”的有效性。这些类型的访谈的开发和管理遵循莱瑟姆·塔尔所采用的情景访谈程序。(1980)。两者都是基于全面的工作分析,并且只问与工作相关的问题。他们都对所有的受访者提出同样的问题,并且都有预先确定的评分标准。

这两者之间的主要区别在于,在“情境”面试中,人们不会问自己会如何应对未来的情况,而是问一个人在过去如何应对这些情况。Latham amp; Saari(1984)认为情境面试是基于人们的意图与他们的行为有关的前提,这些意图在一定程度上取决于他们过去的行为。事实上,这些作者发现情景问题和基于过去经验的问题之间的相关性为0.47。(应该指出的是,过去的经验问题不是pbdi类型的问题。在询问未来和过去回答的情景问题之间,可能会观察到更高的相关性。

在现实中,这两种类型的面试都可能使用相同的情况和相同的得分键,唯一的区别是,候选人是否被问及他们会如何回应或在过去做出回应。因此,在本研究中,结构化面试被认为包括情境面试和pbdi式面试。

这两种访谈的有效性受到了广泛的研究关注。注意到Schmitt(1976)关于结构化面试的建议,Latham et al.(1980)在三项研究中显示了情景面试的有效性。前两项研究包括同时对计时工资工人和工头进行情景访谈的验证。访谈分数与每个人的上级填写的行为观察量表(BOS) (Latham amp; Wexley, 1981)的分数相关。两组的有效性系数分别为0.46和0.30。第三个研究是对56名初级生产工作的求职者进行小时带薪员工的情境面试。这些分数与12个月后由主管完成的BOS评分相关,结果分别为女性和黑人的有效系数分别为0.39和0.33。

Tenopyr amp; Oeltjen(1982)在承认情景面试的潜在有用性的同时,由于所涉及的样本规模较小,因此需要重复Latham等人(1980)的研究。来自Latham amp; Saari(1984)的进一步支持。这些作者使用面向未来的情景问题和过去的经验问题进行了两项研究。第一个研究由文书人员(n = 29)组成,结果与监督评分的相关性为0.39,与同行评分的相关性为0.42。第二项研究是对157名初级员工的预测验证。报告的效度仅为0.14,但通过对访谈过程的探究发现面试官没有正确地使用面试。面试官没有给每个面试问题打分,他们只是简单地用基准作为指导,然后在面试结束时进行全面的评估。当面试官正确使用情景面试时,对29个原始样本进行跟踪调查,结果为0.40。

PBDI也有大量的研究支持。Janz(1982)将PBDI与非结构化访谈进行了比较,以预测助教学生评分的有效性。笔者发现PBDI的有效性为0.54。Orpen(1985)也研究了PBDI预测寿险推销员相对于非结构化面试表现的有效性。本研究发现两种结构化访谈与绩效管理评分之间的相关性为0.48,访谈分数与美元销售额之间的相关性为0.61。

结构化面试优于非结构化面试有三个原因。首先,结构化面试是基于全面的工作分析。“情境”和PBDI访谈都是从应用Flanagan(1954)的“关键事件技巧”来开发情境问题开始的。这大大降低了与工作无关的问题的潜在可能性,从而在面试过程中引入不必要的错误。第二,如前所述,结构化面试假设个人的意图和行为是紧密相连的,这一假设在目标设定文献中得到了明确的证明(Locke, Shaw, Saari amp; Leatham, 1981)。第三,使用同样的问题和预先确定的答案标准提高了面试的可靠性。例如,Schwab amp; Heneman(1969)和Carlson, Schwab amp; Heneman(1970)发现结构化面试指南的使用增加了面试者之间的一致性。Schmitt(1976)认为,结构化面试的可靠性之所以更高,是因为它的形式迫使面试官对面试者提供的信息更加关注。

这些研究部分地满足了Tenopyr amp; Oeltjen(1982)关于重复结构化访谈的呼吁。研究报告的目的是双重的。首先,它检验了另外六项结构化面试验证研究的结果。其次,它将前面提到的七项研究的结果与另外六项研究进行了meta分析,以更好地估计结构化面试的真实有效性。前五项验证研究的结果来自Kennedy(1985)。所有六项研究的数据都来自一家大型制造公司,该公司在美国各地设有工厂。以下这六项研究的顺序与1978-1984年收集数据的时间顺序接近。表一总结了每项研究的特点和结果。

这六项研究中结构化访谈的形式和内容非常相似,因为在公司内部共享结构化访谈。事实上,在研究2和4中使用的访谈是在研究1中开发的访谈的修改版本。在研究6中使用的访谈是对研究3中使用的访谈的修改和扩展版本。所有的6个面试都包括情境和员工要求的问题。包含在元分析中的六个先前未发表的结构化面试验证研究的摘要:面试包含至少一个工作知识/技能问题和两个面试包含一个工作样本/模拟问题。

在所有的访谈中,同样类型的评分标准被用来评估候选人对访谈问题的回答,也就是基于行为描述的高、中、低回答的五点图表评分。除了少数例外,这些访谈中的问题和锚点最初是基于公司内部经验丰富的经理的输入和一致判断而开发和扩展的。

其中四项研究采用BOS作为标准衡量标准,其余两项研究采用图形评分量表。六项研究中有五项是预测验证研究。

表一所示的研究为结构化面试作为一种选择工具的有效性提供了额外的支持。结合引言中提到的已发表的研究,他们显示了大量但并非完全一致的支持结构化面试比非结构化面试具有更大的预测性。然而,Hunter, Schmidt amp; Jackson(1982)证明了有多少不一致的发现是由统计伪码(如小样本大小)而不是研究之间的真实差异造成的。

荟萃分析是由Glass(1976)提出的一种方法,用于在多个研究中累积效应值,以得到两个变量之间的真实关系的估计值。猎人等等。(1982)建立在玻璃程序上,对采样误差的统计工件,测量不可靠和范围内的限制进行校正。本文的第二个目的是通过对结构化访谈的研究进行荟萃分析,进一步探究结构化访谈的有效性。根据Hunter等人(1982)提出的方法,对之前讨论过的13个(已发表的7个和未发表的6个)结构化访谈有效性研究进行了meta分析。在报告一个以上有效性系数的四种情况中,使用了以下系数。在Latham等(1980)的第三项研究中,由于样本均为黑人,因此采用了黑人系数。Orpen(1985)和Latham amp; Saari(1984)研究了访谈分数和监督评分之间的相关性,以便在所有研究中保持标准类型(客观和主观)的相似性。最后,在上述第六项研究中(以加权隶属度总和和加权技术总额作为总准则的两个方面),计算了费舍尔z变换的加权平均。这导致了整体有效性为0.26。表2显示了在元分析中使用的研究、样本大小、样本类型和有效性。

Hunter et al.(1982)程序需要计算加权平均相关(X)、相关的方差(O2r)、校正抽样误差影响的方差(O2e),以及校正其他统计伪如测量不可靠性和范围限制(Xcor)的均值相关。计算了不同研究间显著变化的卡方检验,以检验观察到的变化是否由某种调节变量引起。一个重要的卡方值导致拒绝零假设,即不存在版主变量,然后通过子分组研究搜索可能的版主。

所有13项研究的结果如表3所示。这些结果表明,在总样本量为870的情况下,平均未修正效度系数为0.27。相关性异质性的卡方检验显著(yf = 25.29, P lt; 0.05),说明存在调节变量。这些有效性随后被修正为预测器和标准的测量误差。Hunter等人(1982)给出的交互公式用于校正测量误差与缺失数据的均值相关。

这个过程要求计算给出可靠性的测量的平均可靠性,并使用这个平均可靠性作为每个研究的可靠性的估计。尽管在本研究中,用于计算这些平均值的可靠性值的数量可能很小,但计算的值(预测器为0.70,准则为0.83)却异常高。

由于缺乏关于范围限制的数据,没有对范围限制进行修正。因此,对不可靠性的修正导致了平均有效性0.35 (SD = 0.22)。在均值附近放置95%的置信区间,其真实有效性介于-0.07到0.77之间。因为这个区间包含0,所以这个关系在统计学上并不显著。

然而,由于卡方测试的重要性,研究人员对可能的主持人进行了研究:这些研究包括了工作类型(蓝色vs白领)和面试类型(模式行为描述面试vs.其他)。然而,两种区分都不能解释观察到的方差。没有对种族或性别作为调节者进行测试,因为这个测试没有足够的数据。这是因为只有一项研究报告了种族或性别数据。由于没有发现慢化剂,因此对有效性系数进行了异常值检验。

将异常值的数据检查作为一种通用过程在其他地方被推荐(Tukey, 1977, 1980)。由于研究的数量众多,这个过程在这里尤其重要。在使用少量研究的情况下,一个“极端”或“偏差”研究对分布方差的潜在影响会增加。

除了影响分布的方差外,离群值研究也可能影响平均值。尽管这种影响小于对方差的影响(参见Schmidt, Hunter, Pearlman amp; Hirsch, 1984), Tukey(1980)指出,平均值的“安全”估计是在去掉一小部分极值后计算出来的。由于上述两个原因,我们剔除了对影响大小方差影响最大的研究(上述肯尼迪1985年的第一个研究,有效性为-0.22),再次进行meta分析。

表4表明,第二分析12个研究发现意味着未修正的有效性0.29总样本量833 -非标准卡方检验是Cf2 = 9.94,P lt; 0.05),表明消除研究降低了拒绝的相关性之间的方差的假设一个调节变量的存在。然后对不信度的关系进行修正,使得结构化面试的平均效度为0.39 (SD = 0.07)。在平均值附近设置95%的置信区间,实际有效性介于0.27到0.49之间。

通过对比本文所报道的结构化面试的有效性和Hunter amp; Hunter(1984)的调查结果,可以看出情境面试相对于传统非结构化面试的选择优势。95%置信区间(0.27-0.49)排除了《猎人与猎人》(1984)中0.14的相关性。这表明结构化面试与传统的非结构化面试的预测能力存在显著差异。

为什么结构化面试比传统的非结构化面试更能预测工作表现?已经讨论了许多假设。此外,Latham et al.(1980)认为情境面试(即结构化面试的一个子集)是基于一个人的意图与他或她的行为有关的前提。最后,另一种(但不是相互竞争)的解释是,结构化面试可以作为一种“口头管理”的智力测试。这就解释了为什么在许多认知能力测试中发现的情景面试方法是有效的(正如亨特和亨特1984年报道的那样)。进一步的研究应该侧重于探讨情景面试和认知能力之间的关系。如果它们是高度相关的,那么将两者用于选择可能是多余的。如果是这样,其中一个或另一个可以根据其他考虑使用,比如成本、申请人反应(就面子有效性而言)和监督反应。

还需要对其他因素(如评级错误、信息的时间表示、偏差等)对情景面试结果的影响进行额外的研究。误差方差仍然存在,这可能是由诸如评级错误、面试问题的质量以及对访谈的不准确使用等因素造成的(如Latham amp; Saari, 1984)。虽然情景访谈已经证明了观察者之间的高可靠性,但是没有经验证据表明它们可以消除或最小化常见的评级错误。还应该认识到,这项研究的结果可能低估了结构化面试的真实有效性。首先,当报告多个性能度量时,要么使用平均有效性,要么使用较低的有效性(例如Orpen, 1985)。第二,如前所述,没有对范围限制进行修正。最后,在标准的衰减

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[470275],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。