多变量方法对怀疑受益模型施加额外约束:按学科进行排列的QS世界大学排名外文翻译资料

 2023-01-08 10:01

本科毕业设计(论文)

外文翻译

多变量方法对怀疑受益模型施加额外约束:按学科进行排列的QS世界大学排名

MilicaMaričić塞尔维亚贝尔格莱德贝尔格莱德大学组织科学学院milica.maricic@fon.bg.ac.rs

MilicaBulajić塞尔维亚贝尔格莱德贝尔格莱德大学组织科学学院bulajic.milica@fon.bg.ac.rs

ZoranRadojičić塞尔维亚贝尔格莱德贝尔格莱德大学组织科学学院radojicic.zoran@fon.bg.ac.rs

VeljkoJeremić塞尔维亚贝尔格莱德贝尔格莱德大学组织科学学院jeremic.veljko@fon.bg.ac.rs

摘要:综合指数已成为利益相关者的珍贵资本,因为它们提供了做出决策的实体和信息等级。然而,最近提出了关于其开发过程的某些问题,特别是关于加权过程。为了解决观察到的问题,在本文中,我们提出了一种新的多变量方法来定义权重。也就是说,基于数据包络分析(DEA)的模型,即怀疑效益(BoD)模型,已经在复合指数开发过程中获得了巨大的成功。另一方面,综合I-distance指标(CIDI)方法作为向指标分配权重的公正方法脱颖而出。通过结合这两种方法,可以克服原始BoD模型的一些局限性。结果,可以提出新的实体特定权重,其最大化复合索引的值。作为案例研究,我们在统计和运筹学领域分析了Quacquarelli Symonds(QS)世界大学排名。所获得的结果基于数据驱动的权重,可以提供对观察到的排名的性质的新见解。这里介绍的方法可能会引发对综合指数权重学科和学科大学排名的进一步研究。

关键词:怀疑模型,复合I-distance指标(CIDI),运筹学,大学排名。

JEL分类:C10,C44,I21,I23。

DOI:10.1515 / crebss-2016-0005

收稿日期:2016年5月7日

接受:2016年8月25日

介绍 :

在过去几年中,大学排名出现了一个新的趋势--按学科排名划分大学(Federkeil,2015)。 这种排名背后的想法是,某些大学在整体全球排名中无法被直观发现,而在特定学术领域表现显著(IREG,2015)。 此外,另一个有利于学科排名的观点是,国际排名提供了大约500所大学的信息,而全球有超过19000所大学(Siwinski,2015)。 因此,出现了基于大学在特定科学领域的表现的排名需求。 Dobrota和Jeremic观察到,开始了大学排名的现在与未来的革命。

在证据表明引用模式之间存在差异之后,需要按学科进行排名(Ziman,2000)。也就是说,论文所属的科学领域高度影响其后来的引用模式(Bornmann&Marx,2014)。因此,在使用引文计数对大学进行排名时,建议考虑不同的引用行为(Zornic等,2015)。这一结论导致了大学排名的有效性问题,这些排名使用的是在科学领域中尚未归一化的总引用计数。

虽然学科的具体排名旨在克服整体大学排名的一些弊端,但他们受到批评有几个原因。其中一个主要批评与声誉指标有关,这些指标基于调查结果(Rauhvargers,2014)。进行调查的有效性可以受到质疑,因为有大学,即使他们没有提供观察学科的课程,计划或研究,也按特定学科列表排名(Rauhvargers,2013)。此外,由于主观排名和经常无法解决的加权方案,无论是具体的还是整体的,都一致受到了批评。最后,主要问题是如何定义场特定的特征并选择适当的指标,这将反映观察到的差异。

然而,许多大学排名方法已经转向学科排名。其中一些是ARWU学科排名,QS世界大学学科排名和URAP基于学科排名。每篇文章涵盖的字段数量和科学字段的定义在上述排名方法之间有所不同。作为我们论文中的案例研究,我们将重点关注统计和运筹学领域的QS世界大学排名。

人们已经广泛认识到统计界作用的重要性,特别是联合国。他们意识到,能够将大量数据分析为可消化,易于理解和有用的信息的数据科学家对于社会的进一步发展至关重要(UN,2014)。此外,他们还指出,量化目标、指标是沟通的有力工具,但如果没有统计上合理可靠的数据和排名方法,其质量和可信度就会下降。 Davenport和Patil(2012)在他们的文章中预测,数据科学家的短缺将成为某些部门的严重制约因素,这可能会减缓其发展速度。因此,未来的学生应该获得清晰易懂的大学排名,这些大学在实地统计和运筹学研究中具有显着和可识别的结果。因此,需要根据他们的专业知识对大学进行排名,并在统计和运筹学领域取得成果。

因此,在本文中,我们提出了怀疑—CIDI模型(BoD-CIDI)来分析统计和运筹学领域的QS世界大学排名,并提出实体特定的加权系统。 也就是说,在复合指数创建过程中成功地使用了受益模型来设计实体特定权重(Cherchye等,2007)。 然而,该模型有几个与相关约束模型的缺点(Rogge,2012)。 因此,我们建议使用基于I-distance方法的复合I-distance指示器方法(CIDI)(JovanovicMilenkovic等,2015; Dobrota等,2016),以创建数据驱动的权重约束并克服主模型障碍,达到充分自由。 因此,我们提出了原始BOD模型的新颖变体,其采用CIDI权重作为模型约束。

下一章将介绍一份全面的文献观,其中介绍了统计和运筹学领域的QS世界大学排名以及对新提出的BoD模型至关重要的综合I-distance指标方法(CIDI)。与优化问题和BoD-CIDI模型一起进行研究的数据已在第3节中详细阐述。结果在第4节中给出,而结论在最后一章中提供。

文献评论

Quacquarelli Symonds按学科排名:

Quacquarelli Symonds(QS)认识到大学排名发展的新方向。因此,它创造了世界大学排名。 2015年,QS提供了36个单独学科的排名,这些学科基于四个指标:学术声誉,学校声誉,每篇论文引文和H指数(QS,2015a)。第一个指标,学术声誉,自开发以来一直是QS排名的核心。该指标的目的是根据被认为是特定领域专家的相关国内外学者的意见来评估机构的声誉。同样,学校声誉评估声誉,但这次是从学校的角度来看。最后,最后两个指标是从Scopus数据库中提取的文献计量指标。 H指数是衡量学者生产力和引文影响的指标。另一方面,Citations per Paper提供有关该机构在Scopus所涵盖的期刊上发表的工作的影响的信息。所有四个指标共同旨在提供特定科学领域的大学综合排名(QS,2015a)。

根据学科,四个指标的权重不同(情报单位,2015年)。按学科进行的QS排名中使用的权重是自适应加权,这意味着已经确认了跨学科差异,并且相应地对指标进行了加权。即例如在科学价值和文献引用率不同情况下,一个指标对于排名过程的重要性是不同的。权重由指标的相关性和收集数据的有效性指定(情报单位,2015)。排名的总值计算为四个标准化指标的加权和。

在所发表的36个学科排名中,本文旨在分析大学在统计和运筹学领域的成就和声誉的排名。根据官方情报单位排名概览(情报单元,2015年),559所大学被认为是进入这一学科的排名,而最终只有200所大学排名。所有200所大学都提供了指标的实际值,而总体结果仅针对排名前50位的大学发布。也就是说,其他大学排名为50,其总体结果不公开。

如前所述,按学科划分的QS大学排名根据特定学科为指标分配自适应权重。表1列出了实地统计和业务研究中的投入指标权重。

仔细研究一下官方加权计划,可以得出结论,基于调查的指标,它们处理了一个非常主观的话题,已被指定为权重的60%。另一方面,在这种排名方法中,文献计量指标被认为不那么偏颇且更客观(Marginson,2014)。因此,我们提出了两种广泛使用的方法来创建一种新的数据驱动加权方案。首先,我们建议采用CIDI方法来获得初始的数据驱动权重(Dobrota等,2015),它可以作为怀疑利益模型中的约束条件,该模型将选择最有利的指标权重以最大化综合指数的总体价值(Mizobuchi,2014)。

复合I-distance指示器(CIDI)方法

在1970年代,需要一种统计方法,可以使用大量指标对各国的社会经济发展水平进行排序。其中一个脱颖而出的方法是I-distance(Ivanovic,1977)。自其发展以来,I-distance已被用于社会经济学以外的许多领域(例如Jeremic等,2011; Maricic和Kostic-Stankovic,2016)并取得了巨大成功。

I-distance方法属于排序方法组,其总值基于计算出的指示实体距离。指示实体可以是来自分析虚构的数据集或观察实体,或者它可以是观察到的变量的最小值,最大值或平均值。在这里,我们使用虚构的最小实体作为指示实体。

对于一组选定的变量选择来表征实体,被定义为和两个实体之间的距离I(Jeremic等,2011):

其中是变量值与 和 之间的距离。 判别效应是:

是相关系数 和 之间的相关系数和的标准差(Jeremic et al., 2011).

I-distance具有特殊功能。 即变量和获得的I-distance值之间的相关系数表示变量对于排序过程的重要性水平。因此,它们可用于获得权重并基于I-distance结果创建新的复合指数,其将与分析的指数结果相比较。 新获得的复合指数称为复合I-distance(CIDI)(Dobrota等,2016; Dobrota等,2015)。 以下公式用于根据I-distance设计新权重(Dobrota et al,2016):

其中是第i个输入变量的Pearson相关系数和I-distance值。 使用此方法获得的权重总和为1. CIDI方法的过程如下。 在第一步中,对所有变量采用I距离,并获得I距离的值。 接下来,计算每个变量与I距离值之间的相关系数。 然后使用(2)获得新的权重。 最后,使用从I-distance的结果导出的新权重,获得新的CIDI指数,其结果与审查的复合指数的结果相当。 这非常重要,因为I距离的值表示距离,因此与正在分析的复合指数的值无法比较。 CIDI索引允许基于Idistance方法比较原始值和重新定义的值。

到目前为止,CIDI已成功地用于审查各个科学领域的综合指标,如教育(Maričić等,2016a; Dobrota等,2016),食品安全(Maricic等,2016b), 和ICT发展(Dobrota等,2015)。 也就是说,新的加权方案导致根据其不确定性和灵敏度分析创建更稳定的度量方法(Dobrota等,2016)。

方法

数据:

进行分析的数据集包含2015年统计和运筹研究学科中排名前50位的大学的所有四个QS排名学科指标值。该数据集可在QS排名的官方网站上公开获取( QS,2015b)。由于指标已经标准化且没有缺失数据,因此数据集已准备好进行统计分析。

统计方法:

怀疑受益(BoD)模型最初是由Melyn和Moesen(1991)设计的,而它的根源在于数据包络分析(DEA)(Charnes等,1978)。 DEA背后的基本思想是根据输入和输出信息计算决策单元(DMU)的最大效率。另一方面,BoD模型旨在最大化整体指数值,而无需先验证指示权重的信息。因此,我们可以说BoD模型仅面向输入。尽管如此,DEA和BoD之间存在概念上的相似之处:首先,在他们的目标与第二之间,缺乏可用的权重信息(Cherchye等,2007)。

为了克服主观分配权重的问题,这被认为是复合指数创建过程中的主要基石(Nardo et al。,2005),BoD模型为每个实体分配了特定的权重,同时最大化了整体价值,使用BoD模型,所有实体都可以获得综合指数的最高可能值(Cherchye等,2007)。 最初的BoD模型是线性规划问题(Rogge,2012),可以为每个实体制定

作为是观察实体的综合指数的最佳值,分配给实体l的最有利的加权方案,以及国家1的指标i的值。下标l与观察到的实体的数量相关联,而下标i与框架指示符的数量相关联。在分析目标函数后,应注意模型约束。解决方案必须满足两个约束条件。第一个(3a)是归一化约束,第二个(3b)是非负性约束。如果指标值未标准化,则使用约束3a的BoD模型对它们进行标准化。这意味着观察到的索引的整体值被转换为区间[0,1],其中0是最小值,1是索引的最大可能值。因此,使用BoD模型索引创建者无需在计算索引之前对数据进行标准化,因为模型已经包含该特征。

虽然BoD模型有许多好处,但也存在

剩余内容已隐藏,支付完成后下载完整资料


英语原文共 14 页,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[273072],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。