英语原文共 16 页，剩余内容已隐藏，支付完成后下载完整资料

您如何定义和衡量研究生产力？

乔瓦尼·阿布拉莫bull;Ciriaco Andrea DAngelo

初稿日期：2013年11月15日/ 在线发布：2014年3月19日

Akademiai Kiado，匈牙利布达佩斯2014年

摘要抽象生产率是任何生产系统效率的典型指标。似乎已经成为文献计量学的一个常态，将研究生产力定义为每个研究者的出版物数量，将其与影响区分开来。在这项工作中，我们在研究活动的具体背景下实施生产力的经济概念，并展示了普遍接受的定义的局限性。通过“微分科学力量（FSS）”指标，我们提出了可测量的研究生产力形式，符合微观经济生产理论。介绍了FSS在个人，实地，学科，部门，机构，地区和国家各级分析的方法。最后，我们通过研究生产力的两个定义来比较意大利大学的排名。

关键词 研究生产力 FSS 研究评估大学排名

引言

Opthof和Leydesdorff（2010）批评了莱顿CWTS“冠军指标”的统计归一化。一年以后，CWTS集团的文献计量学家（Waltman et al。2011）承认，“老冠指标”在数学上是不一致的，采用上述作者提出的归一化方法，导致“新冠指标”平均归一化引文分数，或MNCS。来自Leydesdorff和Opthof（2011）的反诉号不久才达成：尽管同意新的统计标准化，但他们进一步建议使用平均值而不是中位数进行归一化引用。

与此同时，自从物理学家豪尔赫·赫希（Jorge E. Hirsch）在2005年原始引入h指数以来，已经有超过1,600篇文章说明了它的优点和缺陷，并提出了一个又一个变体，甚至是最忠实的历史学家文献计量学将彻底追查他们。

但是，这两个研究绩效指标是否可能真的值得关注，或者是“无所事事”呢？这些具体指标只是近年来由学者和从业者提出的众多其他人物中最受欢迎的。虽然文献计量学家无疑是提供有用的指标和更准确可靠的方法，但实际上却是造成混乱的原因。提案的扩散实际上在决策者之间产生了一种迷失方向，不再能够区分各种指标的利弊来规划实际的评估工作。证明这一点是越来越多的机构，国家和超级级别的专家委员会和工作组越来越多，以便对这一指标进行审议和建议，即一套指标，以及这种或那种绩效指标。在国家和国际各级的表演排行榜都以媒体热烈的发布，影响观点和实际选择。目前作者的印象是，“非文献计量学家”（2013年，2013年SJTU; QS 2013等），甚至文献计量学家（莱顿大学，SCImago等）制作的科学成绩排名，主要是基于什么可以轻易计数而不是“真正重要的”。这也是我们的印象，文献中提出的大部分绩效评估指标源自一个主要是数学学派的思想。虽然在这方面的知识是应用方法的基础，但我们个人的信念是，研究评估指标必然来自经济理论。由于研究活动是生产过程，因此应从微观经济生产理论的角度进行分析。绩效或表达能力应根据具体目标和目标进行评估。由于目标可能因研究机构和时间而异，所以建议一个唯一的绩效指标是不恰当的。然而，这不足以证明数百个指标的扩散，尽管它们可能提供简便的计算对于政策或管理决策几乎没有用处。一个国家或研究机构可以旨在提高其平均研究生产力，或顶级文章或顶尖科学家的集中率，或旨在将这些努力与不同权重相结合。不过，我们怀疑任何政府或研究机构的管理人员都可以通过MNCS的测量，每个研究人员的h指数或平均出版物数量进行任何改进。因此，基于这些指标的所有研究评估及其相对排名都至少没有或没有价值，否则实际上是危险的，因为提供给决策者的信息中存在扭曲。可以肯定的是，研究系统的目标必须以表示生产活动期望结果的可预见的术语来表述。

在这项工作中，我们打算提供任何生产单位效率的主要指标的有效定义，生产率。在研究组织的背景下，文献计量学家已经习惯于将研究生产力定义为每位研究人员的出版物数量，将其与影响区分开来，并通过引用来衡量。老实说，我们无法回溯首先介绍上述定义的学者，但已经在1926年，阿尔弗雷德·洛特卡（Alfred J. Lotka）在他的里程碑式作品（Lotka 1926）中使用了许多出版物，在那里他介绍了现在所谓的Lotka法律或研究生产力。不幸的是，从经济角度来看，我们提醒生产力是经济理论中诞生的一个概念，这种定义没有意义。只有所有的出版物具有相同的价值或影响，才能够接受，但不能从真相中进一步。

本文的目的是在研究活动的具体背景下实施生产力概念，并提出可衡量的生产力形式。然后，我们将提出一个指标，即分数科学力量（FSS），我们认为，这是最接近生产力测量的最佳方法。我们还将说明在不同层次分析评估绩效评估中的FSS方法：个人，领域，学科，部门，机构，地区和国家。最后，我们通过生产力的两个定义比较意大利大学排名清单：FSS和每位研究人员的平均出版物数量。

研究活动的生产力

在本节中，我们的目的是以简单的方式实施研究生产力的概念，并提出一个代理来衡量它。

一般来说，研究活动的目的是产生新的知识。研究活动是一种生产过程，投入包括人类，有形（科学仪器，材料等）和无形（积累的知识，社会网络，经济租金等）资源，产出，新知识具有有形性（出版物，专利，会议介绍，数据库等）和无形性（隐性知识，咨询活动等）的复杂特征。因此，新知识生产功能具有多输入和多输出特性。任何生产单位（个人，研究组，部门，机构，领域，国家）的主要效率指标是生产率：简单来说，在单位生产要素生产的某一时期内产出的产量。为了计算研究生产力，需要采取一些简化和假设。

在输出方面，第一个近似来自于不能测量任何未被编纂的新知识。第二，新知识确实编纂了，我们面临着识别和衡量各种形式的问题。已经显示（2005年），在所谓的硬科学中，研究成果编纂的普遍形式是出版在科学期刊上。诸如Scopus和Web of Science（WoS）等数据库已经在文献计量分析中被广泛使用和测试，在内容和覆盖面方面都是足够透明的。作为硬科学总产出的代表，我们可以简单地考虑在WoS或Scopus中索引的出版物.1通过这个代理，那些不被审查的出版物将不可避免地被忽略。这种近似在硬科学中被认为是可接受的，尽管不是艺术，人文学科和社会科学领域的很大一部分。其他形式的产出，特别是专利，可以被识别商业或免费的数据库，如Derwent和Conven。专利通常是在科学领域描述其内容的出版物，因此仅在出版物的分析实际上可以避免在许多情况下潜在的重复计数。

研究项目经常涉及一组研究人员，其中出版物共同出版。然后，生产率措施需要考虑单位对产出的分数贡献。个别共同作者对于出版物的实现的贡献不一定相等，在某些领域，作者通过其在线的顺序来表达不同的贡献。关于作者科学论文排序的约定在不同领域有所不同（Pontille 2004; RIN 2009），因此个体的分数赋值必须相应加权。遵循这些逻辑，所有基于完全计数或“直”计数的绩效指标（只有第一作者或相应的作者获得完整的信用，而所有其他人都没有收到）是生产力的无效措施。相同的无效性适用于所有指标，基于共同作者秩序已经认识到意义的领域中相等的计数。

此外，由于出版物的强度各不相同（Garfield 1979; Moed et al。1985; Butler 2007），为了避免生产率排名的扭曲（Abramo等人，2008），应该比较同一领域的研究人员。任何没有扭曲的生产力评估的先决条件就是每个研究人员在一个而且只有一个领域的分类。一个直接的推论是，不能直接在总体水平上衡量员工研究领域异质性的单位的生产力，而且必须有两个步骤：首先衡量个人研究人员在其领域的生产力，然后适当地聚合该数据。

在文献计量学中，我们看到语言的演变，“生产力”这个术语是指基于出版物计数的语言，而“影响”的措施是基于引文数量的。在微观经济学的角度来看，第一个操作定义实际上只有当我们比较产生相同价值的产品时才有意义。实际上，这并不会发生，因为嵌入新知识的出版物具有不同的价值。它们的价值取决于对科学进步的影响。作为影响文献计量学家的代表，尽管本指标的限制（负引文，网络引用等）（Glauml;nzel2008）也是采用单位出版物引用的数量。事实上，引文确实证明了传播知识，创造知识溢出效益的条件。因此，引文代表了产出价值的代理衡量标准。每个引文也可以给予不同的权重，取决于引用文章的影响，根据引用的引用次数来衡量。

通过现场比较单位的生产力不足以避免排名扭曲。事实上，引文行为在各个领域都有所不同，属于特定科学领域的研究人员也不可能在该领域外发表（典型的例子是统计学家，谁可以将统计学应用于医学，物理学，社会科学等）。为此，文献计量学家对每篇出版物的引用文件进行标准化，对于同一年和同一主题类别的所有出版物的引文分布引起的缩放因子.2已经提出并采用不同的缩放因子来实现归一化引文（平均值，中位数，归一化分布的z分数等）。因为跨学科工作在评估中可能容易受到误导分类系统（Laudel和Origgi 2006）的困扰，很少有学者根据引用文献的参考文献数量（Pepe和Kurtz 2012; Leydesdorff和Bornmann 2011）提出引文归一化。

在生产要素方面，再次出现难以估量的困难。劳动生产要素的确定及其价值和份额的计算是强大的（考虑量化积累的知识或单位共享的科学仪器的价值）。此外，根据评估工作的目标，隔离和检查对因素产出的贡献有时是有用的，这些因素与被检查单位的工作人员的能力无关（例如，按规模返还范围，可用资本等）。

全要素研究生产力

因此，总生产要素的生产率不容易衡量。学者们使用两种传统方法来衡量全要素生产力：参数和非参数化技术。

参数方法基于功能的先验定义，该功能可以最有效地表示特定生产单元的输入和输出之间的关系。这些估计过程的目的是确定描述生产函数的回归方程的系数（模型参数），通常是Cobb-Douglas类型方程。这种方法的主要局限性在于需要对描述生产函数的封闭模型进行预先定义：这就需要对输入和输出之间的关系做出假设，例如假定加法输入而不是连接两个值的线性函数。此外，参数化技术无法识别基准最佳实践，而是在选定的输入级别定义预期（或最佳）性能。

另一方面，非参数化方法的目的是比较经验测量的生产单位的绩效（俗称决策单位，DMU），以便确定一个“高效”的生产前沿，包括最亲电感DMU。根据距离边界的最小距离，该边界的重建对于评估其他DMU的低效性是有用的。非参数方法的主要优点可概括如下：

具有多个输入和输出的复合生产系统通过单个全局效率值（即全要素生产力）进行评估，而无需任何预定义的加权因子;

B、需要建立无功能关系来定义生产过程，也不需要优化或估算过程;

C、从实际测量的DMU获得效率系数计算的前沿 - 换句话说，比较是用作最佳实践参考的实际生产单位。

对于这两种方法，正确识别输入和输出指标对于模型应用的可靠性至关重要。

鉴于所描述的两个模型的特征，非参数方法通常在新知识生产的背景下更为可取。

文献中最常观察到的非参数方法之一是DEA。 DEA被开发为用于评估工业生产系统效率的技术（Charnes等人，1978; Banker等人，1984），并且具有非常有限的适用性假设：

DMU的均匀性 - 生产单位必须生产相同类型的商品或服务使用相同类型的资源;
分析集的凸度 - 边界包括有效单位的所有可能的线性组合;
免费一次性，意味着无需花费资源就可以消除资源。

有两种DEA应用模型：面向输出和面向输入。在前者中，与边界的效率偏差被评估为可用输入允许的所有输出的最大等比例增加。这种模式特别适合科学研究，因为总体而言，总体目标不是在保持不变生产的同时减少投入，而是通过现有资源最大化生产。 DEA方法包括两个不同的缺席模式（CRS）或存在生产要素（VRS）规模的回报。当不是所有DMU都以最佳规模运行时，CRS规范的使用将导致技术效率（TE）的测量，这些措施会被规模效率（SE）所混淆。使用VRS规范将允许计算缺乏这些SE效果的TE。可以通过将两个模型应用于相同的数据集来提取SE。计算边界和DEA效率指标的问题可以通过线性规划来制定，并且可以通过使用专门开发的软件（如多特蒙德大学开发的效率测量系统（EMS））轻松解决。在任何情况下，使用DEA方法都应得到技术方法意见的支持，这可以帮助正确解释由此产生的任何结果。首先，DEA纯粹是确定性的：任何偏离边界都与低效率有关，不可能考虑可能影响结果的偶然因素或外部噪声。其次，计算的效率度量仅适用于模型测量和使用的变量。在代表总生产力的措施的同时，这些价值主要取决于变量的选择，因此可能无法对DMU的效率进行全面的代表性评估，尤其是因为重要的投入或产出因素可能被忽视。在具有DEA模型的大学生产绩效文献计量型测量的具体情况下，可能会出现如下情况：（在输入方面）时间在研究与教学之间或不同的时间之间分配不一致模型中忽视的研究类型（基本/应用）或生产要素是非均质的，如科学仪器或非就业人员（博士生，外部合作者）; （在产出方面）研究人员有不同的倾向，将其结果以不同于出版物的形式进行编纂，或者存在分歧3或范围经济。

总要素生产率的测量需要以分析为单位的不同生产要素的信息。研究管理人员通常不是总体因素研究生产力，而是很有兴趣测量和比较简单的劳动生产率，即单位劳动生产总值，所有其他生产要素相等。下一节将介绍这种分析的要求。

研究活动和FSS的劳动生产率

在衡量劳动生产率的情况下，如果每个单位有生产要素有差异，那么就应该规范化。不幸的是，相关数据不容易获得，特别是在个人层面。因此，经常必要的假设是相同领域内的单位可用的资源是相同的。进一步的假设，除非有具体数据可用，否则是研究的时间对于每个人来说，或多或少相同。最后，就产出而言，研究人员的价值并不是没有分化的，反映在不同的劳动成本之间，研究人员在单位内部和之间都有差异。为了衡量成本效益或研究单位，应该通过劳动成本来规范其产出。在意大利大学的

剩余内容已隐藏，支付完成后下载完整资料

资料编号：[28053]，资料为PDF文档或Word文档，PDF文档可免费转换为Word

原文和译文剩余内容已隐藏，您需要先支付 30元 才能查看原文和译文全部内容！立即支付

免费ai写开题、写任务书：免费Ai开题 | 免费Ai任务书 | 免费降AI率 | 免费降重复率 | 论文免费排版

注册

找回密码

您如何定义和衡量研究生产力？外文翻译资料

您如何定义和衡量研究生产力？

引言

研究活动的生产力

全要素研究生产力

研究活动和FSS的劳动生产率

您可能感兴趣的文章

登录

注册

找回密码

您如何定义和衡量研究生产力？

引言

研究活动的生产力

全要素研究生产力

研究活动和FSS的劳动生产率

您可能感兴趣的文章