绩效衡量和工人生产率

选择正确的绩效指标可以为政策和管理决策提供信息和改进

瑞典斯德哥尔摩大学,德国IZA,荷兰教育和劳动力市场研究中心

单页 全文

电梯游说

衡量工人的生产率对公共政策和私营部门的决策很重要。由于缺乏可靠的方法来确定员工的生产力,公司通常使用特定的绩效衡量标准,比如不同的激励措施如何影响员工的行为。公共部门还利用这些措施监测和评价教师等人员。为了选择正确的绩效衡量标准,从而设计更好的雇佣合同并提高生产率,政策制定者和管理者需要了解现有衡量标准的优缺点。

越来越重视对工人生产率的直接衡量

重要发现

优点

绩效评估提供了有关工人生产力的详细信息。

为了解答诸如激励机制如何运作、同伴效应如何运作、员工如何积累人力资本等一系列问题,绩效评估可能会很有用。

需要可靠的绩效衡量来设计适当的合同和提高生产率。

对于低技能和高技能工作以及私营和公共部门的工作,越来越多地采用业绩衡量方法。

缺点

工人生产率没有统一的定义;工人生产率的衡量标准通常取决于收集数据的环境。

工人的生产率通常是多维的,但通常不可能测量所有的维度。

如果选择了错误的绩效衡量标准来评估员工,扭曲就会对员工的生产力产生负面影响。

对于只能在团队层面观察到绩效的设置,并不总是能够估计个人对团队生产力的贡献。

作者的主要信息

对员工生产率的衡量可以让我们深入了解员工的工作表现以及工作场所应该如何组织。生产率的直接测量被用于研究一系列问题,如激励对工人生产率的影响,同事对行为的影响,或工作中人力资本的积累。对于这些问题和相关的问题,选择合适的绩效指标是很重要的。这一选择至关重要,因为依赖不适当的措施可能导致设计出低效的激励机制、糟糕的雇佣合同或错误的政策结论。

动机

政治家和管理者做出的决定经常会涉及到个人在工作中的行为。例如,管理者决定如何建立最佳激励机制或为员工提供多少培训,而政策制定者则决定工作时间的监管。为了对这些问题做出明智的选择,重要的是要知道这些决定将如何影响员工的行为,就他们的生产力而言。

在过去的十年中,工人生产力的概念已经得到越来越多的关注。直接计量现在普遍用于经济学和相关领域的研究;它们通常被用作工人生产率的近似值。本文描述了如何定义工人生产率,并提供了最新的绩效测量方法的概述,以帮助决策者选择适合他们特定目的的正确方法。

正反两面的讨论

定义工人生产率

在一般意义上,生产率可以定义为产出指标和投入指标之间的比率。因此,工人的生产力可以用产出来衡量,例如销售额或生产单位,相对于投入,例如工作小时数或劳动力成本。传统上,劳动生产率来源于企业层面的综合指标,例如每个工人的增加值。为了解释劳动力投入之间的差异,这一衡量标准通常根据不同的劳动力类型进行细分,例如低技能、中等技能和高技能劳动力。然而,即使在这种分类水平上,劳动生产率的衡量方法也可能掩盖工人基本生产率的巨大差异,无论是在工人之间,还是随着时间的推移。在个人(工人)层面,研究经常使用投入措施,如工人工资,作为生产率的衡量标准。尽管工资与工人个人的潜在生产率相关,但有几个原因导致工资不能直接反映工人的实际生产率。例如,由集体协议产生的制度环境往往根据年龄或任期而不是生产力来决定工资。大多数数据不包含小时工资信息,而是包含月薪信息,这使情况变得复杂。每月工资的变化可能不仅反映了生产率的差异,还反映了工作时间的差异。 Furthermore, wage growth is often determined by supervisor evaluations, which might reflect bias due to gender or migration background.

在评估工人的生产力时,劳动生产率和工资都有各自的缺点。理想情况下,人们希望在每个时间点观察每个工人的生产力。然而,在现实中,很少能以合理的成本在个人层面上观察到产出,因此实际上不可能计算出每个人的生产率。相反,公司使用对员工绩效的个人衡量作为他们生产力的近似值。大多数职业都有一个或多个指标可以用来评估员工的表现。这些指标也被称为“关键绩效指标”(kpi),经常用于企业内部评估和监控。图1展示了来自世界管理调查的证据,说明了企业收集绩效指标并将其用于监控目的的程度。

使用跨国家的直接绩效衡量

在评估工人生产率的措施时,应该满足一组关键的属性:

  • 客观性:对于主管或同事的评分,衡量标准应该是客观的,而不是主观的。

  • 可用性:需要在个人(工人)层面(即不是在团队或公司层面等聚合层面)提供衡量标准。

  • 可比性:任务和测量在不同的工人和时间应该是相同的。

  • 质量和可控性:员工应该对结果有足够的影响力,即选择自己的努力水平。

通过对员工的长期绩效进行精确测量,政策制定者可以解决重要的经济问题,比如激励措施如何影响员工的行为,同事的存在如何影响员工的生产率,或者员工如何在公司积累人力资本。

图2提供了在主要经济学期刊上发表的研究中使用的工人生产率测量的例子,其研究结果可用于为政策制定者和从业者提供信息。这一数字表明,绩效不仅可以衡量具有常规任务的低技能工作,而且还可以衡量知识密集型、非常规职业,如律师、医生或科学家。

衡量工人生产率的例子

衡量工人生产率的利与弊

公司经常用工人的表现来衡量生产力。然而,衡量员工的表现并不总是直接的,甚至不可能以合理的成本来衡量。尽管大多数职业都有一些工人层面的绩效衡量标准,图2这表明没有通用的衡量标准。相反,性能监视的程度取决于设置。

绩效评估包含哪些内容?

员工绩效可以是许多特征的函数,包括员工的努力程度、教育程度、年龄或任期,以及公司的特征,如工作环境、工资或激励。观察到的员工工作表现的变化可能是由多种原因造成的,包括员工无法控制的因素。最常见的两个原因是工人技能的变化,例如由于培训计划或在职学习,以及工人所付出的努力的变化,例如由于管理层设置的不同激励。技术变化也将是一个相关的主题,但由于现有研究的时间范围通常很短(通常是几周),在这些情况下,技术通常被认为是一个常数。

绩效指标在评估员工行为方面的有用性,关键取决于员工对绩效指标的影响程度。如果衡量标准主要是由工人无法控制的因素驱动的,比如客户需求的变化或农业中的天气状况,那么这些指标就不能可靠地预测工人的生产率。尽管任何绩效评估都会包含一些随机变化,但对工人生产率的适当衡量应该根据工人控制范围内的决定因素与不在工人控制范围内的决定因素进行平衡。

多维性能

实际上,仅用一种方法来评估工人的生产力是很困难的。工人的工作可以包括一个或几个任务。大学教授进行研究,参与教学,并执行行政任务。每一个因素都可以根据不同的维度进行评估,例如,通过任务的质量和数量(工人可以工作得快,但质量低,或者工作得慢,但质量高)。可以对每个相关维度的员工进行单独的绩效评估。例如,进行研究的任务可以通过出版物的数量来衡量,但也可以通过出版物的质量来衡量,例如通过期刊的影响因子来衡量。虽然质量和数量是几乎适用于所有任务的维度,但人们也可以考虑其他维度,例如研究的政策相关性。

即使对于单一任务的职业,工人生产力的多维性对于使用绩效衡量来确定政策也有重要的影响。尽管公司看重的是生产力,但员工的评估(和激励)通常是基于具体的绩效衡量标准。由于工人的生产率不是完全可见的,而且人力资源决策通常是基于可观察的绩效衡量标准,因此可能会出现扭曲。例如,如果一家公司只观察一个工人生产了多少总产出,而忽略了产出的质量,就会出现这种情况。基于可观察措施的激励可能导致扭曲,即企业和员工的激励不是完全一致的。虽然公司对两个维度都感兴趣,但员工可能只关注在可测量的绩效指标上表现良好,这与不可测量的绩效指标不一定一致。虽然有可能通过内在激励来缓解这一问题,但如果激励方案设计不当,扭曲就可能产生负面影响。

解决这一激励问题的方法之一是使用替代指标,比如公司层面的增值指标。虽然这些类型的措施似乎解决了扭曲的问题,但对工人产生了额外的风险,因为从个人的角度来看,这些措施不太可控。这个问题展示了一个重要的权衡,一方面是扭曲,另一方面是绩效衡量如何准确地评估员工的努力。

另一种替代一维衡量的方法是主观绩效衡量,如主管评级。虽然这些类型的评估通常只能在年度基础上观察到,并且可能包含主观偏见,但它们可以捕捉到比单一测量所允许的更广泛的表现。

数量与质量

很难为多个性能维度确定适当的度量方法。两个非常常见的维度是工作执行的质量和完成的速度(数量)。例如,如果在制造业中工人的生产率是通过与产出数量相关的测量来分析的,例如每小时生产的产品数量,那么衡量产出质量的合适候选可能是生产的缺陷产品数量,即不良率。

图2展示了一系列主要使用绩效衡量来显示员工工作速度的研究(即基于数量的研究)[1][2][3][4][6].另一组研究采用基于质量或质量调整的绩效衡量方法[7][8][9][10][12].只有少数研究采用了基于不同维度的多种测量方法[4][11]

尽管在不同维度(如质量和数量维度)之间进行权衡并非不可能,但通常存在一些激励措施,以防止员工只将精力集中在其中一个维度上。两者都是明确的激励,例如,如果工人被要求在产品或服务有缺陷的情况下重新完成一项任务,他们就会减少产出[1]隐性激励(例如,如果管理者能够识别出表现不佳的员工,并能够对他们进行制裁)有助于缓解与多个维度相关的问题。

数据源和聚合

大多数使用工人生产率衡量方法的研究使用的数据来自公司,例如公司内部数据库,或公共数据,例如出版物数据库。这些数据可以在个人层面上分析工人的生产力。然而,对于某些工作,员工的表现不能从个人层面来衡量,而只能从一个更综合的层面来衡量。这方面的例子包括依赖团队生产的公司,即由一组工人共同生产产品,或在学术研究中联合发表论文。

在某些情况下,人们关心的是整个团队的产出,而不是个人的生产力。例如,如果有人对团队经理的激励如何影响团队绩效感兴趣,情况就是如此。另外,人们的兴趣可能在于将基于群体的测量与个人贡献分离开来,从而得出关于个人行为的结论。然而,很难可靠地将团队绩效与个人贡献区分开来。例如,如果团队组成不变,从经验上讲,就不可能区分团队成员的个人贡献。如果团队的组成随着时间的推移而变化,例如,当共同作者发生变化时,可以估计每个人对团队整体产出的贡献。

时间维度

直接(即个人)绩效衡量的优势在于,与衡量总生产率或总工资相比,这些指标的出现频率往往更高。图2显示某些选定的度量是按周、天,在某些情况下甚至按秒可用的。

虽然这种程度的细节在管理层面并不总是必要的,但它可以告知一系列研究问题,从而有助于决策过程。与使用较长数据点频率的研究相比,这使得测量时间变化的能力更强。跨时间变化的一个例子来自与工人的努力无关的变化,例如服务部门工作中的客户需求变化,或农业中的天气条件变化。根据设置的不同,考虑这些影响可能很重要,例如通过控制一周中的特定一天。相反,如果生产过程相当不稳定,即如果产出很少发生。在这些情况下,例如科学家的出版物数量,重要的是设置足够长的测量周期。

如何用衡量工人生产率的指标来指导政策?

使用工人生产力衡量标准的研究起源于私营企业的绩效分析,通常关注与人力资源管理相关的问题和决策。这些研究通常使用单个公司的人事数据,被称为“内幕计量经济学研究”。他们利用外生冲击来确定治疗对结果的因果影响,使用绩效衡量作为衡量标准[1][4][6].不断提高的数字化有助于研究人员和管理人员收集绩效数据。事实上,公司收集绩效指标不仅是为了评估员工,也是为了试验和改进与人力资源管理相关的方面。对生产率直接指标的依赖绝不仅限于私营部门。对工人生产率的衡量已被广泛应用于研究和教育、医疗保健和政治等领域图2).

利用工人的生产力来设定激励

大量的研究使用直接衡量员工的生产力,并结合改变组织的激励系统或随机实验来分析激励如何影响个人行为。共同的发现是,金钱激励会影响员工的努力,从而产生更高的绩效。除了对员工内在动机的影响外,激励还会影响员工的分类,这可以解释高达50%的生产率提高[1]

这些类型的研究也被应用于那些主要目标不是利润最大化的组织,如学校、大学,甚至政治。例如,一些研究使用增值措施来分析教师的生产力。教师增值的衡量是基于对学生考试成绩的估计,控制了学生和学校的特点,并捕捉了教师对学生成绩的额外投入[9][10].研究表明,这种对教师生产力的衡量确实可以预测学生日后的成绩,比如大学出勤率和工资[9].在美国的特许学校(接受政府资助,但独立于其所在的既定公立学校系统运作的学校),教师增值措施越来越多地用于评估和激励教师。

在学术研究以及基于企业的研究和开发中,可以获得更直接的工人生产率测量。科学家的工作效率可以根据各种指标来衡量,比如专利统计数据、(经过质量调整的)出版物数量或引用次数[7][8].正如私营部门的经常情况一样,对出版物实行货币激励被证明可以提高研究生产率。

虽然不太明显,但用于衡量工人生产率的相同逻辑几乎可以应用于任何具有某种程度可量化结果的领域。有一类工人很少与生产行为相关,那就是政客。但即使对于这一群体,也有可能构建绩效衡量标准,以证明如何优化设计政治家的薪酬。衡量政客政绩的一种方法是看提交法案的数量和类型[12]

在定义激励制度时,一个重要的因素是绩效评估的时间框架。研究表明,如果评估日期临近,员工可能会为了拿到奖金而加倍努力;或者,如果他们无法获得奖金,他们可能会减少努力。更高频率的绩效测量,例如每天或每周的水平,可以帮助理解个人如何对激励做出反应的动态模式[13]

企业的正式和非正式人力资本获取

对工人生产率的衡量也可以用来估计工人如何积累人力资本。根据绩效评估,在职的非正式学习以及培训项目中的正式学习都可以增加员工的人力资本,从而提高个人生产力。

例如,可以通过分析工作绩效如何随着工作任期的增加而增加来证明这一点。普遍的发现是,在聘用初期,工作表现强劲增长,而终身职位的边际回报则随着时间的推移而下降[2].同样,工人的生产率指标也可以用来评估培训项目的回报[4].在这两种情况下,直接衡量工人的生产力可以估算出学习如何影响个人的工作表现。相比之下,工资通常在短期内是固定的,可能不会表现出这些影响。此外,只有在雇主和雇员共同分享生产率提高带来的好处时,工资才能体现培训的回报。

同伴效应

同伴效应,即由于同事在工作场所的存在而导致员工生产率的变化,是由两种不同的机制驱动的。它们可能是因为社会压力,也可能是因为同伴学习,即溢出效应。尽管人力资本外部性长期以来一直是增长模型的一部分,但工作场所的同伴效应只是在最近几年才得到分析。这在一定程度上可能是由于工人网络的详细信息和他们生产力的详细衡量标准的可用性。这些研究通常利用员工随机接触高生产率同事的环境,来估计私营企业和学校中的同伴效应[3][4][6][10].同伴效应也可以在知识密集型环境中进行分析,比如研究。在足够长的时间内收集的关于研究生产力的非常详细的测量(例如出版物产量和引用),允许估计高生产力的研究人员对其同事的同伴效应[8]

工作时间及表现

工人生产率的直接衡量如何影响政策的另一个例子涉及工作时间。标准工作周的长度在国家之间和国家内部都有所不同。从效率的角度来看,我们对每周的最佳工作时数知之甚少。对工人生产率的直接衡量,使人们能够估计工作时数或工作时间的轮班对工作表现的影响;这可能对健康和安全至关重要。例如,长时间的工作可能会导致疲劳加重,这在医疗行业尤其危险[11].这种类型的结果还可以为是否应该延长或减少工作时间提供直接的建议。

性别薪酬差距

直接绩效评估的一个优点是,它们通常是客观的,因此不太可能受到主观评价的影响。这种客观性在分析劳动力市场上不同群体之间的工资差距时尤其有用,例如男性和女性之间。尽管随着时间的推移,性别收入差距已经缩小,但女性的收入仍然远远低于男性。虽然关于性别薪酬差距存在的原因有很多争论,但了解性别薪酬差距在多大程度上取决于潜在的生产率差异是很重要的。对绩效的直接衡量可以帮助研究性别薪酬差距是否基于生产率的差异,如何解释这些差距,以及绩效上可能的性别差异如何影响职业选择。对律师来说,生产力方面的性别差距在其职业生涯的早期就已出现,并对其收入和职业发展产生长期影响[5].虽然客观的绩效衡量方法可以帮助确定性别差距,但更难评估它们在多大程度上准确反映了男性和女性的不同努力选择,例如,如果员工希望受到歧视。

局限性和差距

很明显,对工人的生产率没有通用的衡量标准。相反,有各种各样的衡量标准来衡量员工在特定环境下的表现。尽管这样做的好处是可以对工人生产率的决定因素进行非常详细的分析,但也有代价。

首先,即使可以对广泛的职业进行绩效衡量,所使用的衡量标准也只是基于单一的工作场所,不能代表整个行业或经济。虽然这些数据允许在相同任务或职业的工人之间进行比较,但几乎不可能对不同职业的工人的表现进行直接比较。但是,可以比较基于几项研究的估计,以得出更有代表性的结论。

其次,许多绩效衡量指标的特殊性使得长期或跨多个国家的比较变得困难。虽然绩效评估通常允许分析每天或每周的员工行为变化,但它们通常只适用于相当短的一段时间[4][6].只有少数研究利用了涵盖数年的较长数据集,以便分析趋势[9].由于这些原因,直接衡量工人的生产率并不总是合适的。相反,工资或企业增加值等其他指标可能更有用。

最后,尽管许多职业都包含一些绩效指标,但这些指标往往只反映了一个方面。在某些情况下,例如在设计和评估激励方案时,由于生产力的多维性,只观察一个绩效指标可能会隐藏员工行为的重要方面。

摘要和政策建议

对工人生产率的直接衡量不仅在人事经济学中使用,而且在教育和卫生等其他领域也使用,而且在私营和公共部门都使用。这些措施有助于让政策制定者了解个人在工作中的行为,并改善决策制定,例如设置适当的激励措施。

衡量工人生产率是经济学研究中一种相对较新的工具。即使没有对工人生产率的普遍定义,使用这些衡量标准的研究已经在广泛的领域做出了重要贡献。这些贡献并不局限于低技能的常规工作,在这些工作中,绩效评估可能更容易。相反,对工人生产率的衡量方法适用于广泛的工作,包括私营和公共部门的低技能和高技能工作。

尽管这些研究通常基于单个公司,不能代表整个部门或经济,但人们可以观察到工人行为的细节,使得研究那些难以用调查或登记数据来解决的问题成为可能。鉴于研究环境的特殊性,要获得更具“代表性”的结果,一个适当的方法是在不同的环境中,例如在不同的公司中,对类似的问题进行研究。然后,元研究可以用来找到一个共识,这可能接近于一个经济体的平均效果。

鉴于目前对使用工人生产率指标的研究状况,政策制定者和管理者都应该选择正确的指标,帮助他们做出明智的决定,例如,在设置和设计激励措施时,或在调节工作时间时。

致谢

作者感谢两位匿名的推荐人,以及IZA劳动世界的编辑们为早期的草稿提供了许多有用的建议。作者也感谢诺拉Döring。

相互竞争的利益

IZA劳动世界项目致力于IZA研究诚信指导原则.作者声明他遵守了这些原则。

©Jan Sauermann

证据地图

绩效衡量和工人生产率

完整的引用

完整的引用

数据源(年代)

数据类型(年代)

方法(年代)

国家