衡量个人风险偏好

激励措施被认为是衡量个人风险偏好的黄金标准,但这是正确的吗?

美国德州农工大学

单页 全文

电梯游说

在许多情况下,风险规避是一个重要因素,包括个人关于投资或职业选择的决定,以及政府关于影响环境、工业或健康风险的政策的选择。风险偏好是通过调查或带有真实结果的激励游戏来衡量的。回顾衡量个人风险厌恶的不同方法表明,最佳方法将取决于所提出的问题和研究的目标人群。特别是,经济学家关于激励游戏的黄金标准可能在所有情况下都优于调查。

风险规避的选择和调查措施呈弱相关

重要发现

优点

激励性任务的设计是为了使受试者有动机如实报告他们的偏好,而受试者在调查中歪曲他们的偏好是没有代价的。

奖励性游戏可以提供一种精确的偏好度量,用于区分不同的决策理论,并统计估计主体的潜在价值函数(效用函数)。

调查测量缺乏与理论的明确联系,因此不能以与激励游戏相同的方式构建。

缺点

实验对象可能会觉得激励性游戏很困难或令人困惑,而调查往往更容易理解;对于受教育程度较低的人来说尤其如此。

奖励性游戏在时间(游戏邦注:指令可能很复杂)和金钱(游戏邦注:必须提供奖励)方面的管理成本很高。

很难调整激励游戏来代表不同的决策环境,而调查更容易适应。

作者主要信息

在度量风险厌恶时,重要的是要仔细考虑度量的目的、替代度量的成本以及目标应答者的能力和经验。激励性任务提供了更精确的衡量标准,但执行起来成本很高,而且对某些受试者来说可能难以理解。调查措施实施起来更容易,成本更低,对非金融领域可能更好,但可能不够精确。总的来说,证据并不支持在所有(或大多数)情况下激励任务优越的普遍信念,这意味着调查可能会在某些情况下增加使用。

动机

衡量风险厌恶程度很重要。关于个人风险偏好(风险厌恶或风险容忍)的假设为投资、储蓄、信托、工人补偿或职业选择等领域的决策行为理论模型提供了基础,并为环境监管、职业安全、健康政策或社会安全网等领域的政策建议提供了基础。个体和群体之间风险偏好的差异与退休储蓄不足、信用评分差、收入的性别差异、职业之间的工资差异模式、娱乐性药物的使用以及不愿投资新技术等行为有关。减少危险或伤害的风险是许多甚至大多数监管政策的主要焦点,对总体风险厌恶的估计在确定适当的风险降低水平方面起着重要作用。

这些行为的理论模型依赖于对政策相关校准偏好的经验估计。测量偏好的方法主要分为两大类:(i)自我报告的调查措施,受试者报告他们对自己的风险承受能力的看法或报告从事特定行为的可能性;(ii)激励任务或游戏,受试者评估或在风险选项中做出选择。调查依赖于自我感知,其准确性取决于自我意识和诚实的报告。因此,从直觉上看,激励选择优于调查似乎是合理的,因为参与者做出的决定会产生实际的后果。但令人惊讶的是,几乎没有证据支持激励措施在这些措施的一致性和稳定性或它们与实际风险行为的相关性方面的优势。此外,对于偏好是否像个性一样是个体固有的、稳定的属性,或者它们是在生命周期中进化的,还是对特定类型事件的反应,我们知之甚少。如果偏好是可塑的,那么影响偏好的因素才刚刚开始被探索。

讨论利弊

经济学家如何应对风险厌恶

理性行为者模型在经济学中普遍存在,并在入侵其他社会科学方面取得了一些成功。在这个模型中,参与者被假定有一致的偏好,并在现有的约束条件下做出最能满足这些偏好的选择。用激励任务来衡量个人的风险偏好需要构建一组决策供被试做出。为了准确地捕捉个人偏好,构成衡量标准的决策应该具有真实的财务后果,以便受试者在回报中体验相关的收益和损失。例如,在风险较高、预期收益较高的赌博(比如有50%的机会赢得100美元或0美元)和风险较低、收益较低的赌博(比如有50%的机会赢得70美元或20美元)之间做出选择,选择后者意味着更大的风险厌恶。理论指导决策集的构建,以便选择揭示主体的潜在风险承受能力。然后,受试者在这些任务的构建集中做出的决策展示了“揭示的”偏好,并可用于评估实用功能框架中的风险容忍度。

如上所述,偏好是通过两种主要类型的程序来衡量的:调查问题和激励任务。在心理学、社会学和政治学等学术领域,最常用的方法是调查法。假设性问卷也是金融服务行业的选择方法。例如,风险容忍度可以通过要求受试者报告他过去的风险行为,或者他对自己冒险欲望的看法来评估,然后从一系列答案中构建一个指数。通过测试调查项目如何共同形成一个连贯的测量,通过在不同样本上重复测试,以及通过检查这些测量与它们应该预测的行为之间的相关性,来评估可靠性和有效性。因此,调查措施基本上是经验性的,通过寻找彼此相关的问题而发展起来,这些问题在直觉上似乎捕捉到了所需的结构。

相比之下,经济学家更倾向于理论上优雅的衡量标准。[1]),但可能没有注意到一个学科所面临的困难(缺乏经济学和数学方面的训练),他们必须理解复杂程序中的激励结构,才能做出正确的决策[2]

经济学家倾向于选择这些激励措施,因为在没有激励的情况下,受试者可能会歪曲他们的偏好。经济学家通常更倾向于所谓的“激励相容”机制,以诱导人们说实话。事实上,如果没有激励,歪曲自己的偏好几乎没有什么代价。可以想象,一个实验对象可能会说谎,以使其他实验对象或实验人员对他有好感,甚至是为了增强自己的自我形象。但当决策牵涉到金钱时,失实陈述的代价就会更高。显然,在选择具有社会可取性因素的条件下,激励可能会对偏好诱发程序的结果产生实质性的影响。为了说明这一点,衡量利他主义是社会可取性可以发挥作用的一个例子。如果一个人被问到在1-10的范围内他们是多么善良或无私,他们可能会声称自己是一个伟大的恩人。但是,如果给这个人100美元,并问他希望向慈善组织或另一个人捐赠多少,他声称的利他主义可能会消失。在后一项任务中,为了表现出利他主义的偏好,被试者实际上必须放弃金钱。

目前还不清楚冒险是否具有同样的社会可取性,但在某些情况下确实如此。因此,例如,当有美女观察时,男性会冒更大的风险。

现在,假设有人想衡量一个人的冒险倾向。一项调查可能会要求受试者自我报告以前的风险行为,或者评估他们自己对风险选择的偏好。另一种方法是,激励启发程序将受试者置于精心控制的环境中,让他们做出涉及重大利害关系的选择。为了表现出风险厌恶,主体必须以较低的预期收益的形式为此付出代价。这种推理使持怀疑态度的社会科学家相信,受到激励的任务更有效、更可靠。然而,很少有研究试图通过经验来测试哪些偏好措施优于其他措施,或者甚至探索判断优势的标准。

调查措施

若干调查措施可分为单问题措施和多问题偏好指数。两者都被广泛使用。最广泛采用的单一问题是为德国社会经济小组(GSOEP)调查开发的,并要求受试者在0到10的范围内对自己进行评分,以确定他们是喜欢避免风险(=0)还是喜欢冒险(=10);英国家庭纵向调查也使用了类似的问题。这些领域一般性问题已被证明与自我报告的行为和许多领域的偏好呈正相关,并与激励任务中的行为呈正相关[3][4][5]

Zuckerman感觉寻求量表是一种早期的多问题调查量表,它通过刺激和冒险寻求、体验寻求、去抑制和无聊敏感性等子量表来评估风险偏好,并已在数百项研究中使用。为了进一步探索跨领域偏好的可变性,2002年的一项研究随后开发了一个特定领域的风险承担(DOSPERT)量表,明确考虑了风险可能重要的几个领域[6].它评估了财务决策(分别针对投资与赌博)、健康/安全、娱乐、道德和社会决策领域的风险感知和风险偏好。这项调查使用评级量表,要求受试者指出他们认为某项活动的风险有多大(例如,在赛马上赌一天的收入),然后报告他们参与这项活动的可能性有多大。将这些答案组合起来创建特定于领域的和通用的索引。

鼓励措施

已经开发了几种激励措施,使用不同的策略来确定个人的风险厌恶程度。这些方法包括评估任务、选择任务和框架增量任务。

估值

评估风险厌恶的估价任务的最早例子采用了在[1]以引出对彩票或赌博的估值(Becker-Degroot-Marschak (BDM)程序)。受试者首先以他们愿意把彩票卖给实验者的最低价格的形式说出彩票的价值。然后从指定的分布(通常是彩票中低回报和高回报奖金之间的均匀分布)中(随机)生成价格。如果规定的最低销售价值低于随机生成的价格,则受试者以该价格出售彩票,该价格构成受试者的收益。如果指定的价值大于生成的价格,则受试者保留(并玩出)彩票以确定她的收入。这种方法直观地吸引了经济学家;这是激励相容的主体揭示她的真实价值,因为这个价值不影响潜在的销售价格的商品。典型的BDM任务将引出一组10-20张彩票的值,受试者指示每个彩票的估值。然后,这些数据将被用来评估风险厌恶程度。

选择

已经开发了几个任务,使用彩票之间的选择。在这些被广泛采用的方法中,受试者在成对的彩票中做出10个选择(霍尔特劳瑞(HL)程序)[7].选择集的结构是为了产生效用-函数风险规避参数的相对精确的度量。每个二元选择都在低风险和高风险彩票之间,每个彩票都有高和低奖金;在彩票中赢得较高奖金的概率从0%到100%不等。低风险选择的数量被用作汇总度量,数字越高表明风险厌恶程度越高。完整的选择集提供了大量的信息,可以用来估计效用函数的结构模型。这种优雅的风险厌恶衡量标准在理论上是合理的,受过良好教育的个人也相对容易理解。它在实验经济学中得到了广泛的应用,无论是在实验室还是在实际领域,它的局限性仅仅在于它的复杂性,这可能使它对受教育程度较低的参与者具有一定的挑战性,如[2]

埃克尔和格罗斯曼(B/EG)在宾斯旺格早期工作的基础上提出了第二种更简单的选择方法,向受试者展示了一组高回报和低回报机会均等的赌博,并要求他们选择自己喜欢的选项[8][9].这样的赌博会决定收益。特别是在最新的EG版本中[2]在美国,受试者可以从六种彩票中做出选择,这些选择的结构是这样的,即受试者选择的彩票表明了某种程度的风险厌恶。第一种彩票是无风险的(受试者的收入是固定的,因为高收益和低收益是相等的)。接下来的四次抽奖增加了期望值和方差。最后一张彩票的期望值与第五张彩票相等,但方差更高;只有当受试者有风险偏好时,才会选择摇号。这一措施之所以吸引人,一方面是因为它的简单性(50/50的赌博相对容易理解),另一方面是因为它可以识别出寻求风险的人。

HL是有时被称为“多重价目表”(MPL)引出方法的一个例子[10].当考虑到这个任务的一个简单版本时,这个术语是有意义的,在这个版本中,受试者不是在彩票之间做出一系列的二元选择,而是在单一彩票和一系列价格之间做出一系列选择。考虑一个有50%机会获得100美元的彩票。受试者可能会在10美元、20美元、30美元、40美元等的确定性和彩票之间做出一系列选择。价目表。当受试者从确定的金额转向彩票时,给出了对彩票的估值,以及对风险厌恶程度的估计。

框架式增量任务

另一种简单的方法是模拟投资决策,给受试者一笔固定的捐赠,其中任何一部分都可以投资于风险资产(Gneezy potter (GP)程序,见[11]).资产回报是投资的2.5倍,概率为50%,否则为零。风险厌恶程度是由受试者的配置来衡量的,投资越多表明风险厌恶程度越低。对于受试者来说,这是一个更自然的任务,并且可能因此而有用。另一方面,这种方法无法识别寻求风险的主体,因为风险中性的收益最大化者会将一切投资于资产。

最后,所谓的“炸弹”任务将风险选择设定为一种投资,但受试者指定了一些要收集的盒子,其中一个可能包含炸弹[12].受试者从每个盒子中获得正收益,但如果任何盒子中包含炸弹,则收益为零。一个非常类似的“气球”任务是让受试者决定向一个可能破裂的气球吹多少次气;再一次,收益随着吹气次数的增加而增加,但如果气球爆炸,收益为零。风险态度是通过要求受试者预先指定一些盒子或泡芙来引出的。这个任务是直观的,并且具有保持一种风险“感觉”的优势。

比较不同的测量方法

一般来说,很容易实施测量风险厌恶的调查方法,并且受试者似乎能够毫无困难地回答这些问题。调查方法的主要缺点似乎是经济学家不相信这些方法,因为调查对象没有任何利害关系。它们也不能产生足够精确的信息来估计效用函数的参数,从而限制了它们在结构建模中的用处。

虽然心理学家和经济学家都认为风险厌恶是一种稳定的特质,并适用于各个领域,但很容易想象有人做出保守的投资选择,但喜欢冒险的运动或健康行为。由于这个原因,领域通用度量可能不能很好地预测跨领域。这就是DOSPERT量表的吸引力所在。不过,值得一提的是,即使是特定于领域的措施也不是万灵药。虽然该量表已经在学生和成人人群中进行了测试,但相关领域可能因人群而异,因此问题甚至领域可能需要修改才能与人群相关。

经济学家提出的激励措施既聪明又有前途,但它们的使用并非没有争议。所有这些任务都是基于人们重视金钱的想法,但是随着收入的增加,额外收入的主观价值会下降。这一假设意味着决策者将厌恶风险。但在这种情况下,风险厌恶有一个特殊的定义:它意味着决策者会避免方差;也就是说,对于给定的平均回报,受试者会更喜欢结果变化较小的赌博或投资。各种巧妙的任务已经被开发出来,有些简单,有些复杂,并且在易于理解和测量的复杂性或理论精确性之间存在权衡。也许这些方法最大的问题是,它们往往没有考虑到人们(不是学者)是如何做决定的。一种在理论上可能对经济学家非常有吸引力的方法,必须以一种允许他们进行设计者期望他们进行的推理的方式向受试者解释。虽然大学生相对容易做到这一点,但对于数学熟练程度较低或对基本经济概念不太熟悉的个人来说,这可能是一个重大挑战。此外,在预测风险行为方面,这些结构化的激励方法是否确实更有效,这个问题仍在探索中。

例如,从评估任务开始,复杂的两阶段BDM方法甚至可能使相对复杂的对象感到困惑。虽然这种方法的设计是为了激励受试者如实透露他们在给定赌博中的货币价值,但他们可能不明白这是真的。个人习惯于将价格作为谈判的起点,因此可能会夸大他们的彩票价值,从而导致风险偏好的推断。事实上,这种方法通常会产生偏好的风险偏好估计,而没有其他方法能做到这一点。有可能第二阶段的价格生成导致受试者相信他们的估值应该取决于可能的价格范围,而不仅仅是他们面临的彩票属性,从而使估值向上倾斜。

选择任务似乎避免了这个问题。上述的选择方法对于被试来说是比较容易理解的,可能HL是例外。在选择任务中,一般受试者都是厌恶风险的——有些人说“太”厌恶风险了——很少有受试者是寻求风险的。比较基于选择的任务、HL和B/EG方法,更简单的B/EG方法是一个更粗略的度量。它的选项数量少,意味着被分类到更少的“箱子”中,但由于误解的范围更小,它的准确性可能更高。HL有一个更精细的分类,但由于它需要对概率有更深入的了解,它可能会产生更多的错误,使得个体和群体之间的差异更难以发现。更糟糕的是,由更复杂的任务产生的错误不仅可能产生中性噪音,而且偏差还会引发偏好。当然,MPL方法可以设计成简单的或复杂的,可以有很少的或很多的类别。它们也可以在迭代框架中呈现,在后续任务中网格变得更精细。

最后,增量任务往往更直观,因为他们的上下文框架。这个框架比中性框架的MPL任务更容易让受试者在认知上处理决策。GP任务被设定为对风险资产的投资,因此很可能仅仅由于这个框架而与实际投资行为相关联。炸弹和气球任务也被定义为真正的任务,并被证明与各种领域(如健康或娱乐)的风险承担相关。然而,这些任务中的行为需要多轮计算机化测试,并且决策的强大框架(包括炸弹或气球)可能意味着行为不太可能与财务决策或其他重要的经济决策相关。任务的领域可能会影响其推广到其他领域的行为的能力。因此,框架可能有助于降低被试决策的认知负荷,但同时也限制了决策的泛化能力[13]

在比较不同方法的研究中出现了一个重要的难题。虽然没有人对所有启发方法进行过全面的荟萃分析,但部分尝试(例如[12]和在线附加参考文献中的论文)得出了一个奇怪的结果:不同的测量方法——无论是基于调查还是基于任务——似乎给出了不同的答案。不仅水平不同,而且各指标之间的相关性也很低。为了澄清,假设一组受试者完成了几种不同的风险厌恶激励和调查措施。一段时间后,同样的受试者回来重复这些任务。因为所有的任务都是为了测量效用函数的曲率而设计的,所以所有的测量都应该给出相同的答案,无论是跨测量还是跨时间。但有相当多的证据表明,它们并非如此。

1962年的一篇论文(见[2](详情)是第一个表明学生受试者的风险承受能力因启发程序和反应模式而异的研究。这项研究之后,在20世纪80年代和90年代进行了许多其他研究,记录了不同测量方法的不一致性。这个行业迟迟没有领会到这一信息。非实验经济学家的典型反应是,实验肯定出了问题,但结果却一再被重复。有人可能会问,这一证据是否意味着经济学家的风险厌恶概念需要稍加改进。

2010年的一项研究对大约1000名加拿大成年人进行了几种不同的风险规避措施[2].采用了B/EG和HL方法,这两种方法都涉及彩票选择,因此具有相似的响应模式,相似的赌注平均约为75美元。两项指标的相关系数为0.38。虽然这是令人鼓舞的,但相关性与1有很大的不同,如果两个任务测量相同的潜在效用函数,它应该取的值是1。

个体差异

风险偏好因性别、年龄和文化环境的不同而系统性地变化。一般来说,女性比男性更厌恶风险,尽管差异并不大。性别差异在各种测量中都有发现,尽管在某些方面比其他方面更明显。风险偏好的性别差异与大学专业和职业的选择有关;投资组合和退休储蓄的性别差异归因于风险厌恶的差异。年纪较大的决策者在投资方面往往更能承受风险,但这很难与财富差异分开。很明显,富有的人应该更有风险容忍度,尽管这可能是由于更大的承受损失的能力,而不是风险厌恶程度的差异本身

越来越多的证据表明,文化差异在很大程度上影响了人们的偏好[4].也有证据表明,女性和男性在母系文化中角色互换,女性比男性承担更多风险。这些研究表明,文化可能在塑造风险承受能力方面发挥重要作用,并淡化了先天与后天辩论中先天的部分。

认知能力也可能在激励任务中形成诱导的风险偏好方面发挥作用。许多研究发现,更大的风险厌恶与较低的认知能力有关。最近的一项研究回顾了这些发现,并提出了新的数据,表明风险规避和认知能力之间的相关性可能是一种错觉,这种错觉是由不同的启发方法所产生的错误类型引起的[13].这强化了一个观点,即必须在偏好引出中小心谨慎,以确保受试者在认知上能够理解任务。有证据表明,如果受试者完全理解任务,认知能力不太可能起作用[2]

限制和差距

如果偏好是稳定的行为特征,那么它们不仅应该在领域上稳定,而且应该在时间上稳定。然而,来自大量研究的证据表明,风险偏好可以通过两种方式随着时间的推移而改变。首先,接触不同的环境会逐渐改变偏好。其次,风险偏好的变化可能发生在重大生活事件之后,如自然灾害或金融崩溃,而且,短期和长期后果也可能不同。证据进一步表明,在负面事件发生后,人们似乎在寻求风险,因为他们试图重新获得灾难前的参考点。然而,在尘埃落定,结果得到解决之后,人们在重大负面事件之后变得更加厌恶风险。需要进一步的理论发展和测试来理解偏好的演变。

激励风险措施在特定情况下的外部有效性也受到一些关注,重点是保健和个人理财等具体领域。这些研究的主要缺点是它们倾向于采取零碎的方法,只针对相关的生命活动测试一种测量方法,因此缺乏普遍的相关性。

调查措施的外部效度也一直是大量研究的目标。最近的两项调查将一系列风险规避项目和任务纳入全国代表性调查,并将这些措施与各种领域的自我报告风险行为联系起来。第一个是GSOEP的首选项模块的一部分。对这项调查的评估结论是,提倡在大规模调查中使用简单的、基于调查的方法来激发偏好,认为激励性MPL措施不值得投入时间和成本来实施[4].另一项研究报告了英国家庭纵向调查的类似练习[5].它直接比较HL和B/EG引出以及一般领域和特定领域的调查项目。这些结果相互比较,并在一年之后进行引出。所有的测量在一年后都显示出很强的重测信度,并且在某一时间点上彼此之间都有显著的相关性。然而,不同领域的外部效度测试显然是混合的。没有任何一项措施能主导其他措施,在大多数情况下,调查问题的表现并不比激励措施差。这对提倡使用激励措施的经济学家来说并不是特别好的消息,但它确实表明,低成本的替代方案可能具有衡量偏好的合理用途。

总而言之,尽管有许多研究,但对于激励措施是否值得以及何时值得花费额外的时间和精力来使用它们,陪审团仍然没有定论。

摘要及政策建议

自然会出现这样的问题:哪一种方式是引发风险偏好的“最佳”方式?有没有更好的方法?这取决于研究对象的特征吗[2]或者在考虑的域上[6]?激励水平对衡量的准确性有影响吗?调查和激励任务一样好吗?

值得注意的是,在目前的讨论中,缺乏对激励措施总是更好的概念的有力支持。的确,有相当多的证据支持调查措施的成本效益和效力。虽然在衡量风险厌恶程度方面,激励措施似乎更有优势,但从证据来看,这种说法并不正确。

产生这些结果的一个重要因素可能是这些措施本身。经济学家倾向于设计从理论角度来看很有吸引力的措施,但这些措施不一定考虑到没有博士学位的个人完全理解他们必须做出的决定的能力。可能是这样的情况:考虑到人的局限性和理论上的考虑而设计的测量方法可以更好地准确地引出偏好。

另一个值得一提的问题是,预期效用理论产生的风险概念与外行人对风险含义的理解大不相同。经济学家对风险的概念更接近于“方差厌恶”,与字典上的定义相距甚远,后者关注的是危险或重大损失的可能性。可能是研究对象在回答调查问题时自然地想到了这个概念的外行版本,并没有将冒险等同于在期望值和方差不同的赌博中选择的那种风险。如果这是真的,那么调查问题在预测各种领域的风险行为方面做得更好也就不足为奇了。在个人日常生活中所面临的各种风险选择中,方差厌恶可能起不了多大作用。

也就是说,应该注意使用正确的工具来完成正确的工作。很明显,在个人层面上,风险作为方差厌恶的评估可能与涉及金融决策和投资的决策环境相关。为此目的调整和使用激励性任务是很有意义的。评估选民为减少政策领域的各种风险而付费的意愿,也可能是应用激励诱导方法的良好场所。但对于许多其他应用,应该认真考虑低成本、实用的替代方案。精心设计的个人偏好调查措施至少与理论上优雅的激励措施一样有效,而且实施成本要低得多。

致谢

作者感谢匿名审稿人和IZA劳动世界编辑对早期草稿的许多有益建议。作者以前的工作包含大量的背景参考资料在这里提出的材料,并已在本文的所有主要部分密集使用(见[2][9],以及在线附加参考资料)。

相互竞争的利益

IZA劳动世界项目致力于IZA行为准则.作者声明已经遵守了代码中概述的原则。

©Catherine C. Eckel

证据地图

衡量个人风险偏好

完整的引用

完整的引用

数据源(年代)

数据类型(年代)

方法(年代)

国家