您当前的位置:首页 > 经济管理 > 思考,快与慢

第14章 汤姆的专业

1 4

来看一下这个简单的问题:

汤姆是你所在州主要大学的研究生。请预测汤姆学习以下9个专业的可能性,并进行排序。1表示可能性最大,9表示可能性最小。

工商管理

计算机科学

工程学

人文与教育

法学

医学

图书馆学

物理与生命科学

社会科学与社会工作

这个问题很简单。你立即就知道,不同专业的招生规模是解题关键。你知道,汤姆是从研究生中随机挑选出来的,就像从罐子里取出的一颗弹珠。要确定弹珠是红色还是绿色,你需要知道罐子里两种颜色的弹珠各有多少。某类弹珠的比例称为基础比率。同样,在这个问题上,人文与教育专业的基础比率就是该专业的研究生人数在所有研究生中的比例。在不知道汤姆具体信息的情况下,你会根据基础比率猜测,他就读的专业更有可能是人文与教育,而不是计算机科学或图书馆学,因为人文与教育专业的学生人数比那两个专业多。在没有其他信息的情况下,自然要利用基础比率信息做预测。

接下来的任务与基础比率无关。

汤姆在高中最后一年时进行了一次心理测试,测试的效度不确定。以下是心理学家根据测试结果对其进行的性格描述:

汤姆缺乏真正的创造力,但智商很高。他讲究秩序、思路清晰,追求整洁有序,所有物品摆放得井井有条。他的文章枯燥乏味,老套的双关语和科幻想象力偶尔会让人眼前一亮。他有很强的上进心,似乎对人缺乏同理心和同情心,不喜欢与人交往。尽管以自我为中心,但他的道德感很强。

现在,请拿出一张纸,根据汤姆的性格与各专业研究生的相似度,对前文提到的9个专业进行排序。1表示可能性最大,9表示可能性最小。

你如果快速做一下这道题,就能从本章中汲取更多知识。要做出判断,有必要阅读一下关于汤姆的报告。

这个问题也很简单。它要求你提取或构建不同专业研究生的刻板印象。20世纪70年代早期,该实验首次进行时,受试者的平均排序如下。你的答案可能与此相差不大:

(1)计算机科学

(2)工程学

(3)工商管理

(4)物理与生命科学

(5)图书馆学

(6)法学

(7)医学

(8)人文与教育

(9)社会科学与社会工作

你可能把计算机科学列为首位,因为性格描述中有关于书呆子气的暗示(“老套的双关语”)。事实上,对汤姆的描述正是为了符合这种刻板印象。排名靠前的另一个专业是工程学(“整洁有序”)。你可能认为汤姆不太符合你对社会科学与社会工作专业的印象(“对人缺乏同理心和同情心”)。在我设计该描述之后的近40年来,人们对专业的刻板印象似乎没有什么变化。

为9个专业排序是一项复杂的任务,需要自制力和按次序进行组织安排,只有系统2才能做到。然而,描述中的各种暗示(老套的双关语和其他描述)旨在激活与刻板印象的关联,这是系统1的自动活动。

这项任务要求受试者将对于汤姆的描述与各专业的刻板印象进行比较。就任务而言,描述的准确性(它是不是汤姆的真实写照)无关紧要。你对各专业基础比率的了解也无关紧要。个体与群体刻板印象的相似性不受群体规模的影响。事实上,你可以将汤姆与图书馆学研究生的形象进行比较,不管大学里有没有这个专业。

你如果再次分析汤姆的性格,会发现他很符合小众专业(计算机科学、图书馆学、工程学)而非大众专业(人文与教育、社会科学与社会工作)学生的刻板印象。事实上,受试者总是将这两个人数最多的专业排在最后。我刻意将汤姆的性格设计成“反基础比率的类型”,让其适合冷门而非热门专业。

该实验的第三项任务是按照汤姆就读这9个专业的概率排序。这项任务很重要,是由心理学研究生完成的。他们了解相关统计事实:知道不同专业的基础比率,也知道有关汤姆描述的信息来源不太可靠。然而,我们预期他们只关注描述与刻板印象的相似性(我们称之为代表性),会忽视基础比率和对描述真实性的怀疑。他们会将计算机科学这一小众专业排在第一位,因为它的代表性得分最高。

我和阿莫斯在尤金的这一年,工作非常努力,有时我会在办公室通宵达旦地工作。很多时候,我加班加点是为了设计某种人格描述,使代表性和基础比率相互冲突。我在凌晨完成了对汤姆的描述。那天早上,第一个来上班的是我们的同事兼好友罗宾·道斯,他是经验丰富的统计学家,对直觉判断的有效性持怀疑态度。如果有人了解基础比率的相关性,那人一定是罗宾。我把罗宾叫过来,给他看了我刚打印的问题,让他猜测汤姆的专业。我还记得他试探着回答时露出的狡黠微笑:“计算机专业?”那一刻真开心!连专家都落入了陷阱。当然,我一提到“基础比率”,罗宾就立即意识到自己的错误,但他并没有自然而然地想到这一点。尽管他比别人更清楚基础比率在预测中的作用,但看到个性描述时,仍忽视了基础比率。不出所料,他预测的是代表性,以此替代了要回答的概率估计。

我和阿莫斯收集了3所主要大学114名心理学研究生的答案,他们都上过几门统计学课程。结果没有让我们失望。他们对9个专业的概率排序与刻板印象相似性的排序一致。在这个案例中,替代不折不扣地发生了:没有迹象表明,受试者除了预测代表性之外,做了其他事情。关于概率(可能性)的问题很难回答,但关于相似性的问题比较简单,于是人们就回答了简单的问题。这是一个严重的错误,因为相似性判断和概率判断遵循的是不同的逻辑规则。相似性判断不受基础比率和描述错误的影响,但在概率估计中,忽视基础比率和证据质量的人注定会犯错。

“汤姆就读于计算机科学专业的概率”并非简单的概念。逻辑学家和统计学家对其意义有不同的看法,也有人说它根本没有意义。对许多专家来说,概率是对主观信念度的测量。有些事你确定无疑。比如,今天早晨太阳升起了。有些事你认为不可能发生,比如太平洋突然全部冻结。还有很多事你将信将疑,比如邻居是计算机科学家。这就是你所认为的事件发生概率。

逻辑学家和统计学家争相确立概率的定义,所有定义都非常精确。然而,对外行来说,概率(在日常用语中,其同义词是“可能性”)是一个模糊的概念,与不确定性、倾向性、可信性和出乎意料等词汇有关。模糊性并非概率所特有的,也不会让人感觉特别麻烦。在使用“民主”或“美丽”这类词时,我们或多或少知道自己的意思,谈话对象也或多或少理解我们要表达什么。多年来,我向人们提出有关事件概率的问题,从没有人举手问我:“先生,你说的概率是什么意思?”但如果我让他们评估一个陌生的概念,比如“全球性”,他们肯定会举手发问。每个人都貌似知道怎样回答我的问题,尽管我们都明白,要求他们解释概率的含义是不公平的。

被要求预测概率的人不会被难倒,他们不会以统计学家和哲学家使用概率的方式来判断概率。关于概率或可能性的问题会激活思维霰弹枪,让人们想到某个更简单问题的答案。其中一个简单的答案是自动评估代表性——这是理解语言的一贯做法。“猫王的父母希望他成为一名牙医”,这个(杜撰的)说法有点儿好笑,因为人们会自动想到猫王和牙医的形象差异。系统1会在无意中产生相似的印象。当有人说“她会赢得竞选,你将看到她获胜”或“他不会成为学者,他的文身太多了”时,就涉及代表性启发式。我们根据候选人下巴的轮廓或演讲的自信程度来判断其潜在领导能力时,依赖的就是代表性。

尽管通过代表性进行预测很普遍,但这并不是统计学上的最优选择。迈克尔·刘易斯的畅销书《点球成金》讲述了这种预测模式的低效。职业棒球星探通常根据球员的体格和外貌预测他能否成功。书中的主角比利·比恩是“奥克兰运动家”棒球队的经理,他做出了一个另类的决定——不采纳星探的做法,而是根据历史表现的统计数据来挑选球员。该队选择的球员成本都不高,因为他们的外表不符合要求,被别的球队拒之门外。但这支球队很快以低廉的成本创造出非凡的战绩。

用代表性来判断概率有一大优势:它产生的直觉印象通常比靠运气猜测的更准确。

· 在大多数情况下,表现友善的人实际上就是友善的。

· 又高又瘦的职业运动员更可能是打篮球的,而不是踢足球的。

· 拥有博士学位的人比只读了高中的人更有可能订阅《纽约时报》。

· 小伙子比老妇人更有可能飙车。

除了上述情况,在许多情况下,代表性判断所依赖的刻板印象也都不无道理,遵循这种启发式做出的预测很可能是正确的。但在某些情况下,刻板印象是错的,代表性启发式会造成误导,让人忽视做出其他判断的基础比率信息。即使启发式有一定的效用,只靠它做预测也是违反统计学逻辑的重大错误。

代表性的第一宗罪是,倾向于预测不太可能发生的(低基础比率)事件。举个例子:你在纽约地铁里看到某人在阅读《纽约时报》。以下哪种描述更适合这个陌生人?

她有博士学位。

她没有大学文凭。

这个例子来自Max H.Bazerman and Don A.Moore, Judgment in Managerial Decision Making (New York: Wiley, 2008)。

代表性告诉你选第一个,但这个选择并不一定明智。你应该认真考虑第二个,因为在乘坐纽约地铁的人群中,没有大学文凭的人远多于有博士学位的人。一位女士被描述为“羞涩的诗歌爱好者”,如果让你猜测她的专业是中国文学还是工商管理,你应该选择后者。这个例子来自Max H.Bazerman and Don A.Moore, Judgment in Managerial Decision Making (New York: Wiley, 2008)。即使中国文学专业的女生都很腼腆,也都喜欢诗歌,但几乎可以肯定的是,在热门的工商管理专业中,有更多羞涩的诗歌爱好者。

在某些条件下,未受过统计学训练的人也会使用基础比率进行预测。汤姆问题的第一版没有描述其性格特点,所有人都清楚,他就读某专业的概率只是该专业注册人数的基础比率。然而,在得知汤姆的个性后,人们就不考虑基础比率了。

St.B.T.Evans,“Heuristic and Analytic Processes in Reasoning,”British Journal of Psychology 75 (1984): 451-68. Norbert Schwarz et al., “Base Rates, Representativeness, and the Logic of Conversation: The Contextual Relevance of ‘Irrelevant’Information,”Social Cognition 9 (1991): 67-84.

根据早期证据,我和阿莫斯最初认为,人们在获得具体信息后,总是会忽视基础比率信息,但这个结论太偏激了。心理学家进行了许多实验,将基础比率信息作为问题的一部分呈现出来,尽管个体信息的权重总是大于单纯的统计数据,许多受试者还是会考虑基础比率。St.B.T.Evans,“Heuristic and Analytic Processes in Reasoning,”British Journal of Psychology 75 (1984): 451-68.诺伯特·施瓦茨及其同事表明,引导人们“像统计学家一样思考”可以促使他们更多地使用基础比率信息,而引导人们“像临床医生一样思考”则会起到相反的作用。Norbert Schwarz et al., “Base Rates, Representativeness, and the Logic of Conversation: The Contextual Relevance of ‘Irrelevant’Information,”Social Cognition 9 (1991): 67-84.

Alter, Oppenheimer, Epley, and Eyre, “Overcoming Intuition.”

几年前,在哈佛大学本科生中进行了一项实验,结果令我惊讶:系统2的强化激活提高了汤姆问题的预测准确性。该实验将老问题与认知流畅性的现代版本相结合。要求一半学生在执行任务时鼓腮帮,另一半学生皱眉头。Alter, Oppenheimer, Epley, and Eyre, “Overcoming Intuition.”我们知道,皱眉通常会提高系统2的警惕性,降低过度自信和对直觉的依赖。鼓腮帮(情绪中立的表情)的学生复制了最初的结果:他们完全依赖代表性,忽视了基础比率。然而,正如作者预测的那样,皱眉者确实对基础比率较为敏感。这一发现很有启发性。

直觉判断出了错,系统1和系统2都有责任。系统1给出了错误的直觉性建议,系统2采纳了,并据此做出判断。然而,系统2的失败有两个可能的原因——无知或懒惰。有些人忽视基础比率,因为他们认为,既然有了个人信息,基础比率就无关紧要了。还有一些人因为不专注而犯错。如果说皱眉头对判断有影响的话,那么懒惰似乎是基础比率忽视的恰当解释,至少对哈佛大学的本科生来说是这样。即使没有明确提及基础比率,他们的系统2也“知道”答案与其相关,但应用这一知识的前提是在任务中付出努力。

代表性的第二宗罪是对证据的质量不敏感。回想一下系统1的“所见即一切”法则。在汤姆的例子中,激活关联机器的是对他的描述,这些描述的准确性并不确定。汤姆“对人缺乏同情心和同理心”,这一说法足以让你(以及大多数读者)认为,他不太可能是社会科学与社会工作专业的学生。但你被明确告知,不应该相信描述!

原则上,你当然知道,无价值的信息等于没有信息,但“所见即一切”法则使其很难付诸实践。除非你立即否定证据(例如,确定信息是从骗子那里获得的),否则系统1会自动处理可用信息,就好像它是真的一样。当你质疑证据的质量时,你可以这么做:让你的概率判断接近基础比率。别期望这种训练能轻而易举地完成——它需要你付出巨大的努力进行自我监控和自我控制。

汤姆难题的正确解答方式是,你的答案应该非常接近先验信念,稍微调低热门专业(人文与教育,社会科学与社会工作)最初的高概率水平,稍微调高冷门专业(图书馆学、计算机科学)的低概率水平。你如果对汤姆一无所知,就不会有现在的看法,但你掌握的那点儿证据不足为信,所以应该让基础比率决定你的估计。

你对明天下雨的概率判断是你的主观信念,但你不应该相信头脑中的所有想法。要让想法发挥作用,那么你的信念应该受到概率逻辑的约束。所以,如果你相信明天下雨的概率是40%,那么你也必须相信明天不下雨的概率是60%。你不能相信明天早上有50%的概率会下雨。如果你相信某个候选人当选总统的可能性是30%,并且相信他首次当选后连任的可能性为80%,那么你必须相信他连任的可能性为24%。

贝叶斯法则的最简单形式是发生比的形式。后验发生比=先验发生比×似然比,其中后验发生比是两个竞争性假设的发生比(概率之比)。你可以思考一个诊断问题。你的朋友患有一种严重疾病,检测结果呈阳性。这种疾病很罕见:送检病例中只有1/600真的患有该病。测试相当准确。其似然比为25:1,这意味着患有该病的人检测结果呈阳性的概率是假阳性概率的25倍。检测结果呈阳性是一个可怕的消息,但你的朋友患有这种疾病的发生比仅从1/600上升到了25/600,即概率为4%。对于汤姆是计算机科学家的假设,与3%的基础比率相对应的先验发生比是0.031(0.03/0.97≈0.031)。假设似然比为4(如果汤姆是计算机科学家,则描述的可能性是他不是计算机科学家的4倍),后验发生比为0.124(4×0.031=0.124)。根据这些发生比,现在你可以计算出汤姆是计算机科学家的后验概率是11%(因为12.4/112.4≈0.11)。

贝叶斯统计学为汤姆问题及类似问题提供了相关法则。贝叶斯统计学以18世纪英国牧师托马斯·贝叶斯的姓氏命名,是一种有影响力的现代统计方法。贝叶斯被公认为一个重大问题的首位贡献者,这个问题是:人们根据证据改变想法时所遵循的逻辑是什么?贝叶斯法则详细说明了先验信念(在本章的例子中指的是基础比率)应如何与对证据的诊断相结合,以及它在多大程度上支持假设而不是替代方案。贝叶斯法则的最简单形式是发生比的形式。后验发生比=先验发生比×似然比,其中后验发生比是两个竞争性假设的发生比(概率之比)。你可以思考一个诊断问题。你的朋友患有一种严重疾病,检测结果呈阳性。这种疾病很罕见:送检病例中只有1/600真的患有该病。测试相当准确。其似然比为25:1,这意味着患有该病的人检测结果呈阳性的概率是假阳性概率的25倍。检测结果呈阳性是一个可怕的消息,但你的朋友患有这种疾病的发生比仅从1/600上升到了25/600,即概率为4%。对于汤姆是计算机科学家的假设,与3%的基础比率相对应的先验发生比是0.031(0.03/0.97≈0.031)。假设似然比为4(如果汤姆是计算机科学家,则描述的可能性是他不是计算机科学家的4倍),后验发生比为0.124(4×0.031=0.124)。根据这些发生比,现在你可以计算出汤姆是计算机科学家的后验概率是11%(因为12.4/112.4≈0.11)。例如,如果你相信3%的研究生就读于计算机科学专业(基础比率),同时相信,关于汤姆的描述符合计算机科学专业研究生的可能性是其他专业的4倍,那么贝叶斯法则认为,你现在必须相信汤姆就读于计算机科学专业的概率是11%。如果基础比率是80%,新的信念度就是94.1%。以此类推。

本书不涉及数学细节。关于贝叶斯推理以及我们判断出错的原因,有两点需要牢记。第一,即使在有证据的情况下,基础比率也很重要。这一点在直觉上往往并不那么显而易见。第二,证据诊断力的直觉性印象往往被夸大了。“所见即一切”与关联连贯性的结合会让我们相信自己编造的故事。贝叶斯推理的关键可以简单总结为:

· 将你的概率判断锚定在合理的基础比率上。

· 质疑你对证据的诊断力。

这两个理念很简单。我意识到从没有人教我如何运用它们,这让我震惊。即使现在,我仍觉得实践起来有些不自然。

“这家公司的草坪修剪得很齐整,接待员看起来很称职,家具也光鲜亮丽,但这并不意味着公司管理有方。我希望董事会不要依靠代表性做判断。”

“这家初创公司看起来不会倒闭,但该行业成功的基础比率极低。我们怎么知道它会不同?”

“他们一直在犯同样的错误:根据不充分的证据预测罕见事件。当证据不足时,应该以基础比率作为判断依据。”

“我知道这份报告极具毁灭性,它可能基于确凿的证据,但我们对此有多大把握?我们必须考虑到不确定性。”

上一章 封面 书架 下一章