第22章专家直觉何时可信？

第 2 2 章

专家直觉何时可信？

Mellers, Hertwig, and Kahneman, “Do Frequency Representations Eliminate Conjunction Effects?”

专业领域的争议会带出学者们最坏的一面。科学期刊偶尔会发表他们相互回应的内容，发端通常是某人对他人的研究展开了批评，随后是对方的回复和反驳。我一直认为，这些交流是在浪费时间。尤其是，如果最初的批评言辞犀利，回复和反驳就成了我所说的“回怼”和“讽刺升级”。对于尖锐的批评，很少见到示弱的回复。而且，几乎从未听说回复者在反驳中承认最初的批评受到了误导，或指出自己哪里有错。有几次，我回应了我认为具有严重误导性的批评，因为不回应会被解释为承认错误，但我从未发现带有敌意的交流有任何益处。为了寻找应对分歧的新方法，我进行了一些“对抗性合作”，即让存在学术分歧的学者就其分歧共同撰写论文，有时还请他们一起进行研究。在剑拔弩张的情况下，研究可由仲裁人来主持。 Mellers, Hertwig, and Kahneman, “Do Frequency Representations Eliminate Conjunction Effects?”

Klein, Sources of Power.

最令我满意也最有成效的对抗性合作是与加里·克莱因进行的。他是学者和人才协会的知识领袖，他不喜欢我的研究。他自称是“自然主义决策学者”，他们大多数人所在的组织研究的是专家如何工作。他们坚决反对启发法和偏差法中对偏差的关注，批评这种模式过于关注失败，实验由人为因素驱动，没有研究那些做重要事情的真实的人。他们对于用严谨的算法取代人类判断的价值深表怀疑，保罗·米尔不是他们的英雄。多年来，加里·克莱因明确阐述了这一立场。 Klein, Sources of Power.

在这种基础上很难建立美好的友谊，但故事还有后续。我从不认为直觉总是被误导的。20世纪70年代，克莱因写了一篇研究消防员专业技能的论文，自从第一次读到论文初稿，我就成了他的仰慕者。他的书《如何作出正确决策》给我留下了深刻印象，书中分析了经验丰富的专家是如何建立直觉技能的。我邀请他共同研究直觉缺陷与直觉奇迹的界限。他对这个想法很感兴趣。我们开展了这个项目，不确定它是否能成功。我们的起点是回答一个特定问题：何时可以相信自称拥有直觉的经验丰富的专家？显然，克莱因的态度更倾向于信任，我则更倾向于怀疑。但是，对于这个一般问题的答案，我们能在原则上达成共识吗？

在七八年的时间里，我们进行了多次讨论，解决了许多分歧，好几次差点儿闹崩，写了许多论文初稿，成为彼此的朋友，最终发表了一篇合著论文，题为《直觉性专家意见的条件：分歧的失败》。事实上，我们在分歧中并没遇到实质性问题，但也没达成真正的共识。

奇迹与缺陷

洛杉矶盖蒂博物馆邀请世界顶级的希腊雕塑专家来鉴定库罗斯——一尊阔步行走的青年大理石雕像。专家们的反应就是一种所谓的“直觉排斥”——他们有一种强烈的预感，认为库罗斯不是2500年前的，而是现代赝品。没有一位专家能立即说出其判断的理由。最有理有据的是一位意大利艺术历史学家，他抱怨道，雕像的指甲“好像不对劲”，但他并不确定。一位著名的美国专家说，他首先想到的是“新”这个词。一位希腊专家直截了当地说：“见过出土雕塑的人都能看出，那东西从没在地下埋过。”对于得出共同结论的原因，人们缺乏一致意见，这令人震惊，也让人觉得不可靠。

我和克莱因进行项目合作时，马尔科姆·格拉德威尔的畅销书《眨眼之间》出版了。令人欣慰的是，我们对这本书的意见一致。格拉德威尔的书以一个令人难忘的故事开场——一尊阔步行走的青年雕塑（据称是库罗斯雕像的典范）摆在艺术专家面前，几位专家产生了强烈的本能反应：他们凭直觉认为雕像是假的，但无法说出具体原因。洛杉矶盖蒂博物馆邀请世界顶级的希腊雕塑专家来鉴定库罗斯——一尊阔步行走的青年大理石雕像。专家们的反应就是一种所谓的“直觉排斥”——他们有一种强烈的预感，认为库罗斯不是2500年前的，而是现代赝品。没有一位专家能立即说出其判断的理由。最有理有据的是一位意大利艺术历史学家，他抱怨道，雕像的指甲“好像不对劲”，但他并不确定。一位著名的美国专家说，他首先想到的是“新”这个词。一位希腊专家直截了当地说：“见过出土雕塑的人都能看出，那东西从没在地下埋过。”对于得出共同结论的原因，人们缺乏一致意见，这令人震惊，也让人觉得不可靠。数百万人读过这本书，直觉大获全胜的印象留在每位读者的心中。专家们一致认为，他们知道这尊雕塑是假的，却不知道自己是如何知道的——这正是直觉的定义。这个故事似乎在暗示，系统地寻找引导专家直觉的线索会失败，但我和克莱因都不赞同这个结论。我们认为，这类研究是有必要的，如果方法得当（克莱因了解研究方法），应该会获得成功。

库罗斯雕像的例子让很多读者相信，专家直觉近乎魔法，但格拉德威尔本人并不这么认为。在后续章节中，他描述了直觉的惨败：美国人选出了哈丁总统，他的当选仅仅因为他看起来像总统——方下巴、高个子，完全符合坚毅果敢的领导者形象。人们投票给貌似领导者的人，不去思考他是否真的坚毅果敢。用一个问题替换另一个问题，影响了对哈丁能否胜任总统的直觉预测。那本书的读者应该预料到，这种直觉会被盲目的自信绑架。

直觉是一种识别

克莱因形成直觉观的早期经验与我的截然不同。我的观点来自两方面，一是观察自己的有效性错觉，二是读了保罗·米尔的著作，了解了他对临床预测劣势的证明。而克莱因的观点来自早期对消防队指挥官（消防队队长）的研究。他跟队长一起灭火，之后对他进行采访，了解他在做决定时的想法。在我们合著的论文中，克莱因写道：

（我与合作者）调查了指挥官在没有比较选项的情况下如何做出正确决策。最初的假设是，指挥官会将其分析限制在两个选项上，但事实证明该假设是错的。其实，指挥官通常只想到一个选项，那就是他们需要的。十多年真实和虚拟的经验让他们掌握了各种模式，他们会从中确定一个合理选项，即最先想到的选项，然后通过心理模拟来评估该选项，判断它在当前情况下是否有效。如果看起来适用，就予以实施。如果存在缺陷，就进行修改。如果不易修改，就关注下一个最合理的选项，并执行相同的程序，直到找到可行方案。

西蒙是20世纪杰出的知识分子之一。他在20多岁的时候就写了一本关于组织决策的经典著作。在其他领域，他也成就斐然。他后来成为人工智能的创始人之一，以及认知科学的领军人物。他是科学发现过程中有影响力的研究者、行为经济学的先驱，顺便还拿了诺贝尔经济学奖。 Simon,“What Is an Explanation of Behavior?”David G.Myers, Intuition: Its Powers and Perils (New Haven: Yale University Press, 2002), 56.

克莱因将其阐述为一种决策理论，他称之为识别促发决策（RPD）模型，该模型适用于消防领域，也适用于包括国际象棋在内的其他专业领域。这个过程涉及系统1和系统2。在第一阶段，通过关联记忆的自动功能，脑海中浮现出一个初步计划——这是系统1的运作。下一步是刻意的过程，即对计划进行心理模拟，检查它是否可行——这是系统2的运作。该模型将直觉决策视为模式识别，它发展了赫伯特·西蒙之前提出的观点。在决策研究领域，西蒙可能是唯一被各大门派视为英雄和奠基人的学者。西蒙是20世纪杰出的知识分子之一。他在20多岁的时候就写了一本关于组织决策的经典著作。在其他领域，他也成就斐然。他后来成为人工智能的创始人之一，以及认知科学的领军人物。他是科学发现过程中有影响力的研究者、行为经济学的先驱，顺便还拿了诺贝尔经济学奖。我在序言中引用了赫伯特·西蒙对直觉的定义，现在复述一遍会更有意义：“情境提供了线索，促使专家提取记忆中的信息，而这些信息提供了答案。直觉不过是一种识别，仅此而已。” Simon,“What Is an Explanation of Behavior?”David G.Myers, Intuition: Its Powers and Perils (New Haven: Yale University Press, 2002), 56.

Seymour Epstein,“Demystifying Intuition: What It Is, What It Does, How It Does It,”Psychological Inquiry 21 (2010): 295-312.

西蒙有力的表述将直觉的魔力简化为记忆的日常体验。在燃烧的房子倒塌前，消防员凭直觉知道危险迫在眉睫，必须立即撤离，但他“不知道自己是怎么知道的”。 Seymour Epstein,“Demystifying Intuition: What It Is, What It Does, How It Does It,”Psychological Inquiry 21 (2010): 295-312. 我们对这类故事感到惊讶。然而，当我们走进房间时，也不知道是如何立即认出朋友彼得的。西蒙这句话的寓意是，“不知道自己知道”的神秘性并不是直觉的特色，它只是心理活动的常态。

习得技能

支持直觉的信息是如何存储在记忆中的？有些类型的直觉是快速获得的。我们从祖先那里继承了一种强大的能力，即懂得何时应该恐惧。事实上，一次经历足以引发长期的厌恶和恐惧。很多人都曾对某道不喜欢的饭菜有肠胃记忆，这使我们不愿再次光顾那家餐馆。当靠近不祥事件发生地时，我们都会紧张起来，即使没有理由认为事件会再次发生。对我来说，不祥之地是通往旧金山机场的路。几年前，一个路怒症司机在高速公路上跟着我，摇下车窗，朝我一通污言秽语。我不知道他愤怒的原因，但每当我驱车去机场，到达那个地方时，都会想到他的声音。

我对机场事件的记忆是有意识的，它充分解释了随之而来的情绪。然而，在许多情况下，特定场所或者某人说的一些话可能会让你不舒服，但你并不记得触发事件是什么。事后看来，如果这种不安伴随着不悦的体验，你会将其称为直觉。这种情绪学习模式与巴甫洛夫著名的条件反射实验密切相关。实验中，狗学会将铃声识别为投食信号。巴甫洛夫的狗学到的是一种习得性希望。习得性恐惧更容易获得。

恐惧的习得轻而易举，不仅可以通过经验也可以通过言语习得。对危险有“第六感”的消防员肯定有很多机会讨论和思考自己未参与施救的火灾类型，并反复设想可能的线索以及应该做出的反应。我记得，毫无作战经验的年轻排长在带领部队穿过峡谷时会感到紧张，因为他学过这种地形有利于伏击。恐惧习得几乎无须重复。

Foer, Moonwalking with Einstein.

情感学习可能很快，但“专业知识”的构建通常需要很长时间。在复杂任务中，比如高水平的国际象棋、职业篮球或消防作业等，专业知识的获得并非一蹴而就，因为某领域的专业知识涉及的并非单一技能，而是大量的微技能。国际象棋就是一个很好的例子。专业棋手一眼就能看懂复杂的局面，但这种水平需要数年才能培养出来。有关国际象棋大师的研究表明，要达到最高水平，至少需要10000小时的刻意练习（每天训练5小时，大约需要6年）。 Foer, Moonwalking with Einstein. 每种棋局都由相互攻守的棋子组成。经过大量的专注练习，严肃的棋手将对成千上万种局面了如指掌。

高水平的国际象棋学习可以与阅读学习做类比。一年级学生需要努力才能识别字母，并将其组合成音节和单词，但阅读技能熟练的成年读者能从整个从句的角度感知意义。高阶读者还能将熟悉的元素组合成新模式，快速“识别”陌生单词，并准确地读出来。在国际象棋中，相互作用的棋子组成重复的模式，类似于字母的角色，棋局则犹如一个长单词或句子。

第一次看到刘易斯·卡罗尔的诗歌《贾巴沃克》时，高阶读者能抑扬顿挫地读出来，同时体验到愉悦：

是滑菱鲆在缓慢滑动

时而翻转，时而平衡；

所有的扭捏作态展示了

蠢人的早熟、懒人的平庸。

习得国际象棋专业知识比学习阅读更难、更慢，因为国际象棋“字母表”中包含更多的“字母”，而且“单词”也由更多的字母组成。但是，经过数千小时的练习，国际象棋大师能够一眼读懂局面。他们想到的走子几乎总是那么强势，有时还富有创意。他们可以处理陌生“单词”，也可以找到解读熟悉单词的新方式。

技能的环境

我和克莱因很快发现，就直觉技能的本质和获取方式而言，我们的观点一致。但我们仍需对一个关键问题达成共识：何时能相信满怀自信、自称有直觉能力的专家？

我们最终得出结论，我们的分歧部分在于各自心目中的专家是不同的。克莱因花大量时间研究真正具有专业知识的人，比如消防指挥官、临床护士和其他内行。我则用更多时间关注那些试图做出缺乏依据的长期预测的人，比如临床医生、选股者和政治学家。因此，他默认的态度是信任和尊敬，我默认的态度是怀疑。他更愿相信称自己为有直觉能力的专家，因为正如他告诉我的那样，真正的专家知道其知识的局限。我认为，许多伪专家对自己的行为毫无觉知（有效性错觉），他们通常有过强的主观信心，而且往往没有依据。

我在前几章中提过，人们对信念的信心源于两个相关印象：认知轻松和连贯性。当我们能轻而易举地想到自述的故事，且场景不存在对立和抵触时，我们是自信的。但是，轻松和连贯性并不能保证自信的信念是真的。关联机制旨在抑制怀疑，唤起与当前主导性故事一致的想法和信息。盲从“所见即一切”的大脑会因忽略未知信息而轻易获得高度自信。因此，很多人容易坚信毫无根据的直觉，这并不奇怪。我和克莱因最终都认同一项重要原则：人们对直觉的信心并非有效性的可靠向导。换句话说，无论谁（包括你自己）告诉你，应该相信其判断，都不要相信。

如果主观信心不可信，我们如何评估直觉判断的可能效度？直觉判断何时能反映出真正的专业知识？何时能体现有效性错觉？答案来自技能习得的两个基本条件：

· 足够规律的、可预测的环境

· 通过长期实践学习这些规律的机会

同时满足这两个条件，直觉就很可能是技能的体现。国际象棋是规则环境的一个极端例子，桥牌和扑克也能提供支持技能的可靠的统计规律。医生、护士、运动员和消防员同样面临复杂但基本有序的情境。专家的系统1已学会运用非常有效的线索，即使系统2还没学会如何为其命名。加里·克莱因所描述的准确的直觉就来自这些线索。相比之下，选股者和政治家是在零效度的环境中进行长期预测。他们的失败说明，他们尝试预测的事件基本上是不可预测的。

有些环境比无规律的环境更糟糕。罗宾·霍格斯描述了一种“恶劣”的环境，身处这种环境，专业人士可能会从经验中学到错误的教训。他借用了刘易斯·托马斯举的一个例子。20世纪初，一位医生经常做出直觉判断，预测患者即将感染伤寒。遗憾的是，他通过触诊病人的舌头来检验自己的直觉，触诊后不洗手就检查下一个病人。病人接二连三地生病，医生自以为其临床判断绝对正确。他的预测是准确的——但并非因为他运用了专业直觉！

米尔提及的临床医生并非无能，其失败的原因并不是缺乏才干。他们表现不佳，因为分配给他们的任务没有简单的解决方案。相比长期政治预测的零效度环境，临床医生的困境没有那么极端，但他们在低效度的情境中预测，是不可能产生高准确性的。我们之所以清楚这一事实，是因为最好的统计算法虽然比人类判断者更准确，但永远做不到精准。事实上，米尔及其追随者的研究从未找到“确凿的证据”证明，在某个案例中，非常有效的线索被临床医生完全忽视，却被算法检测到了。这种彻底的失败不可能发生，因为人类学习通常是有效率的。如果存在明确的预测线索，在合适的机会下，人类观察者就能发现它。在充满噪声的环境中，统计算法远远超过人类，原因有两个：它们比人类判断者更有可能检测到模糊的有效线索，也更有可能通过持续运用这些线索保持适度的准确性。

在不可预测的世界，责怪他人没有做出准确预测是不对的。然而，专业人士自信能成功完成一项不可能完成的任务，对其加以指责似乎是公平的。在不可预测的情况下要求获得正确的直觉，轻则属于痴心妄想，重则导致更恶劣的后果。在缺乏有效线索的情况下，直觉的“命中”要么是运气使然，要么是一种不实之词。如果你觉得这个结论出乎意料，那说明你仍相信直觉就是魔法。请记住这条规则：在缺乏稳定规律的环境中，直觉不可信。

反馈与实践

相对而言，环境中的某些规律更易被发现和应用。想想你是如何养成刹车习惯的。学习弯道技巧时，你逐渐学会何时松油门，何时踩刹车以及用多大力气踩刹车。弯道路况各不相同，你在学习过程中体验的变化让你做好了准备，在正确的时间刹车，在转弯时掌握刹车力度。这项技能的学习条件是理想的，因为每次转弯，你都会收到即时而明确的反馈：如果刹车力度适中，舒适的转弯算是对你的小奖励；如果刹车太猛或力度不够，驾驶困难算是对你的小惩罚。港口领航员操纵大型船只也是类似的情况，但由于行为和可察觉的结果之间有较长的延迟，仅靠经验很难获得技能。专业人士能否有机会掌握直觉性专业知识，主要取决于反馈的质量和速度，以及是否有足够的实践机会。

专业知识不是单一技能，而是很多技能的集合，同一位专业人士可能在其领域的某些任务中非常专业，但在其他任务中仍是新手。当棋手成为大师时，他们已“阅尽千帆”（或基本如此），但在这方面国际象棋是个例外。外科医生可能擅长做某些手术，却不擅长做其他手术。此外，无论哪类专业任务，总有某些方面相对而言更容易学习。心理治疗师有很多机会观察患者对其话语的即时反应。反馈让他们培养了直觉能力，找到适当的话语和语气，让患者平息怒火、建立信心或集中注意力。相反，治疗师没有机会确定哪种常规疗法对不同的患者最有效。他们很少从患者的长期结果中得到反馈，反馈（通常）是延迟的或不存在的，而且总是模糊不清，这使他们无法从经验中学习。

在医学专业中，麻醉师能受益于有效的反馈，因为其行为很快就会显出效果。相比之下，放射科医生很少能获得关于其诊断准确性及其未检测到的病症的相关信息。因此，麻醉师能够更好地培养有用的直觉能力。如果麻醉师说“我感觉有点儿不对劲”，手术室里的所有医护人员都应准备进入紧急状态。

当怀有主观信心时，专家可能不知道其专业知识的局限。经验丰富的心理治疗师知道，她有能力发掘患者的所思所想，对患者要表达的内容有敏锐的直觉，因而很容易得出结论。她也可以预测患者明年的状况，但这一结论并不完全合理。短期预测和长期预测是不同的任务，治疗师有大量机会学习如何进行短期预测，但没有机会学习如何进行长期预测。同样，金融专家可能在多个交易领域拥有技能，但在选股方面却没有。中东政策研究专家见多识广，但并不能预测未来。临床心理学家、选股者和专家在某些任务中确实有直觉能力，但他们还没学会识别在哪些情境和任务中直觉会出错。意识不到专业技能的局限性，可以说就是专家过于自信的原因。

评估有效性

何时可以信任自称有直觉的经验丰富的专家？我和加里·克莱因在合作结束时就此达成了一致意见。我们的结论是，在大多数情况下，可能有效的直觉和可能虚假的直觉大致是可以区分的。在判断一件艺术品的真伪时，关注其出处比关注艺术品本身更有效。如果环境的规律性足够强，判断者有机会了解规律，关联机制就会识别情境，做出快速准确的预测和决策。满足了这些条件，你就可以相信专家的直觉。

遗憾的是，关联记忆也会产生主观上令人信服的错误直觉。了解国际象棋天才少年棋手成长经历的人都知道，拥有高超的技能并非一蹴而就的事。在追求完美的路上，人们会在非常自信的状态下犯错。在评估专家直觉时，你始终应该考虑的问题是：专家是否有足够的机会认识线索，即使其所在的环境很有规律。这一点也至关重要。

在不规律或低效度的环境中，人们会调用判断启发式。系统1经常通过替代来快速回答难题，在不存在连贯性的地方创造连贯性。最终虽然还是答非所问，但答案来得很快，而且貌似可信，能通过系统2宽松的审查。例如，你想预测某公司的商业前景，并相信这就是你的判断目标，而事实上，你的评估主要取决于你对现任高管的活力和能力的印象。替代是自动发生的，所以你通常不知道（你的系统2）认可和采纳的判断来源。如果它是你唯一能想到的，那么你会主观地认为，它就是你以专家自信做出的有效判断。主观信心不是准确性的有效诊断标准，原因就在于，人们可以满怀信心地做出答非所问的判断。

你可能会问，为什么我和加里·克莱因没有立即想到通过评估环境的规律性和专家的学习经历来评估专家直觉，并且不怎么关注专家的信心？我们认为答案是什么？这些问题问得很好，因为答案的轮廓从一开始就很清晰。我们一开始就知道，消防指挥官和儿科护士位于有效直觉边界的一方，米尔研究的专家、选股者和评论者位于另一方。

我和克莱因合作了几年，进行了长时间的探讨，不断交换论文草稿，通过数百封电子邮件斟酌词句，不止一次地徘徊在放弃的边缘。这些经历很难重建。但当项目圆满结束时，总会发生这种情况：一旦得知主要结论，你就会觉得它们没什么稀奇的。

正如我们的论文标题所示，我们的分歧比预想的要小，而且我们就几乎所有实质性问题达成了共识。然而，我们也发现，我们早期的分歧不仅仅是智识上的。我们的态度、情绪和品位各不相同，多年来，这些特质几乎没有变化。这是最明显的事实，对此我们都觉得颇为有趣。提到“偏差”一词，克莱因仍会皱起眉头，他仍喜欢举一些例子，说明算法或形式上的流程导致荒谬的决策。我更愿意将算法偶尔的失败视为改进的机会。另一方面，当傲慢的专家在零效度的情境中鼓吹直觉而自食其果时，我发现自己幸灾乐祸的劲头比克莱因更大。然而，从长远看，像我们这样尽可能地发掘彼此之间的智力共识肯定比固守情感分歧更有价值。

谈谈专家直觉

“对于这项特殊任务，她具备多少专业知识？有多少实践经验？”“他真的相信初创企业的环境很有规律，可以证明与基础比率相悖的直觉是合理的吗？”

“她对自己的决策充满信心，但主观信心并不能衡量判断的准确性。”

“他真的有机会学习吗？他收到的自我判断反馈有多快、多清晰？”

第22章 专家直觉何时可信？

第22章专家直觉何时可信？