「一本书」《噪声》:《思考,快与慢》之外,卡尼曼留给世界的最后一课

一、这本书为什么值得你花时间

2021年5月,丹尼尔·卡尼曼、奥利维耶·西博尼和卡斯·桑斯坦联合出版了《噪声》。卡尼曼那一年已经87岁,这是他生前最后一部面向大众的著作。

卡尼曼在2011年以《思考,快与慢》横扫全球畅销榜后,用了整整十年来完善关于“噪声”的理论。这本书的起点是一个令人不安的事实:即使在相同的规则和信息下,专业人士的判断仍然存在巨大的、不可预测的差异。卡尼曼后来在采访中说,这本书传递的信息让他“夜不能寜”。

《噪声》出版后,《经济学人》将其列为年度最佳图书,《纽约时报》评论称“它可能会改变你对人类判断力的看法”。诺贝尔经济学奖得主理查德·塞勒评价:“如果你关心做决策的质量,这本书就是必读书。”

为什么今天读它?因为我们生活在一个“数据驱动决策”的时代,企业、政府和个人每天都在做判断和选择。但《噪声》揭示了一个被系统性忽视的问题:我们花了大量精力减少偏差(bias),却几乎无视噪声(noise)——而噪声造成的判断误差,可能比偏差大得多。

二、一个核心洞见

这本书最颠覆认知的核心观点是:判断中的噪声,比你想象的大得多,也严重得多。

卡尼曼团队用了一个令人震惊的研究来说明这个问题。他们让168名职业法官观看同一个少年犯的审讯录像,然后独立做出量刑决定。结果:这些法官给出的刑期从 probation 到15年不等,中位数差异高达3.5年。最极端的两个判决之间相差超过10倍。

这意味着,同一个案件、同一套法律标准、同一个司法管辖区内的资深法官,仅仅因为“谁来判”这个随机因素,就可能导致一个少年在监狱里待上15年或者完全免于刑罚。

这不是偏差(bias)——偏差意味着系统性地偏向某个方向。这是噪声(noise)——随机、不可预测的判断波动。而噪声在所有涉及人类判断的领域都广泛存在:医生对同一症状的确诊率、保险精算师对同一风险的定价、面试官对同一候选人的评分,都存在惊人的不一致性。

卡尼曼团队提出了一个量化框架。他们计算了不同职业中“噪声与偏差的比例”,发现一个反直觉的结论:在很多情况下,噪声造成的误差总和远大于偏差。 具体来说,在他们分析的法医学、保险定价、人事评估等场景中,噪声对判断准确性的损害是偏差的2到6倍。

第二个关键观点是:噪声不是随机误差的总和,而是可以被系统性减少的。 作者提出了“噪声审计”(noise audit)的方法——让多个判断者独立评估同一些案例,然后测量他们之间的一致性。如果一致性远低于预期,说明存在严重的噪声问题。通过决策卫生(decision hygiene)——包括对案例进行独立评估、使用算法辅助、采用外部视角——噪声可以被大幅降低。

书中引用的一项大规模实验显示,当保险公司采用算法辅助定价后,同一组案例的定价差异从原来的数倍缩小到了不到10%。这不是减少偏差的结果,纯粹是消除了人为噪声。

三、现实联系:它解释了什么

让我们用《噪声》的视角重新审视一个当下热门现象:AI面试和AI评估工具的兴起。

近年来,企业大量引入AI进行简历筛选和面试评估,引发了广泛的“算法偏见”讨论。舆论几乎一边倒地批评AI会把偏见编码进决策系统。这个批评本身是对的,但《噪声》的框架揭示了一个被忽略的另一面:人类面试官的噪声问题,可能比算法的偏差问题严重得多。

研究表明,一个候选人是否通过面试,很大程度上取决于他恰好碰到了哪位面试官、面试安排在什么时间(午饭前的面试通过率显著低于午饭后的)、甚至当天的天气。据德克萨斯大学2019年的一项研究发现,面试官在连续评估多个候选人后,对后面候选人的评分会系统性地低于前面的——这被称为“对比效应噪声”。

如果用《噪声》的框架来看,AI评估的真正价值不在于它更聪明,而在于它更一致。一个有微小偏差但完全一致的算法,其总体判断质量很可能优于一个“无偏见”但充满噪声的人类决策系统。这是一个反常识但有力的结论。

这也解释了为什么一些企业(如谷歌早期)在取消结构化面试后不得不重新引入——不是因为面试官不认真,而是因为自由形式的人类判断天然就是高噪声的。结构化面试、评分量表、盲评,本质上都是在做卡尼曼所说的“决策卫生”。

四、局限与争议

《噪声》并非没有短板。

最大的批评来自决策科学领域的同行。心理学家盖瑞·克莱因(Gary Klein)指出,噪声审计在控制条件下效果显著,但现实中判断者之间本身就应该有差异——因为每个人的经验、专业背景和信息来源不同。如果把这种“合理的分歧”也视为噪声去消除,反而会降低判断质量。这个批评切中了要害:卡尼曼团队没有给出一个清晰的标准,区分“有害噪声”和“有价值的分歧”。

第二个批评是关于方法论。书中许多噪声数据来自实验室或受控实验,真实环境中的噪声是否同样严重,尚缺乏足够的田野研究支撑。有研究者指出,在高度专业化的领域(如经验丰富的专科医生),噪声可能远小于书中估计的水平。

此外,本书提出的“决策卫生”方案虽然听起来合理,但在组织实践中落地困难。“独立评估”要求打破团队协作的默契,“算法辅助”面临员工的抵触情绪,“噪声审计”本身也需要资源投入。书中的解决方案偏理想化,对实施障碍讨论不足。

五、一句话总结 + 阅读建议

我们执着于消除偏见,却忽视了更隐蔽的敌人:判断的随机波动——它比你以为的更普遍、更致命。

适合:管理者、决策者、所有需要做判断的人。不适合:寻求实操手册的读者——这是一本关于“认识问题”的书,不是“解决问题”的 cookbook。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
周刊

「对比」订阅制 vs 封建地租:你以为你在购买,其实你在交租

2026-5-22 8:48:16

java

Nacos

2021-10-21 20:25:30

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧