搜索 K
Appearance
博客正在加载中...
Appearance

如今,我们被数据包围。
人们习惯了用数据说话:小到防治疾病、理财投资,大到规划公司经营战略,乃至于制定国家宏观政策,都需要用统计学分析数据,建立模型,以形成决策的依据。
有时,数据可以帮助我们评估相互竞争的观点,做出良好的选择。
其他时候,我们被数据欺骗,做出糟糕的选择,导致昂贵甚至灾难性的后果。
有些人是误用了统计学,得出了错误的结论;有些人则是故意用错了统计学,得出了自己想要的结论。
美国幽默作家马克・吐温,就曾在《我的自传》中引述了本杰明・迪斯雷利的说法,世界上有三种谎言:谎言、该死的谎言、统计数字。


本书脱胎于耶鲁大学两度获得教学奖的热门公开课,是一本关于统计学的防骗指南,帮助读者破除对数据的迷信,学会基本的统计学常识,从而具备起码的辨别力。
作者从统计学的基本原理出发,全面介绍了各种统计误区,用鲜活的例子配上专业的解释,戳破那些数据包装出的 “骗局”,例如久负盛名的《魔鬼经济学》《追求卓越》等超级畅销书背后的弥天大谎。
本书告诫我们要对耸人听闻的观点保持警惕,不要轻易否定我们的直觉和常识。

加里・史密斯(Gary Smith),美国著名统计学者,耶鲁大学经济学博士,曾在耶鲁大学任教 7 年。
本书分为 19 章,前面 18 章中,每章针对一种常见的统计学错误,并解释原因,最后一章则是总结。
接下来,我就会介绍书中提到的几条基本统计学原则,相信能帮你识破一些生活中常见的误区和骗局。
乌云常常是降雨的前奏,灌木丛中的声音可能是捕食者发出的,毛发质量是繁殖力的象征......
一些远古祖先可以通过这些模式识别更好地寻找食物和水源,发现危险,生存下来的可能性更高。

而那些不太擅长模式识别,因而不太容易生存和繁衍的个体,将基因传下来的可能性要小一些。
通过无数代自然选择,我们形成了寻找模式并对其做出解释的内在倾向——乌云会带来降雨,捕食者会发出声音,繁殖力强的成年人拥有漂亮的毛发。
我们生来倾向于以某种方式理解周围的世界——发现模式,并且编造出解释这些模式的理论。
但到了如今,这种技能不太适应现代生活,因为我们面对的数据太复杂了。
我们很容易被模式以及解释模式的理论所引诱,紧盯着支持这种理论的数据,忽视与之相矛盾的证据。
我们在内心深处希望理解这个世界,因此很容易受到各种统计性骗局的蒙蔽。
即使是那些受教育程度很高、应当具有冷静头脑的科学家,也很容易受到模式的诱惑。
在残酷的学术研究领域,聪明好胜的科学家一直在追求名誉和资助,以维持他们的事业。这种必要的支持是由他们在同行评议期刊中发表的成果决定的。 “无论文,不生存” 是大学生活中的一个残酷现实。
有时,在巨大的压力面前,研究人员甚至会撒谎和作弊,以实现个人的职业发展。
为了生存,他们需要得到能够发表的结果,但他们的实验结果并不符合预期,这使他们感到沮丧;

此外,他们还会担心其他人抢先发表类似的结果。因此,这些研究人员有时会对实验数据做手脚。
毕竟,如果你相信你的理论是正确的,那么编造出证明这种理论的数据又有什么关系呢?
所以,我们应该始终保持怀疑的态度。相关、趋势和其他模式本身无法证明任何事情。
如果没有合理的解释,任何模式都仅仅是一种模式而已。每一种合理的理论都应该接受新数据的检验。

幸存者偏差可能是最常见、最为人所知的统计学错误了。
这个概念最早来源于第二次世界大战,当时美军对返航的战斗机进行的弹痕分析,发现机翼部分中弹较为密集,而机身和机尾部分则中弹较为稀疏,于是美军决定对机翼部分进行加固。
但后来的事实证明,这是一个错误的决定。因为事实上,机身和机尾部分中弹的飞机大多数都坠毁了,而机翼部分中弹的飞机却能够返航。
所以,美军只看到了那些幸存下来的飞机,而没有意识到那些坠毁的飞机受损部位才是更需要加固的部分。
这是一个很常见的错误,哪怕是如今也不少见,例如 17 年春节前一个刷屏的段子:

一个记者来到火车站台上,随机询问,请问你买到火车票了吗?
一位大妈微微一愣,回答:“买到了”
记者又转向一位年轻人,问:“请问你买到火车票了吗?”
年轻人回答:“买到了”
随后记者又问了 5 个人,大家都回答:“买到了”
最后记者对着镜头说:“今年虽然火车票难买,但是通过采访我们发现,大家都买到了火车票,现在正满怀希望地赶回家乡,过个团圆年!”
类似的案例数不胜数:

甚至还有些错误非常流行。例如畅销书《从优秀到卓越》,记录了一些成功公司的共同特点,销量突破了 400 万部,而且进入了一些史上最佳管理类书籍的排行榜之中。

其作者花了 5 年时间,考察了 1000 多家公司的历史,并针对其中比较优秀的公司进行详细检查,发现了一些共同特点,然后写书发表。
但是,对于伟大公司共同特点的整理,不会包含拥有这些特点但不那么成功甚至已经破产的公司。这本书也陷入了“幸存者偏差”。
书中提到的公司,不少公司在股市上的表现非常平庸,有的则是大跌,有的破产。
我们需要对那些可能存在自选择偏差的数据保持警惕:
图像可以帮助我们解读数据,做出推断。
有用的图像可以准确而一致地显示数据,帮助我们看到倾向、模式、趋势和关系,正所谓“一图胜前言”。
不过,图像也会歪曲数据。直接看两张图:

这是一个公司的收入图。只看图,是不是觉得右侧的图显示,收入在急剧下降?
实际上,这是同一张图,只不过右图的纵轴没有「零点」,所以波动看起来比较大。
1976 年,美国国家科学基金会(NSF)制作了一张图,显示着颁发给美国公民的诺贝尔科学奖(化学、物理、医学)的数量出现了令人震惊的下降。

但只要你看看时间轴(横轴),就会发现前七个时间段都是 10 年,但是最后一个时间段只有 4 年:1971~1974
由于 4 年颁发的诺贝尔奖数量少于 10 年颁发的数量,因此美国国家科学基金会制造了一种幻觉,使人误以为美国人获得的科学奖数量出现了下降。
类似的还有交换纵横轴、甚至省略某个轴,省略数字等... 类似的案例有很多,要注意。


一项研究的结论有可能受到混杂因素(其他因素)的干扰。例如:
发现混杂因素并不总是一件容易的事情,我们应当留意是否存在可能改变结论的混杂因素。

简单来说,就是现实生活中可能会出现极端现象,但这可能只是运气问题,后续表现通常会向平均值靠拢(也就是回归)。
例如:
回归存在于无法通过观测型特点准确反映出来的任何遗传特性之中:身高、体重、智力、足部尺码、头发密度。
当学术能力或运动能力等特点得到不完美测量时,观测到的表现差异会夸大实际能力差异。表现最优秀的人与平均水平的距离很可能不像看上去那样遥远,表现最为糟糕的人也是如此。因此,他们随后的表现将会朝着均值回归。
最成功和最不成功的公司、运动员、员工、雇主和潜在灵魂伴侣也是如此。
不要被成功和失败欺骗,最优秀的人与平均水平的差距很可能不像看上去那么大,最糟糕的人也是同样的道理。
位于极端位置的事物很可能会向均值回归。

一种非常不同(同时也极度不正确)的观点是,成功一定会得到失败的平衡(反之亦然),以便使事物整体上呈现平均水平。
他们认为,好事和坏事的供应量是固定的:
这是一种普遍存在的观点,但它是错误的:

因为上述事件都是「独立事件」,不会受到上一次或者前几次结果的影响。
要想改变运气,我们通常需要改变自己的行为。
例如,如果在找工作时不断遭到拒绝,我们应当考虑如何更好地表现自己,或者考虑申请不同的工作。
好运当然不会永远持续,但是不要认为好运会提高噩运的可能性,反之亦然。

著名经济学家罗纳德 • 科斯曾说:“如果你对数据拷打足够长的时间,它一定会招供。”
数据聚集现象无处不在,甚至存在于随机数据之中,想要寻找某种解释的人一定会找到一种解释。
因此我们没有必要根据这种现象徒劳地寻找异想天开的解释。
遗憾的是,人们很难抗拒“每一种模式一定有原因”这一想法的诱惑。
一个流行病学家发现,许多癌症受害者的家庭靠近大型输电线,这其实就是一个随机的数据聚集 —— 一个没有射击技能的人用一把枪向谷仓的一面墙射出大量子弹,然后在弹孔最多的位置画上靶心。
要想进行有效的统计检验,研究人员应当首先画出靶子,然后发射子弹——首先论证输电线可能导致癌症的原因,然后比较有输电线和没有输电线的街区发生癌症的频率。

人们总是满怀希望地研究数据,寻找跑赢大盘或中彩票的方法,然后得出一些可笑的理论。
如果我们足够努力,即使面对随机生成的数据,我们也可以找到某种模式。
不管这种模式多么明显,我们都需要一种合理的理论来解释这种模式。
否则,我们找到的仅仅是巧合而已。
另一个极端是缺乏数据的理论——将半真半假的理论作为事实提出,但却从不用数据对其进行检验。
如果一种理论没有得到可靠数据的检验,那么它仅仅是一种猜测。
对于未来几十年甚至几百年的预测来说,这种现象尤其明显。
福雷斯特是一名电气工程师发明的,他从工程领域转到管理领域后,发明了一些模型来帮助理解与预测系统的演化。
而这个系统,后来放大为了整个世界,他的结论是,世界 1971 年的生活标准也许是这个星球能够承载的最高水平。
他总结道:“从今后 100 年的长期视角来看,发展中国家目前的工业化努力也许是不明智的。”为了维持 1971 年的生活标准,他建议将出生率降低 30%,将粮食产量降低 20%,将自然资源使用量降低 75%。

持有类似观点的人很多,他们的推理具有一丝合理性,但他们并没有考察历史数据,以检验这些数据是否支持他们的理论。他们相信这些理论,所以他们要求我们也相信这些理论。
模型的推理与建立存在着合理性,但问题是禁不住历史数据检验。
要被一项研究说服,那么理论与数据缺一不可,既要通过常识推理的验证,也需要通过未经处理的新数据的检测。
书籍内容丰富,有很多奇闻异事,这里就简单列举了一些常见错误和原因分析。
总的来说,作为统计学入门书籍还是可以一看的,非专业人士也可以一看,可以学到不少东西,了解一些有趣的故事。
《统计学》,豆瓣 9.2 分,不过比较厚,比较难,更适合作为大学教材之类的,配合老师进行学习
《女士品茶》,豆瓣 8.3 分,统计学入门经典读物,堪称统计学普及领域的《苏菲的世界》,介绍了很多统计学史,能看到那些听过的统计学名词和方法是如何一个一个出现的,但建议有基础的人才去看。