《赤裸裸的统计学》书摘
界面设计

《赤裸裸的统计学》书摘

1. 数据有时候会是陷阱

纽约州曾因为统计陷阱而栽了大跟头,付出了惨痛的代价。州政府出台了“记分卡”制度,统计心脏搭桥病人的死亡率,以便让公众在选择心脏科医生时有一个参考。这似乎合情合理。心脏搭桥手术是治疗心脏病的常用方法,心脏病人在搭桥手术过程中的死亡比例当然是一个重要的数据,但普通个人根本没有办法了解到确切数据,因此政府出面收集并向公众公开这一数据是合乎情理的。但就是这么一个“好”政策,却导致了更多病人的死亡。

心脏科医生肯定会在意他们的“记分卡”。但是对于一个外科医生来说,降低病人死亡率最简单的方法并不是降低病患死亡人数。降低死亡率最简单易行的方法是拒绝为那些病况最严重的病人动手术!

一项调查表明,以服务病人为初衷的记分卡,到头来反而会给病人造成伤害:在参与调查的心脏科医生中,有83%的医生表示正是由于公开了死亡率数据,一些本来可以从搭桥手术中获益的病人最终没能被安排进行手术;79%的医生表示收集并公开死亡率数据或多或少地影响了他们的治疗决策。这一看似有用的描述性数据存在一个可悲的矛盾,而心脏科医生也只能理性地接受并采取自己的对策,就是让那些最需要心脏搭桥的病人远离手术。

2. 小心那些用「幸存者偏差」的统计

传统意义上的共同基金公司通过操纵统计数据,能够给人营造一种业绩非常好的错局。

比如说,某家大型基金公司同时开放许多只共同基金,总共有20只。其中每只基金跑赢标准普尔500指数的概率都约为50%。一年过后,有10只基金表现打败了标准普尔500,再一年以后,剩下了5只,又过了一年,只剩下3只基金了。

届时,那些相比标准普尔500指数收益率不够理想的基金基本上悄无声息地关闭了,剩余资产被并入了其他幸存的基金中。然后该公司接下来就可以大肆打广告,宣传称这3只基金的表现始终优于标准普尔500指数。

而实际上,这三只基金的良好表现不过是连续抛出3次硬币都得到了正面朝上的结果。它们接下来的表现很可能会归于平均值,但是投资者的钱已经成功地骗进来了。

3. 采访过程中,问题的设置对结果往往具有非常大的影响

有多少比例的美国人支持死刑?

根据盖洛普民调机构的调查,从2002年起,每年的民意测试都显示超过60%的美国人支持对谋杀犯判处死刑。美国人对死刑判决的支持率一直在一个很小的范围内变动,最高时的支持率为2003年的70%,其他时候也层低至64%。但无论怎样,大多数美国人是支持死刑的。

事实真的是这样吗?如果把没有假释的终身监禁作为选项加入到问题中,美国人对死刑的支持率就大大下降了。

2006年盖洛普的民调显示,47%的美国人认为对谋杀犯采取死刑是合适的,而48%的受访者会支持终身监禁谋杀犯。

4. 分析统计数据,记住避免「变量遗漏偏差」

如果在报纸上读到《常打高尔夫球容易患上心脏病、癌症和关节炎》,记得不要轻信这些标题。研究者发现打高尔夫球的人患上这些疾病的概率比不打高尔夫的人高,这个应该是事实。但是无论什么研究,在量化高尔夫球对健康的影响时都必须正确控制“年龄”变量。

年龄越大的人,打高尔夫球的时间和机会越多,尤其是退休之后。在这个研究课题中,没有将年龄作为解释变量就会遗漏一个事实,那就是打高尔夫球的人总体上年岁更高。因此,杀人不是高尔夫球,而是衰老。

电子邮件地址不会被公开。 必填项已用*标注

文章归档