周一,阿信和大家讨论的“新闻反转”,让很多小伙伴都发出感叹:拥有理性的思考和判断,真的非常重要!
说到理性、客观,很多时候我们都会联想到新闻报道中的统计数据。在假新闻横行的年代,似乎只有这些无可辩驳的数据,是值得我们信任的了。
确实,数学方法可以使我们以更经济的方式,去接近真理。然而,如果不能理解这些数字背后的含义,却可能在追求真相的路途中走进谬误的岔路。
在新书《救命的数学》中,基特·耶茨就讲述了许多通过概率、统计数据打造的骗局。
今天,阿信就想和大家分享一个“数字引发的悲剧”。
冷血母亲连续“谋杀”两名幼子?
让我们把时间退回到1999年,当莎莉·克拉克走进她的卧室前,她从未想过她的命运将就此发生如此大的转折。
几分钟前,她的丈夫史蒂夫刚把他们8周大的孩子哈利哄睡。而在此时,莎莉看到哈利躺在摇椅里,脸色发青,似乎已经没了呼吸。
尽管救护人员为哈利进行了心肺复苏,但仍然没有挽回这个稚嫩的生命。这对任何妈妈而言都是一场可怕的悲剧,但它已经第二次发生在莎莉·克拉克身上了。
一年前的圣诞夜,史蒂夫出门参加公司的圣诞晚宴,而莎莉把她11周大的儿子克里斯托弗放入婴儿睡篮。大约两个小时后,莎莉发现克里斯托弗失去了意识,脸色发灰。
3天后进行的尸检,将他的死亡归因于下呼吸道感染。
然而,在哈利死后,克里斯托弗的尸检结果被翻找出来做重新查验。两次尸检的结果放在一起,警方逮捕了夫妇二人。
之后,英国皇家检察机关对莎莉提起了诉讼,全英国媒体都像疯了一样报道这位“冷血杀手”:这名34岁的女律师,被控谋杀了自己的两个亲生儿子。
这一指控源于“梅多定律”。1989年,英国儿科医生梅多在一本名为《虐待儿童的开端》的书中提出:“一个婴儿突然死亡是悲剧,2个婴儿突然死亡是可疑的,然而,除非另有确证,3个婴儿突然死亡就是谋杀。”
而在当时,医学界才刚刚开始注意到一个被称为“婴儿猝死综合征”(SIDS)的现象, 也就是在发病前完全健康,在死亡以后的尸检中也无法检出病理原因的婴儿突然死亡案例。
这次审判中,梅多作为专家证人出庭,他宣称:在莎莉这样的家庭中,两个孩子都发生SIDS的概率是七千三百万分之一。
经过两天的审议,陪审团以10:2的结果判定莎莉有罪,她被判处无期徒刑。其中一名陪审员向他的朋友透露:梅多的统计数据在判决中影响了大多数陪审员的决定。
这项统计数据源于一份关于SIDS的报告,报告研究了英国三年内共计47.3万例活产婴儿中的363个SIDS病例。报告认为,对于一个富裕的非吸烟家庭,母亲年龄超过26岁,比如克拉克家的情况,每8543名婴儿中只有一例SIDS。
所以,如果连续出现两起,概率就是1/8543*1/8543≈1/7300万。
然而,真的如此吗?
被滥用和误读的概率,造成英国史上“最严重的司法误判”
回忆起高中的概率知识,相信大家都会记得数学老师强调过的一个词——“独立事件”。
扔一枚普通硬币,上一次扔出反面,并不会让下一次扔出反面的几率变大或变小——这是独立事件。
而在一个50人的班里,三次考试都是第一的学生,在下一次考试得第一的概率,显然不只是1/50——在“相关事件”中,
你对上一次事件的了解,会影响对下一次事件发生概率的判断。显然,SIDS在同一个家庭连续发生,并不是独立事件。
父母用相同的手法、相同的食谱养育婴儿,两个婴儿携带着许多相同的基因,拥有着相同的遗传风险。
如果第一个婴儿死于SIDS,那么很可能这个家庭中拥有未发现的导致SIDS的因素,那么第二个孩子的死亡概率将会显著上升,并不能再用1/8543来计算。
用婴儿整体的概率来衡量,本身也有问题,比如因SIDS死亡的男婴数量是女婴的两倍。
在计算方法之外,这场法庭上的控辩还出现了一个更严重的错误。
这种错误在法庭上非常普遍,因此被称为“检察官谬误”:通过一个不甚相关或有关但未正确考虑条件机率的数据,认定被告“无辜的机率”很小。
1990年,安德鲁·迪恩因为强奸罪被判处16年有期徒刑。审判中,专家证人表示:比对迪恩的血液DNA之后可以判断,在受害者身上提取的精液DNA,来自其他人的概率是300万分之一。
因此,法官在结案陈词中认为,这一概率“几乎可以确定迪恩是有罪的”。
然而事实上,这一数字应该被解释为:从人群中随机选择的个体具有与在犯罪现场发现的精液DNA相匹配的概率。
鉴于当时英国大约有3000万男性,那么其中约有10个男性与之相匹配,这大大增加了迪恩无罪的可能性,从几乎不可能的300万分之一变成了9/10。排除掉那些没有作案机会的群体,迪恩无罪的概率依然有50%——远高于300万分之一的概率。
后来的上诉证据也表明,迪恩的DNA和犯罪现场发现的精液DNA远没有那么接近。除迪恩之外,随机匹配的可能性大约是1/2500。
早期,比对全基因组图谱耗时漫长、耗费巨大,一般都会比较DNA上的13个特定区域,因此可能造成错误匹配。
也就是说,有作案机会的300多万名男性中,有1000多名与DNA证据相匹配的个体,基于DNA证据判定迪恩有罪的可能性降至千分之一以下。
对法医证据进行重新考量后,法官和专家证人都承认犯下了检察官谬误,对迪恩的有罪判决也随之撤销。
而在莎莉·克拉克的案件中,陪审团根据1/7300万的概率,错误地推断嫌疑人很可能是有罪的。
然而,如果依靠同样的逻辑,那么一个母亲连续谋杀两个孩子的概率,也同样微乎其微,甚至更小——如果1/7300万的概率能被用于证明莎莉的“罪行”,那么这一概率就也能证明她的无辜。
幸运的是,通过丈夫多年的奔走上诉,以及在尸检中新发现的微生物学证据,2003年1月,莎莉终于洗清冤屈,重获自由。
随着可量化证据越来越普遍,数学论证在现代司法系统中的作用已不可替代。然而,如果被滥用、甚至蓄意误用,那么象征理性、客观的数学,也会成为妨碍正义的工具。
你被告知的数字,不一定代表真相
离开法庭,在我们的生活中,也不能对看似“合理”的数字放下警惕。
2009—2013年,欧莱雅公司在兰蔻的一款抗衰老产品的广告中,展示了一幅条形图,声称有
85%的消费者拥有“完美发光”的皮肤,有82%“拥有光滑的皮肤”,有91%拥有“柔软”的皮肤,有82%的人在短短7天后皮肤的“整体外观得到改善”。这一连串的数字,看上去似乎格外令人信服。然而,有多少人参与了这项调查呢?
答案是34人——如此小的样本,写在毕业论文上可能都会被打回重写。
这则广告被美国联邦贸易委员会责令停止宣传,因为它“虚假且具有误导性”。
会靠“数字游戏”忽悠大众的,除了商家,还有政客。
今天美国人高呼的“黑人的命也是命”,在几年前的多起黑人被枪击事件中就被喊出来了。
2016年,围绕黑人群体、犯罪率和警察暴力执法的问题,正方和反方都拿出了可观的数据,来证明自己的观点。
一则在《太阳报》上的评论说:
“(相比于美国警察)美国黑人面临的最大危险毫无疑问是……嗯……其他黑人。
黑人谋杀黑人的案件平均每年有4000多起,而每年被美国警察杀害的黑人男性超过100人。
去算一下吧!”
根据这个数据,提问:“如果在美国有一名黑人被杀,那么他更可能被黑人还是被警察杀害的?”
显然,是黑人杀了更多黑人。
这个问题似乎有点儿狡猾。如果告诉你,2019年被狗咬死的美国公民有40个,而被熊咬死的只有两个,那么你会不会认为狗比熊更具威胁性?当然不会。狗没有熊危险,而且在美国,狗的数量更多。
那么,如果再告诉你,美国有超过4020万的黑人,而只有635781名全职执法人员,问题变成:
“如果一个黑人在街头碰到某人,他更害怕被谁杀死?另一个黑人,还是一个执法人员?”
答案似乎又会发生变化:黑人遇到黑人被杀死的概率是千万分之一,远小于被执法人员杀死的概率。
当然,我们也要承认,还有更多的社会因素在冷冰冰的数据背后发挥着作用。而我们应该做到的,就是在面对众多或真或假或片面的数据时,找到其中隐藏的真相。
顺道一提,其实我们见识最多的可能是这种骗局:
被特朗普推特转发的这张数据图,不仅数据和联邦调查局的数据完全不一致,就连数据来源“旧金山犯罪统计局”,都是个查无此局的虚构部门 !
懂一点数学
才能不被片面的数据蒙蔽住双眼
毕竟,有时数学真的能救命: