第23章 正态分布—钟形曲线的妙用与滥用(1)

作者:孙惟微

|

类型:生活·百科

|

更新时间:2019-10-06 13:07

|

本章字节:9014字

把钟形曲线用在商业领域是不合适的。


—彼得·德鲁克


疯子,就是用错误前提进行正确推理的人。


—约翰·洛克


真是令人震惊:钟形曲线竟然成为风险管理工具,被监管者和穿深色西服、以乏味的方式谈论货币的中央银行人员使用。


—尼古拉斯·塔勒布


一棵树上的果子有大有小,但大部分都是中等的。河里的石子有圆有扁,但多数属于不太圆也不太扁的。巨人很少见,侏儒也很稀少,多数人是身高中等的普通人。只要样本足够多,那么这个样本群体的情况就会呈现一种规律性。但这种规律却很可能被滥用……


“数学王子”与钟形曲线


德国数学家高斯被认为是最重要的数学家,享有“数学王子”的美誉。


高斯的母亲是一个贫穷石匠的女儿,虽然十分聪明,却没有接受过教育,近似于文盲。高斯的父亲曾做过园丁、工头、商人的助手等。


在整个数学史上,没有人像高斯那样早熟,比如高斯三岁时便能够纠正他父亲借债账目的事情。


高斯自己曾说,他在草堆上学会了计算。能够在头脑中进行复杂的计算,是上帝赐予他一生的天赋。


当高斯12岁时,已经开始怀疑元素几何学中的基础证明。当他16岁时,预测在欧氏几何之外必然会产生一门完全不同的几何学,即非欧几里得几何学。高斯的传奇、奇闻异事可以写成厚厚一部故事集。


18岁时,高斯开始专注于曲面与曲线的计算,并成功得到高斯钟形曲线(正态分布曲线)。其函数被命名为标准正态分布(或高斯分布),并在概率计算中大量使用。


钟形曲线是一根两端低中间高的曲线。高斯用它来描述科学观察中量度与误差两者的分布。


在钟形曲线上,大部分观察值都积聚于中间,曲线上的极点对统计结果影响不大。比如,随机挑选1000个男人进行身高统计,他们之中接近平均值的分布最多,巨人和侏儒分布最少,这种分布就符合正态分布。自然界中的很多随机变量,可以近似地用钟形曲线来描述:


一棵苹果树上的苹果有大有小,把这些苹果一一称重,会得到一条钟形曲线。


河床上布满了鹅卵石,这些石子有圆有扁,把这些鹅卵石的曲度统计出来,也会形成一条钟形曲线。


茫茫人海,总会有几个巨人,也会有几个袖珍人,但大部分人是身高中等的普通人。


同质群体的身高、红细胞数、血红蛋白量、胆固醇等,呈现为正态或近似正态分布。


……


只要样本足够多,那么这个样本群体的情况就会呈现一种规律性。


数学不会错,但数学会被用错


类似这种说法你可能听说过:


“xx效应无处不在!”


“万事万物都逃不开xx法则!”


说者如此亢奋,仿佛真的发现了一条能解释宇宙万物的绝对真理。


就连高斯自己恐怕也没有想到,自己发现的钟形曲线,会被泛滥地运用到社会生活的各个方面。


前面讲过,“统计狂人”高尔顿爵士通过研究豌豆遗传和人类世代演变,联想到了均值回归理论,这个重要理论使得钟形曲线在很多情况下具有可操作性。


与高尔顿大约同时代,有个数学家叫凯特勒,他号称:“钟形曲线无处不在!”


凯特勒要把钟形曲线用在一切地方,他要把世界纳入他的平均哲学中。


凯特勒提出,人的特性均趋向于钟形曲线的均数或中数,越靠两极越少。凯特勒从统计学角度出发看人,认为人的成长会依从一套既定的法则。所以,我们可以透过统计数字,去推算一个人的发展。他还发明了通过身高体重比(bmi)来推算一个人的健康状况。


但凯特勒本人一点也不平均,甚至可以说是个偏执的工作狂。凯特勒对钟形曲线的痴迷到了走火入魔的境地,他提出了“体质平均人”的概念,通过收集统计数据,他开始制造“平均”的标准。胸围、身高、新生儿体重……很少有什么逃过他的标准。


阿道夫·凯特勒又把注意力转入社会学领域,针对人们的行为模式,提出了“气质平均人”概念。凯特勒划定了偏离平均值的范围,他眼里的正常人要么在平均值左边,要么在平均值右边,而那些站在钟形曲线极左端和极右端的人则属于另类,需要惩罚。


尼古拉斯·塔勒布在其睥睨群英的作品中,对钟形曲线进行了深入批判。当然,塔勒布并非对钟形曲线进行质疑的第一人,他只是继承了亨利·庞加莱等人的思想,而这种生搬硬套钟形曲线的方法论,也被人们称为“凯特勒谬误”。


高斯并没有错,高尔顿也没有错,“凯特勒才是思想史上最具有破坏性的人”。数学不会错,但数学会被用错,在凯特勒的“传染”下,钟形曲线得以广泛用于社会领域。


统计歧视


有人调侃,人生就像一个钟形曲线—


你5岁的时候不尿床就是成功;


10岁的时候你开始有自己的朋友就是成功;


25岁时你有自己的幸福家庭就是成功;


35岁时你依然有自己幸福的家庭就是成功;


65岁时你依然拥有好多朋友就是成功;


85岁时你不尿床就是成功。


类似这种玩笑话并无害处,但有些人却以科学之名,推销自己的思想,就变得可怕了。


凯特勒的幽灵还在徘徊,十多年前,曾有一本名为《钟形曲线》(hebellcurve)的书热闹了一阵子,该书的副标题是《美国生活中的智力和阶级结构》。


此书是美国哈佛大学心理学家理查德·j哈瑞斯坦与政治科学家查尔斯·莫瑞合作完成的。该书主要内容包括四部分:


1基于智力基础的社会分层现象日益明显。


2智商与各种社会、经济地位之间存在明显的相关性。


3iq在美国不同种族之间所形成的社会的与经济的贡献中的作用。


4这个了不起的发现对于美国的教育和社会政策会产生哪些影响。


书名之所以称作“钟形曲线”,主要是基于iq得分的钟形的正态分布。


在书中,作者以大量的智力测量结果论证,人的智力是先天遗传决定的,不同的种族具有不同的智力水平,这种观点自然会引起不少争议。这本哗众取宠的作品,为种族歧视提供了理论基础,也被种族主义者奉为宝典。


将军里面挑瘸子


ge公司前ceo杰克·韦尔奇最值得自我吹嘘的管理秘诀就是“活力曲线”,其实质是强制正态分布。


在这个钟形曲线里,韦尔奇将业绩排在前面20%的员工划为a类,中间70%的员工划为b类,业绩排在后面10%的员工划为c类。c类是必须裁掉的对象。


韦尔奇以科学的名义进行奖惩,一直以钟形曲线的法则推行末位淘汰制,从不间歇,所以叫作活力曲线。


这种绩效评估的原理,是按照事物“两头小、中间大”的正态分布规律,先确定好各等级在被评价员工总数所占的比例,然后按照每个员工绩效的优劣程度,强制列入其中的一级。


但问题是,假如低素质员工淘汰完了以后,就要在中等和优良员工里硬挑一些低素质员工来淘汰了。最极端的情形可能是“将军里面挑瘸子”。就好比满分是100分,全部成绩都在90分以上,也要把90分的那位淘汰下来。


韦尔奇很幸运,他在任的时候ge股票猛涨。但ge的成功,不代表他所有的做法都是对的。当韦尔奇成为明星经理人后,他的办法得以传播。强制钟形曲线管理法,在社会上热过一阵子后,基本上销声匿迹了。


幂率曲线


19世末,“共产主义的幽灵,在欧洲徘徊”。


此时,有一位叫帕累托的意大利经济学家发现,财富分配也是不均的。帕累托被称作“资本主义的马克思”,他指出:英格兰财富的80%,掌握在了20%的人口手里。许多其他国家和地方也是如此。帕累托由此得出一个结论:财富分配和人口结构之间,存在着一种可以估算的比率。帕累托称之为“关键少数定律”,也就是现在所谓的“二八法则”。


类似帕累托的这种财富曲线,叫作幂律(powerw)曲线。


我们再以图书销售为例,把图书的销售排名作为横轴,销售量作为纵轴,我们就会得到类似下面这个销售曲线。


幂律的典型是二八法则,实际上幂律正是从它开始的发现。意大利经济学家帕累托发现,在财富的分配上存在着幂律分布,即20%的人掌握着80%的社会财富。


有人将这一法则延伸,80%的工作由20%的人完成;或者80%的工作只产生20%的结果,反之亦然。


“二八法则”也遭遇了惊人的滥用,比如被墨索里尼拿去,为其法西斯主义作合理化解释。


分清“中庸先生”与“极端先生”


天气、豌豆的直径、身体指标等属于平均事件,是按照钟形曲线分布的(姑且称之为“中庸先生”),所以,就算这辈子你看不到一个身高为5米的家伙,也没什么值得稀奇的。


财富数量、图书销量、网站访问量等属于极端事件,遵从的是所谓的幂律曲线(姑且称之为“平均先生”)。


比如,屋子里有100个随机选取的人,世界上个子最高的人走进去之后,这些人的平均身高并不会发生太大的变化。但如果比尔·盖茨走了进去,在场所有人的平均财富将会显著增加。


如果说钟形曲线是一位性格温和的“中庸先生”的话,幂率曲线就是一位性格狂野的“极端先生”。


对自然问题,多问问“中庸先生”;对社会问题,尤其是金钱问题,“极端先生”的意见更为靠谱。


“中庸先生”信奉“天之道”,“极端先生”信奉“人之道”。


在“中庸先生”那里,充满了金色的平均主义,谁也不会比谁高出多少。


在“极端先生”那里,一个数字就足以瓦解你所有的平均值,一次亏损就可以抹平你100多年的积累。


我们唯一应记住的是:道可道,非常道。真理只能证伪,不能证实。面对这个复杂的世界,没有任何一个万能公式,更没有放之四海而皆准的教条。


钟形乌托邦


钟形曲线并非放之四海而皆准,但很多人觉得“钟形曲线无所不在”。钟形曲线为何这么受欢迎?


钟形曲线的魅力在于它分布得很对称,很和谐,很中庸,很民主,容易掌握,让人感觉是温和又可以预测的。收集了足够的数据之后,模式就会自动显现。这符合懒人的胃口,我们不妨把这种理想叫作“钟形乌托邦”。


理解幂率曲线,可以帮助我们和中庸的钟形曲线保持距离。但幂率曲线是位“极端先生”,从来就不像钟形曲线这位“中庸先生”那么受欢迎。


钟形曲线是一位温和的“中庸先生”,幂率曲线是一位狂暴的“极端先生”。


钟形曲线属于自然法则,幂率曲线属于丛林法则。