第20章 均值回归—可媲美万有引力的一个发现

作者:孙惟微

|

类型:生活·百科

|

更新时间:2019-10-06 13:07

|

本章字节:12790字

没有树能长到天上去。


—西谚


均值回归这个现象的意义,不亚于万有引力。


—丹尼尔·卡尼曼


天之道,损有余而补不足。人之道,则不然,损不足以奉有余。


—《道德经》


大自然似乎厌恶极端,偏爱中庸。


它的调节手段之一,就是所谓的“均值回归”。


比如,非常高的父亲,其儿子往往要比父亲矮一些;而非常矮的父亲,其儿子往往要比父亲高一些。冥冥中似乎有种神秘的力量,使得人类的身高从高矮两极移向所有人的平均值。否则,用不了多少代,人类种族就将由特别高和特别矮的两极构成。


再如,世界上庸人最多,天才和白痴都很稀少。这在统计学中,就表现为所谓的“正态分布”。


四季交替、“歪竹子生直笋”“飘风不终日,暴雨不终朝”,类似这种现象,用均值回归(meanreversion)原理,可以合理地进行解释。


一些牛人把均值回归原理套用在经济、金融领域,似乎也取得了一定效果。但是,这样做真的有效果吗?


高尔顿的豌豆实验


“均值回归”现象是英国人弗朗西斯·高尔顿发现的。高尔顿出身名门,与著名的查尔斯·达尔文是堂兄弟。


高尔顿颇以自己的门第为傲。高尔顿发现均值回归的最初动机,是为了证实自己的“天赋世袭”理论。也就是所谓“龙生龙凤生凤,老鼠生儿会打洞”。但最后的结果,却难免让他失望。


“低素质”者的后代不一定素质差,“高素质”者的后代素质未必高。遗传的规律是朝着某个平均数回归。自然界“歪竹子生直笋”“直竹子生歪笋”的事情不胜枚举。


大约1875年,高尔顿用一种甜豌豆种子做实验。他还把这些种子分给自己在各地的亲朋好友,一起帮他做实验。经过大量艰辛的实验,最后,高尔顿得出如下统计结果:


从表格中我们可以发现,母豌豆直径的变化范围比子豌豆直径的变化范围要大很多。母豌豆的平均直径为018英寸,其变化范围是015~021英寸,或者说是在平均值两侧各003英寸之内。子豌豆的平均直径为0163英寸,其变化范围是0154~0173英寸,或者说是仅在平均值两边各001英寸范围内变动。子豌豆直径的分布比母豌豆直径的分布更为紧凑些。


这种回归,在自然界是非常必要的。如果这种回归的进程不存在的话,那么,大的豌豆会繁殖出更大的豌豆,小的豌豆会繁殖出更小的豌豆……如此下去,这个世界就会两极化,只有侏儒和巨人。大自然会使每一代变得愈发畸形,最终达到我们无法想象的极端。


做完豌豆实验,高尔顿又开始对人群等目标进行统计,提出了一个普遍原理,这就是我们现在所知的“均值回归”原理。


比如说,高个父亲的儿子身高一般高于平均水平,但不会像他父亲那样高。这意味着用于预测儿子身高的回归方程需要在父亲的身高上乘以一个小于1的因子。


实际上,高尔顿估计出父亲每高于平均值1英寸,儿子的预测身高就能高出三分之二英寸。


高尔顿统计父母和孩子智商之间关系的回归方程时,再次发现了这个现象。聪明父母的孩子比iq一般父母的孩子聪明,但却没有他们的父母那么聪明。


淹三年,旱三年,不淹不旱又三年


农谚有云:“淹三年,旱三年,不淹不旱又三年。”在圣经中,当约瑟夫对法老王预言“七个富年后必是七个荒年”的时候,他很可能也察觉这种规律了。


在《旧约·创世记》中,约瑟因诚实而闻名,尽管有时要付出沉重的代价。在监狱里,他替被囚在监狱里的埃及王的酒政和膳长解梦。约瑟对酒政说他的梦解作为“三天之内出监并官复原职”。约瑟又对膳长的梦解作为“三天之内,法老必斩断你的头,把你挂在木头上”。其实,约瑟没有必要告诉他这残酷的消息,但他不爱撒谎。


两年后法老做梦,没有人能解。酒政就向法老推荐约瑟。之后约瑟向法老解梦,说埃及将会有七个大丰年,然后又会有七个荒年。约瑟又劝告法老“当拣选一个又聪明又智慧的人,派他治理埃及”。


于是,法老选择约瑟做了宰相,因为约瑟“有神的灵在他里头,我们岂能找得着呢”。


约瑟此后在埃及掌权,得了个埃及名“撒发那忒巴内亚”,又娶了个埃及妻子。


均值回归在日常生活中的应用


均值回归原理有时也适用于日常生活,比如在体育运动方面,人人都有一个平均水准。但有时会超水准发挥,有时会低于平均水平。任何一连串的重复活动,其结果通常都会接近平均值或中间值。


例如,打网球时连续挥拍24次,如果有一个球打得特别好,下一个球就可能有点拖泥带水。如果不小心打了一记坏球,下一个球通常会打得漂亮一点。


在20世纪60年代,行为经济学家特韦斯基和卡尼曼曾经回以色列服兵役。在部队里,教练训练飞行员的方式引起了他们的兴趣。


在飞行员的训练上,教练常谈到若因表现不佳而受到严厉批评,飞行员才会进步;若飞行员表现意外地好,又得到赞赏,则会退步。


教练很自然把这种现象归因于某种心理作用,因此对进步赞许,对退步责难。


熟悉统计学的读者,也许早就看出,这些教练犯了一个错误,其实这只不过是均值回归的正常现象罢了,偏偏却被误解为因果关系。


于是,特韦斯基向这些教练指出了他们的理论缺陷,后来的以色列飞行员也因此改善了待遇,得到了应有的尊重。


当你表现比平时好的时候,要维持就比较难,听起来好像挺令人失望,不过相反的情况也会成立,就大大有激励作用。


在作决策时,最不好的情况就是明明没有特殊原因,却自以为有,趋向于均值回归是生活中无法避免的现象。


“均值”什么时候能“回归”?


均值回归原理在自然领域获得了验证,它又与一些社会现象颇为相似,例如“天下大事,分久必合,合久必分”“繁荣的必将衰亡,衰亡的必将繁荣”“富不过三代”“君子之泽,五世而斩”……均值回归原理激发了赌客们的梦想:一连串损失后必定会跟着一连串盈利。


同时,均值回归原理成了一些风险控制理论的基础,比如在股市,人们经常说的“市场是波动的”,就是这个意思。


均值回归,从理论上讲应具有必然性。有一点是可以肯定的,股票价格不能总是上涨或下跌,一种趋势不管其持续的时间多长都不能永远持续下去。


在一个趋势内,股票价格呈持续上升或下降,叫作均值回避(meanaversion)。当出现相反趋势时就呈均值回归(meanreversion)。


这也是逆向投资者恪守的信条:当他们说某只股票已经“高估”或者“低估”时,股价背离了它的“内在价值”,股价最终是要回归的。


“内在价值”,也许真的会“回归”,但关键在于什么时候回归?


到目前为止,均值回归原理仍不能预测的是回归的时间间隔,即回归的周期呈“随机漫步”。


不同的股票市场,回归的周期会不一样,就是对同一个股票市场来说,每次回归的周期也不一样。


有时,长期趋势来得太迟,即便均值回归原理发挥了作用,也无法拯救我们了。比如,从长远看,一间着了火的房子,总归会归于寂灭。


一次,经济学家凯恩斯说道:“先生们,从长远来看,我们都会死掉的。如果在狂风暴雨的季节里,经济学家仅能告诉说,很久后,风暴会过去的,一切又会恢复平静的,那么他们的工作就太简单、太无用了。”


预测“均值”是场赌局


还有个问题就是“均值”怎么确定。均值到底是多少,在经济生活中却是个很模糊的数字。昨天的正常值很可能被今天新的正常值所取代,而我们对这个正常值却一无所知。


巴菲特的价值投资理念,也是基于均值回归原理。但是,学巴菲特的人多如牛毛,能够成功的凤毛麟角。巴菲特只能崇拜,不能复制。


巴菲特的长子曾说:“我爸爸是我所知道的‘第二个最聪明的人’,谁是第一呢?查理·芒格。”


查理·芒格是沃沦·巴菲特最亲密的战友,有“幕后智囊”和“最后的秘密武器”之称。


有人曾问:“如何评估一只股票的‘内在价值’?”


芒格回答:“搞清一只股票的‘内在价值’远比你成为一个鸟类学家难得多。”


何必削足适履


高尔顿只是把均值回归应用到了遗传等自然科学领域。在这些领域,它多数情况下是适用的、正确的。这也就是几千年前的老子观察到的—“天之道,损有余而补不足”。但老子的后半句却非常明确地指出,“人之道,则不然,损不足以奉有余”。


回归平均原理为许多决策制定提供了哲学的方法。在自然界中,几乎不可能发生大的事物变得无限大,而小的事物变得无限小的情况,比如树会长得穿越云霄。


社会领域运行的是“幂率”,是不平均的。一个普通的华尔街交易员的年收入,可能比中国西北一个县全年的gdp还高。一个国王可以娶4万个嫔妃,而一个农奴可能娶一房老婆都很吃力。


真实的社会,运行的“二八法则”—20%的人,掌握着80%的社会财富。而且,在这20%的富人中,二八法则还可以进一步产生作用—4%的人,掌握着全社会64%的财富。


在真实的社会,运行的是“马太效应”—凡有的,还要加给他,叫他有余;凡没有的,连他所有的,也要夺取。


曾在某本书中读到这样一个案例,某老板每年都会给公司的业务员进行业绩排名,对业绩靠前的进行奖励,业绩靠后的进行惩罚。几年下来,老板发现一个规律,头一年受罚的业务员,次年业绩转好,头一年受奖的业务员,次年业务下滑。


作者最后总结:这其实是中值回归的自然现象。


对于这个案例的代表性,笔者持保留态度。也许,把手扶电梯当作跑步机来锻炼也没有什么害处,但用于决策,就可能是个陷阱。


笔者经营企业多年,深知公司的业务通常符合“二八法则”—大约80%的业务是靠20%的业务尖子完成的。在很多行业中,比如外贸,比如广告,80%以上的业绩是由不到20%的业务员签下的。笔者也曾对这些业务尖子进行奖励,对业务不佳者进行惩罚,结果并没有出现上面案例中的奇怪现象。


如果上面这个案例,改成计件生产的工人,则会让人信服得多,因为工人的能效,基本上就可以算出一个“均值”。


不要将均值回归巫术化


虽然弗朗西斯·高尔顿发现了均值回归,但他本人并不迷信它,他反而鼓励我们去“欣赏广泛的观点”,而不仅仅是平均值的观点。


对未来作判断时,应该在多大程度上依靠均值回归原理呢?


我们必须清楚,在某些条件下,均值回归具有巨大的力量;而在另外一些条件下,均值回归则可能导致巨大的灾难。


经济体系具有复杂、动态和非线性的本质,我们可以大谈特谈其大趋势,却无法作具体预测。就算是天气预报,也只能告诉你立春和夏至,却永远无法预测出那天的天气如何,甚至无法准确地预测出明天的天气。


天之道不同于人之道,自然界中的力量不会赞同人类灵魂中的力量。急于将数学公式、统计学原理,生搬硬套到社会学领域,以示自己的科学性,与伪科学、巫术何异?


均值回归仅是一种工具,而不是教条,更不是宗教仪式。如果一定要削足适履地迎合均值回归理论,那么它就成了一种自欺欺人的工具。


理论背景:高尔顿和他的优生理论


高尔顿是著名的医生和植物学家伊拉斯谟·达尔文的曾孙,另一个曾孙查尔斯·达尔文是高尔顿的堂兄,他写出了惊世骇俗的《物种起源》。高尔顿的爷爷和父亲都是极其成功的银行家。


统计狂人


据说,4岁的时候,高尔顿就能够任何英文书籍,以及进行加减乘除的运算。


在高尔顿的时代,有一种很可贵的风尚,那就是纯粹为了科学而从事科学研究,而不是出于谋生的考量。


高尔顿有一个嗜好,那就是统计—几乎到了走火入魔的地步。


高尔顿不论走到哪里,都要记录、计算。他曾制作过一份“美女地理志”。在逛街时,他对少女的漂亮程度进行分类,当看到一个漂亮女孩子时,他就在右边口袋的卡片上扎一个小孔。在他的英国“美女地理志”上,伦敦女孩子得分最高;而阿伯丁的女孩子得分最低。


高尔顿通过对10000名法官的审判结果进行统计,发现审判刑期大部分是3、6、9、12、15、18和24年;11年和13年的刑期很少,唯独没有17年的。


他还记录下各色人等的头颅、鼻子、胳膊、大腿、身高、体重的数据,还记录眼睛的颜色、遗传的不孕率、人们听讲座时烦躁的次数以及人们在看比赛时脸色变化的程度等。


高尔顿本人并不知道大数法则,但自己却从数据中发现了它,他还发明了一种“梅花相位仪”,通过往这种仪器里掷弹球,可以直观地演示钟形曲线的形成。


高尔顿喜欢在深夜进行学习和研究,他发明了一种“精力恢复仪”来使自己保持清醒,这种装置可以向他的头上喷凉水,从而使他保持清醒。在他生命的后期,他发明了一种能在水下的装置;但是有一次,当他在澡盆的水中一本好书时,差一点被淹死。


天赋遗传理论


1859年,高尔顿的堂兄查尔斯·达尔文的《物种起源》发表了,这部著作极为轰动,也极大地刺激了高尔顿。达尔文最基本的假设之一是,在任何物种的成员之中,都有少量遗传的变化或者差异,进化是通过物竞天择、适者生存的原则发生的。


《物种起源》只是针对动物而言的,但高尔顿决定把它的结论推广到人类中。他认为,人类的进化很可能是通过卓越的大脑向子孙传递而发生的。他将这个研究领域命名为“优生学”。


半个世纪后,“优生学”这个词为纳粹所用。纳粹鼓励纯种“雅利安人”的繁殖,消灭犹太人、吉卜赛人和其他被他们认为是人类害虫的人种,他们屠杀了成百上千万的、他们认为“完全没有才华和价值”的人。


古希腊的“优生学”


优生学是柏拉图首先提出的,他的学生亚里士多德继承和发扬了这一观点。斯巴达婴儿一出生,就要抱到长老那里接受检查,不要说残障儿,就连体质不够强壮的新生婴儿都会被他们无情地抛到荒山野外,任他死去。


学者易富贤指出,古希腊的这种“优生优育”的措施不但没能提高人群素质,反而在降低人口数量的同时也降低了人口素质。从群体来说,某些人可能会终生默默无闻,但是他们的某一代子孙却可能为社会作出重大贡献。


命运开的玩笑


高尔顿发现均值回归的主要动力,是要弄明白在某些家族中才华是如何被代代相传的,这些家族包括达尔文家族以及贝努利家族。他特别希望能在他所认为的有着极高才华的家庭中确认出“极度高贵特质”。


高尔顿希望他的后代能够继承他的才智,但命运和他开了个玩笑,他和两个兄弟一个妹妹一样,没能生下一男半女,基本上“绝户”了。


在研究过程中,高尔顿发现,某个人的杰出不能长久持续,也就是说,杰出的生命极为短暂。


高尔顿还发现,在杰出人物的儿子中,仅有36%的人仍旧是杰出的,更糟糕的是,在其孙子辈中,只有区区9%的人还能称得上杰出。