第7章 囚徒困境——理性与利己主义的囚徒

作者:孙恩棣

|

类型:都市·校园

|

更新时间:2019-10-06 13:53

|

本章字节:9948字

年光似鸟翩翩过,世事如棋局局新。


——[宋]僧志文


英明的君主,从不缺乏背弃盟誓的正当理由。


——马基雅维利


1950年,美国兰德智库的几位策略顾问,提出了“囚徒困境”的模型。后来,普林斯顿大学的数学家塔克教授,用一个故事阐述了什么是“囚徒困境”。


嫌犯的两难


“囚徒困境”是博弈论的一个基本概念,经典的囚徒困境如下:


警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人犯罪。


于是警方分开囚禁这两名嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:


若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监15年。


若二人都保持沉默(相关术语称互相“合作”),则二人同样判监一年半。


若二人都互相检举(互相“背叛”),则二人同样判监三年。


嫌犯到底应该如何选择,才能将自己个人的刑期缩至最短?两名嫌犯由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性嫌犯会如何做出选择:


若对方沉默、背叛会让我获释,所以会选择背叛。


若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。


两人面对的情况一样,所以两人的理性思考都会得出相同的结论——选择背叛。


囚徒困境反映的是聪明的利己主义者的悲哀:每个人最聪明的选择,最终并导致集体的悲剧。


囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。


实际上,“囚徒困境”是现实生活中许多现象的一个抽象概括,有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局,是一个对所有人都不利的结局。比如,广告战、价格战、冷战,本质上都属于这种情况。


优势策略和劣势策略


所谓优势策略(dominansraegy),就是不论其他局中人采取什么策略,该策略对你而言都是最好的策略。即某些时候它胜于其他策略,且任何时候都不会比其他策略差。


弄清这个概念的关键是,要知道优势策略的“优势”究竟是对什么而言的。优势策略的“优势”是指你的这个策略对你的其他可选策略占有优势,而不是对你的对手的策略占有优势。


某个参与者如果采用优势策略,就能使自己获得比采用任何其他策略更好的结果。


在囚徒困境的案例中,如果乙抵赖,甲坦白,则甲可以得到宽大;如果乙坦白,甲也坦白,则甲要坐3年牢,但是甲抵赖可要坐15年牢。


对于甲来说,不管乙采取什么策略,他坦白总是比较有利的。


所以两相比较,坦白是他的全面的严格的优势策略。全面,指的是不论对方采取哪种策略,我的这个策略总显示优势:对方坦白,我坦白比抵赖好;对方抵赖,也是我坦白比较好。这是个“全面的严格的优势策略”,简称严格优势策略。


优势和劣势是比较而言。在这个博弈中,既然坦白是优势策略,那么抵赖就是相应的劣势策略。


同样,坦白也是乙的严格优势策略,抵赖也是乙的相应的严格劣势策略。理性的主体人是不会采用对自己明显不利的严格劣势策略的,所以在分析博弈可能的结局的时候,我们应该把局中人的严格劣势策略删去。


一个优势策略优于其他任何策略,同样,一个劣势策略则劣于其他任何策略。假如你有一个优势策略,你可以选择采用,并且知道你的对手若是有一个优势策略他也会照办;同样,假如你有一个劣势策略,你应该避免采用,并且知道你的对手若是有一个劣势策略他也会规避。


无法自拔的“烧钱”困境


广告是一种“烧钱”行为,囚徒困境会让企业陷入疯狂“烧钱”的境地。


假如在一个充分竞争的市场上,a、b两个同行业公司势均力敌,它们的广告投放力度必然会影响到市场份额。


a公司做广告,b公司也要做广告,大家都要为此而付出巨额的广告费用;你不做广告,对方做,你就要牺牲很多的市场份额。


在这种情况下,做广告就是公司的优势策略。两个公司之间是否能够达成都不做广告的协议呢?基本不可能。因为他们之间相互都不信任,谁若遵守协议,就需要冒被对手耍弄的风险。


伊利和蒙牛,曾经占有中国乳业的大部分市场份额,所以,两家企业合则两利,斗则两损。


如果两家能联手,对呼和浩特市官员来说,也是政绩一件。呼市政府,对此可谓用心良苦。


2000年,呼市确立“奶业兴市”战略,并进一步提出了“中国乳都”概念,希望伊利和蒙牛共建、共享“中国乳都”这一品牌。


在一次行业大会上,伊利老总郑俊怀和蒙牛老总牛根生“一笑泯恩仇”。郑俊怀拿了一盒蒙牛牛奶,牛根生拿了一盒伊利牛奶,二人拥抱合影。


2005年10月9日上午,呼市政府召开市长办公会议。


会上,呼市几十万奶农通过奶协向政府反映,蒙牛与伊利在竞争成为奥运赞助商过程中,花钱太多,代价太大,将来不是变相增加奶农负担,便是间接波及奶农生计;又鉴于乳品行业原料涨价、产品降价,已经进入微利时代,不宜再打广告战。


呼市政府认为,两家企业为同城兄弟企业,不宜过分相争,如果两家一起退出北京奥运赞助商的申请活动,将是两利的选择。


在市政府的斡旋下,当天蒙牛与伊利两家企业负责人都承诺暂停广告战,并在《关于退出北京奥运合作伙伴申请活动的函》上签了字。


此函是写给北京奥组委的,核心内容为:根据呼和浩特市人民政府市长办公会议精神,蒙牛与伊利“思之再三,决定共同退出此次奥运合作伙伴申请活动”。


双方当面将此退出申请函发送给奥组委,而且还发了两遍。然而,奥组委在收到两家的退出申请函之后,又收到了伊利再次申请成为赞助商的函件。结果如大家所知,赞助商资格被伊利顺利拿下。


关于广告战的囚徒困境,还有一个政府参与,成功帮企业解套的案例。


美国是一个“金权政治”的国家,很多政府法令的出台,都受大财团的影响。


20世纪70年代,在禁烟运动的声势下,美国国会通过了禁止在电视上做香烟广告的法令。


禁令出台之后,香烟市场肯定会受到影响。但美国的烟草公司并没有动用其金元力量阻止这个法令的通过。


最让人大跌眼镜的是,后来的统计资料表明:尽管烟草广告因受到限制而减少,可是烟草公司的利润却是明显地提高了。


这是什么原因呢?


原来,正是政府的这个禁令反而帮助烟草商们从“囚徒困境”


中得到了解脱。


当时的美国烟草市场,竞争早已白热化了。为了争夺市场,各大烟草公司都必须投入大量的资金做广告。为此,他们每年都要支出巨额的广告费用,这无疑降低了他们的利润水平。


于是,各大烟草公司共同陷入了这样一个囚徒困境:如果烟草公司都不做广告,他们的利润要更高。可是,在竞争如此激烈的情况下,如果其中一家公司不做广告,他的市场份额很快就会被其他公司抢走。如果别的公司的广告力度更强,那么自己公司的顾客就会被别的公司挖走。自己若不甘被“挖墙脚”,必须投放至少同样强度的广告来自卫或反击。


现在好了,政府禁烟了,烟草公司虽然销量少了很多,但广告支出也少了,利润反而上去了。


价格大战


抛开囚徒困境这一模型暗示“犯罪人应当订立攻守同盟”这一道德问题不说,我们仍可以从中得出很有益的启示。


人类的自私天性,使他们陷入囚徒困境难以自拔。社会生活和商业竞争中的许多逻辑都可以用囚徒困境来解释。经济学把两个企业联合起来垄断或几乎垄断了某种商品的市场,称为双寡头经济。


双寡头经济,是种最典型的商业博弈现象。比如,可口可乐和百事可乐,麦当劳和肯德基,伊利和蒙牛,都是典型的双寡头经济。


例如,可口可乐公司和百事可乐公司之间的争斗。它们争斗的目的当然是增加自己企业的利润。为什么两家企业要进行价格大战呢?那是因为每家企业都以对方为敌手,只关心自己的利益。


在这个博弈中,两家企业都可以打出高价或低价。但是,不管对方怎么做,两家公司打出低价都比打出高价有利。假如对手打出低价,那么所有的顾客就会跑到他那里去,除非你也打出低价。假如对手打出高价,打出低价也会对你有利,因为所有的顾客都会跑到你这里来。对两家公司来说,打出低价都是优势策略,所以这个博弈的可能结果就是两家企业都打出低价。


当然,假如两家企业能订出维持高价的强制协定,双方就可以互蒙其利。但这种协定很难维持,因为它就像是囚徒困境中的警察和犯人一样,两家企业都想要假装遵守协定,然后等对方打出高价的时候再打出低价,以拿下所有的市场。


在价格博弈中,只要以对方为敌手,那么不管对方的决策怎样,自己总是采取低价策略就会占更多市场份额,获取更大利益。这就促使双方都采取低价策略。


恐怖平衡


军备竞赛的囚徒困境有朝一日可能会引起大浩劫。假如再来一次世界大战,人类文明几乎会被毁灭殆尽,以后恐怕只能用木棒打仗了。


在冷战期间,两个敌对的阵营都拥有原子导弹。局势可说是瞬息万变,因为双方都有导弹,假如某一方发动突袭,就有可能摧毁敌国。


在冷战时期,有很多人都在思考要怎么避免这种核恐怖。为了发展长效性的阻吓武器,美苏都花了庞大的经费设置大量的导弹。


美苏为了维持恐怖平衡,必须让对手相信,光靠先发制人绝对打不赢核战争。这就需要不断制造比对方更多的核弹,以确保自己在遭受核弹攻击时仍有反击的余地。


这场全面的“东方对西方”的战争,之所以并未真正爆发,最大的原因是由于双方都拥有大量的核子武器,存放在不同的地点。


一旦直接冲突,可能导致全人类毁灭,因此双方都尽力避免发生全面的“热战”。


公地悲剧


公地悲剧即哈定悲剧,最初由哈定(garrihadin)1968年在《科学》杂志上发表的文章ragedyofcommons中提出。也有人将之译为“公共资源的悲剧”、“公共地悲剧”等。


哈定举了牧民与草场这样一个例子。当草场向牧民完全开放时,每一个牧民都想多养一头牛,因为多养一头牛增加的收益大于其购养成本,是有利润的。尽管因为平均草量下降,增加一头牛可能使整个草场的牛的单位收益下降。但对于单个牧民来说,他增加一头牛是有利的。可是如果所有的牧民都看到这一点,都增加一头牛,那么草场将被过度放牧,从而不能满足牛的需要,导致所有牧民的牛都饿死。


油田往往是藏在好几家钻油公司的土地下方,当油田上方的土地属于同一家公司时,“油老板”会很小心地抽油,以尽量提高利用率。不过,如果这块地属于几家公司,大家就会抢似的抽油。


因为你抽得很谨慎,我抽得很快,我的产油量就会比你多,当各方都试图以最快的速度抢油时,共用的油田就会有很大一部分变得永久枯竭。在这种情况下,“油老板”便发现自己面临了囚徒困境:不管别的“油老板”怎么做,抽快一点对你一定有利。


公地悲剧也是环境污染的原因,假如某地存在着工业污染,政府又没有管制措施,企业为了追求利润的最大化,宁愿以牺牲环境为代价,也绝不会主动增加环保设备投资。


所有企业都会从利己的目的出发,采取不顾环境的策略。如果一个企业从利他的目的出发,投资治理污染,而其他企业仍然不顾环境污染,那么这个企业的生产成本就会增加,长此以往,企业就会在竞争中落败。