囚徒困境:什么样的选择是抗疫策略最优选择?

囚徒困境与抗疫策略选择

囚徒困境(prisoner's dilemma)是指两个被捕的囚徒之间的一种特殊博弈,说明为什么甚至在合作对双方都有利时,保持合作也是困难的。 囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。 虽然困境本身只属模型性质,但现实中的价格竞争、环境保护、人际关系等方面,也会频繁出现类似情况。

囚徒困境:什么样的选择是抗疫策略最优选择?

�s经典的囚徒困境如下:

警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人有罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:

若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。

若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。

若二人都互相检举(互相“背叛”),则二人同样判监2年(如图1所示)。

甲想:1)如果乙沉默,我也沉默,我被判0.5年;但是如果我认罪,我会马上被释放,所以认罪是更好的选择。

2)另一种情况,如果乙认罪,我沉默,我被判10年;如果我也认罪,我背叛2年,所以认罪是更好的选择。

无论乙沉默或者认罪,认罪对于甲都是更好的选择。同样乙也是这样分析的,最终二人都选择了认罪,被判2年,而没有选择全局最优的0.5年。

背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。

这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判监均比合作为高,总体利益较合作为低。这就是“困境”所在。

譬如假设某个地区如果爆发疫情,那么个人利益最大化的方式必然是尽快逃离。但如果大家都四散逃离,那么必然导致疫情四散,使得其他地区的援助物资和医护能力被大大削弱,反而造成了系统性的紊乱。因此尽早封城是集体的最优解,四散逃逸是集体的最差解。同理,其他地区的群众面对疫情的个人最优解是尽快囤积各类物资,可如果大家都在囤积,必然会导致疫区中心的医疗防护能力变得脆弱,反而延长了疫情和复工的时间,损害了所有人的利益。因此从集体的角度来看,不囤积物资是最优解,抢购物资反而是最差解。

站在集体的角度,很容易看出来哪个决策更符合所有人的利益,但是站在个人角度,大家则往往会反其道而行之。这是因为最优解往往都是非常反人性的,因此大家往往都会像老贾那样,最终搞成双输甚至多输的结局。

那么,根据这个理论模型,国外疫情大暴发之时,华人选择回国去避险或去治疗,一方面增加了长途旅行感染风险,另一方面如果是病毒携带者,势必给别人带来极大的安全隐患,甚至给国内防控形势造成严重不利影响,这种情况下,他(她)的选择是最优解吗?

大家不妨来讨论一下吧。


分享到:


相關文章: