“美人投票”背后的故事( 二 )


纳什均衡的基本观点并不复杂:在一场两个人或多人参与的非合作博弈中,无论对方选择什么样的策略,自己只要选择能够让自己的收益最大化的策略(支配性策略)即可;与此同时,其他所有的博弈者也遵循这样的原则,选择自己的支配性策略 。这种各自的支配性策略的组合就会形成纳什均衡,并且没有任何一个博弈者可以通过“独自行动”(即单方面改变自己的策略)而增加收益 。
加拿大数学家阿尔伯特·塔克于1950年讲述的“囚徒困境”的故事,常常被用来解读纳什均衡 。假设警察逮捕了A和B两名嫌疑人,由于没有足够的证据指控二人有罪,于是警方分别向两个人给出同样的选择:第一,两个人都保持沉默(二人相互合作),每人都被判半年;第二,两个人都坦白(二人相互背叛),每人都被判5年;第三,一人坦白而另一人保持沉默,坦白的人立即释放,沉默的人被判10年 。对甲来说,由于不知道乙会怎么选,无疑选择坦白是最好的,因为无论乙怎样选择,要么立即被释放,要么被判5年徒刑,都比关上10年要好;而乙八成也会这么想 。因此,在这场博弈中,唯一可能达到的纳什均衡就是双方都坦白,同样服刑5年 。但是从全体利益来看,两个人都保持沉默其实才是最优选择,这样他们都只需要服刑半年——但是,要做出这样的选择,需要两个人都保持绝对理性 。而讽刺的是,虽然我们常常自诩为最理性的动物,现实中的我们却往往是最任性的:我可以保持理性,可我也有放弃理性的自由意志 。
“美人投票”的最优解亦是如此 。从理论上讲,如果全员都选100,那么平均数乘以0.8就是80,所以选择80以上的数字是没有意义的 。但是,这么简单的道理所有人都能想通,大家自然都会选80以下的数字,那么此时平均数乘以0.8就不会超过64,所以选择64以上的数字都是没有意义的 。如果一直这么思考下去,推测的次数越多,这个值就会越接近0 。
那么问题来了,你会选择0吗?你有足够的信心认定其他人也会选择0吗?
2009年,法国认知神经科学家乔治·科里塞利和内格尔在核磁共振成像仪里再现了“美人投票”的游戏 。根据参与者在13轮游戏中的表现,他们被分为低级推理深度、高级推理深度和随机行为(不属于前两种) 。他们发现低级推理深度激活了吻侧前扣带回,而高级推理深度激活了内侧前额叶皮层 。因此,当我们试图思考其他人是如何思考他人(包括我们自己)的思想和行为时,内侧前额叶在这个过程中起到十分重要的作用 。
1978年获得诺贝尔经济学奖的美国心理学家赫伯特·亚历山大·西蒙,提出了有限理性的概念 。有限的理性意味着人们会根据自己拥有的信息做出相对合理的决定,但问题的关键在于,我们很难拥有完美的信息,就好像我们永远无法预测别人是如何思考别人,或者无法预测别人是如何思考别人如何思考别人的 。这并不是一个绕口令,在这个复杂的社会中,人与人的行为彼此交织,相互影响,尽管预测他人的行为对于做出我们自己的决定至关重要,但是,我们每个人都能够进行多层次的深度推理,就连我们自己也无法确定我们会止步于哪一级的推理,更别提去推理别人的思维模式了 。行为科学家常常说,我们甚至无法完美地解释我们所拥有的不完美信息,这也是社会心理学和经济学最让人头痛的地方:我们甚至没有做出最大程度优化我们个人利益的决策,更不用说关系到整个社会和系统的利益的决策了 。