剪刀石头布背后的博弈
2014-5-22 10:54:57 来源:生活周刊 我要评论()
要想让剪刀石头布的结果真正随机,那么从数学上讲必须有一个前提,就是参与者甩出来的手势是随机的。然而研究人员发现,人类并不擅长做出随机的动作,我们总是免不了将某种规律暗含在行为中。
伦敦人鲍勃·库珀(Bob Cooper)外号“石头”。这常常给他的竞争对手带来一种错觉。对手们会以为他习惯于出“石头”,于是他们会相应地出“布”。而库珀有意利用了这一点,他会出“剪刀”来打败对手。
库珀是2006年剪刀石头布世界冠军。他打败了496人之后获得由“世界剪刀石头布协会”颁发的奖牌。那块奖牌看起来跟任何“正规”体育运动的奖牌没什么区别。但是很少人会意识到剪刀石头布是一种策略性运动,大部分人认为它靠的只是运气。
剪刀石头布的游戏最早可以追溯到中国汉代,典籍中将其称为“手势令”。同样的游戏在日本的历史上也有很多记载,后来它在20世纪初传到欧洲。直到1930年代,美国记者在报纸上提到它时,还需要特意描述一下游戏规则。
A能打败B,B能打败C,而C又能打败A。表面上看来非常公平,但数学家早就注意到事情并没有这么简单。
英国牛津大学的数学家马库斯·杜·索托伊(Marcus Du Sautoy)2011年千里迢迢去到美国费城,观看在那里举行的剪刀石头布比赛,其获胜者会去拉斯维加斯参加决赛。索托伊在记录了这段经历的影片《密码》(The Code)中指出,如果游戏是完全公平的,那么每个参赛者的获胜几率都是一样的,然而,总有一些人能够一次又一次地获胜。
美国加州大学洛杉矶分校的社会神经科学家马修·利伯曼(Matthew Lieberman)也在其著作中提到,如果剪刀石头布是一种公平游戏,“那么鲍勃·库珀一定是这个星球上最幸运的人”。
要想让剪刀石头布的结果真正随机,那么从数学上来讲必须有一个前提,就是参与者甩出来的手势是随机的。然而大量的研究已经发现,人类并不擅长做出随机的动作,我们总是免不了将某种规律暗含在行为当中。
制胜法则
在一篇不久前被贴到论文“预印本”平台上的学术文章中,中国的研究人员描述了他们最新获得的剪刀石头布“制胜法则”。这种制胜法则也正是基于人类不自觉的行为规律。
浙江大学实验社会科学实验室的王志坚与合作者招募了360名学生,将他们分为6组。每一名学生都会跟他同组的人玩300轮剪刀石头布,一个人在游戏中获胜的次数越多,他们也将获得越多的金钱奖励。
结果表明,从总体上来看剪刀、石头和布出现的次数基本是相等的,就像是随机得到的结果。然而,再仔细分析数据则发现了一个有趣的规律:如果参赛者在一轮游戏中获胜,那么接下来他会倾向于更频繁地使用获胜手势;失败者则倾向于换一个手势,并且,他们选择的顺序是按照游戏名称中顺序来的。
比如说,如果大家习惯于把游戏称为“剪刀石头布”,一名参赛者在甩出“剪刀”输了之后,下一次他出“石头”的几率是高于三分之一的。
类似的规律也被剪刀石头布的专业玩家总结过,比如在北美,人们称呼这种游戏时的顺序是“石头、纸(布)、剪刀”,那么男人们甩出三种手势的可能性从高到低依次是石头、布、剪刀,而女人们的顺序则是石头、剪刀、布。
由此,根据中国科学家的研究,游戏的“制胜法则”是:如果你的对手用“石头”打败了你,那么你接下来可以选择出“布”;如果你的对手出“石头”输了,那么接下来你大概应该出“剪刀”——如果你的对手习惯于把这项游戏称为“剪刀石头布”的话。
不过,科学家研究剪刀石头布并不是为了找到它的最佳策略,他们在这个游戏中看到了更深层的含义。
如果每个参赛者都将自己的手势做到完全随机、不可预测,那么他们就最大程度上避免了相互利用,由此达到博弈论中的“纳什均衡”。而事实却不是这样,科学家发现人们在无意识中采用了“赢则留、输则变”的策略,这被称为“条件响应”,这种规律可能与人类大脑的结构有关。
“在生物学层面上,条件响应究竟是人脑的一种基本的决策机制,还是更为基础的神经机制带来的一个结果,这仍是未来研究中具有挑战性的问题。”王志坚等人在论文稿中写道。
在实际的游戏中,你也并不可能仅靠这个科研成果变得天下无敌。专业的玩家有非常复杂的策略,仅仅由世界剪刀石头布协会主席编写的《剪刀石头布官方指南》一书就有两百多页,这还只被认为是一部启蒙书籍。剪刀石头布大师们还会各自有独门绝学。
社会神经科学家利伯曼在他的著作中列举了新手很容易被利用的一些情况。比如新手会比较多地出“石头”,因为与剪刀和布相比,石头更加能够显示力量。再比如,如果一个人连续两次出相同的手势,那么第三次就有更大的可能性发生改变。
后一个例子很有趣,因为它说明了人不善于给出随机的手势。索托伊也提到过这一点。如果你抛了两次硬币都是字朝上,并不代表你第三次抛的时候花朝上的概率更高。因为硬币是没有记忆的。但如果你跟人——特别是新手——玩剪刀石头布就不是这样。老手于是很容易利用新手的这些特点来大大增加自己的获胜几率。
自动模仿
英国科学家还做过另一个有趣的剪刀石头布实验。他们让参赛者蒙着眼睛玩。
这种情况下,他们得到了一个与数学上完全一致的结果:在33.3%的情况下,参赛者会打成平手。
然而,当他们改变设定,让参赛的一方蒙着眼睛,另一方不蒙的时候,平手的比例就发生了显著的变化——上升到了36.3%。
为什么会出现这种变化呢?研究人员认为这是因为不蒙眼的一方在模仿蒙眼的一方。他们测量了每个人的反应时间,发现如果蒙眼者甩出手势的时间略早,那么不蒙眼者就有更大的可能性甩出相同的手势。
这恰恰是“荒谬”之所在。剪刀石头布游戏的精髓就是你要跟对方出得不同,但人们却倾向于给出相同的手势。科学家猜测,这可能暗示了人类模仿他人的惯性有多么强大。在这其中起到关键作用的可能是大脑中的“镜像神经元”。
镜像神经元最早是意大利的一组科学家1980年代在实验室里发现的。他们在监测猴子大脑的神经活动时,意外地发现了一个现象:猴子伸手去拿食物的时候脑部会有一部分特定神经元活跃起来,而当它们观察科学家伸手拿食物的时候,脑部同样的神经元也会被激活。仅仅是看到食物,或者是看到科学家假装拿食物,都不会有这些响应。
科学家以前认为大脑中一定是有不同的神经元分管知觉和行动,然而镜像神经元的发现颠覆了这一观念,知觉和行动可以在同一批神经元中发生。当我们看到同类的一个动作的时候,镜像神经元就会催促我们对它进行模仿。这在神经科学中被称为“自动模仿”。
虽然对于这样的行为是否真的是“自动”,以及是否真的是“模仿”,科学界还在进行许多严格的讨论,但是镜像神经元及其带来的自动模仿常常被认为是人类能够产生社会性的根源之一。至少在那些做剪刀石头布实验的英国科学家看来,自动模仿的力量如此之强大,以至于即便不模仿是最符合利益的事情,但人们也还是忍不住会去模仿。
读心术
为了不受自身行为局限的影响,一个剪刀石头布的玩家想要做到完全随机甩出手势,那么最直接的方法就是事先背下一段随机手势。数学家索托伊就采用了这种策略。
他把圆周率毫无规律的数字转换成剪刀石头布的手势,他认为这样对手就完全无法预判他会甩出哪个手势。这种策略是一种“赢不了,亦输不了”的办法,或者说是一种消极的策略,而根据博弈论,想要在游戏中胜出,采取一种积极的策略是更好的办法。
毕竟参赛的双方很难在策略水平上完全处于相等的地位。专业比赛中很少有一局定胜负的玩法,因为一局是不足以观察对方的。通常会采取三局两胜或五局三胜,这样参赛者能够有机会参透对方。
剪刀石头布一度被认为是一种完全的人为设定——在自然界中,不可能有A打败B、B打败C,而C又能打败A的情形。然而生物学家后来真的发现了两个自然界的案例。
斯坦福大学的生态学家布伦丹·博安南(Brendan Bohannan)发现大肠杆菌的三种菌株S、R、C之间刚好构成了剪刀石头布的关系。S菌株生长的速度比R菌株快,R菌株生长的速度又比C菌株快。而C菌株能够分泌出一种毒素毒死S菌株,但R菌株却能够抵抗这种毒素。
另一个例子被印第安纳大学的生物学家巴利·斯诺夫(Barry Sinervo)和同事在美国加利福尼亚的海岸山脉里发现。侧边斑点蜥蜴有三种变体,它们的喉部分别呈现出橙色、蓝色和黄色。这三种蜥蜴拥有不同的交配策略,而三种策略又各有优缺点。
橙色蜥蜴个头大又很猛,于是能够占领蓝色蜥蜴的领地,并且获得很多雌蜥蜴。蓝色蜥蜴则能够相互合作保卫自己的领地,不让黄色蜥蜴跟自己的雌蜥蜴偷偷交配。而黄色蜥蜴没有领地概念,但它们能够模仿雌蜥蜴的行为和颜色,潜入橙色蜥蜴的领地里跟雌蜥蜴交配。
科学家后来的研究表明,蜥蜴之间的这种剪刀石头布关系可能会让新的物种得以形成。
至于数学家索托伊,他2011年采用圆周率的策略去打比赛,以未能进入半决赛告终。他也用圆周率跟鲍勃·库珀对抗过,结果库珀连赢他八次。神经学家利伯曼认为库珀采用的是读心术,通过索托伊细微的表情和肢体语言判断出了这名数学家接下来会甩出什么手势。
库珀曾这样讲解剪刀石头布的秘密:“它不是要你预测对手将甩出什么手势,它是要你预测对手对你会甩什么手势做出何种预测。”