博弈论66个经典例子(博弈论的三个基本要素)

案例1囚徒困境在博弈论中,占优战略均衡的一个著名例子是塔克给出的“囚徒困境”博弈模型。这个模型以一种特殊的方式告诉我们一个警察和一个小偷的故事。假设两个小偷A和

博弈论66个经典例子(博弈论的三个基本要素)

案例1

囚徒困境

在博弈论中,占优战略均衡的一个著名例子是塔克给出的“囚徒困境”博弈模型。这个模型以一种特殊的方式告诉我们一个警察和一个小偷的故事。假设两个小偷A和B共同作案,进入私宅,被警察抓住。警察把这两个人放在两个不同的房间里审问。对于每个嫌疑人,警方给出了如下政策:如果两个嫌疑人都交代了自己的罪行,并且交出了赃物,那么证据确凿,两人都被定罪,判处8年有期徒刑;如果只有一个犯罪嫌疑人坦白,另一个人不坦白而否认的,以妨碍公务罪(因为有证据证明他有罪)追加2年有期徒刑,而坦白者减刑8年后立即释放。如果两人都否认,警方因证据不足不能判他们盗窃罪,但可以以非法侵入罪各判一年监禁。下表显示了这个博弈的收益矩阵。

博弈论66个经典例子(博弈论的三个基本要素)

对于A来说,虽然他不知道B会做出哪个选择,但他知道无论B做出什么选择,他选择的“表白”永远是最好的。很明显,根据对称性,B也会选择“坦白”,结果两人都被判八年。但如果都选择“否认”,每人只判一年。在表2.2的四个行动选择组合中,(否认,否定)是帕累托最优的,因为任何偏离这个行动选择组合的其他行动选择组合至少会使一个人的处境变得更糟。但是,“坦白”是任何犯罪嫌疑人的优势策略,(坦白,坦白)是一个优势策略均衡,即纳什均衡。不难看出,纳什均衡和帕累托在这里是有冲突的。

从数学的角度来说,这个理论是合理的,即所有的选择都是坦诚的。但在这样一个多维信息共同作用的社会学领域,显然是不合适的。就像在中国古代,官员之间的贿赂被称为“坏规矩”而不是想尽一切办法去查,这是因为社会制度对人们行为的约束作用迫使人们的政策发生变化。比如从心理学的角度来说,选择表白的成本会更大,一个表白会害了另一个,那么事后的报复,以及在周围知情人中“出卖”的作用,会让他损失更大。但8-10年的涨幅会被稀释,人的尊严会让人产生报复心理,稍微打破“规则”。我们正处于大数据时代。处理一个更接近事实的事情,需要尽可能多的掌握相关信息,进行合理的权重分析。人的动像动机是复杂的,囚徒困境只能作为一个简化的模型参考,具体决策还得具体分析。

博弈论66个经典例子(博弈论的三个基本要素)

手表行业旅游

猪游戏

一、经济学中的“猪的游戏”( Pigs'payoffs)这个例子是:

假设猪圈里有一头大猪和一头小猪。猪圈的一端有一个猪饲料槽,另一端装有一个控制猪饲料供应的按钮。当你按下按钮时,10个单位的猪饲料将进入槽中,但谁按下按钮,谁先支付2个单位的成本。在去猪饲料槽的路上,会有两个单位猪饲料的物理消耗。如果大猪先去低谷,大猪与食物的收益比为9:1;同时动作(按下按钮),收入比为7:3;仔猪先到了低谷,收益比6∶4。那么,在两头猪都有智慧的前提下,最后的结果是猪选择等待。

“聪明猪博弈”是纳什在1950年提出的。其实,猪之所以选择等待,让大猪按下控制按钮,而自己选择乘船(或搭便车)的原因很简单:在大猪选择行动的前提下,如果猪选择等待,猪可以获得4个单位的净收入,而如果猪行动,只能获得大猪留下的1个单位的净收入,所以等待比行动好;在大猪选择等待的前提下,如果小猪行动,小猪的收益将无法覆盖成本,净收益为-1单位。如果小猪也选择等待,那么小猪的收益为零,成本为零。总之,等待胜于行动。

博弈论66个经典例子(博弈论的三个基本要素)

从矩阵中可以看出,当大猪选择行动时,如果小猪行动,其收益为1,而如果小猪等待,其收益为4,所以小猪选择等待;当大猪选择等待时,如果小猪行动,其收益为-1,而如果小猪等待,其收益为0,所以小猪也选择等待。综合来看,无论大猪选择行动还是等待,小猪的选择都会是等待,即等待是小猪的优势策略。

在小企业的管理中,学会搭便车是一个精明的职业经理人最基本的素质。在某些情况下,如果能注意等待,让其他大企业先开拓市场是明智的选择。这是做点什么的时候了!

聪明的管理者善于利用各种有利条件为自己服务。“搭便车”其实是职业经理人面对每一笔开支的另一种选择。重视它,研究它,可以为企业节省很多不必要的开支,从而使企业的管理和发展迈上一个新的台阶。这种现象在经济生活中很常见,但小企业的管理者却很少知道。

在智能猪游戏中,虽然“捡现成的猪”这种行为在道德上是可鄙的,但游戏策略的主要目的不就是为了利用策略实现自身利益的最大化吗?

博弈论66个经典例子(博弈论的三个基本要素)

案例3

美丽的硬币

一个陌生的美女主动过来和你搭讪,要求和你一起玩。美女提议:“让我们互相展示硬币的一面,无论是正面还是负面。如果我们是正面,那我给你3元,如果我们是反面,我给你1元,剩下的你给我2元。”听起来是个不错的提议。如果我是男的,我无论如何都会玩,但是经济上的考虑就是另一回事了。这个游戏真的足够公平吗?

博弈论66个经典例子(博弈论的三个基本要素)

我们假设正面的概率是X,负面的概率是1-X,为了利益最大化,我们应该在对手出正面或者反面的时候收益相等。否则,我们的对手总是可以改变正面和反面的概率来减少我们的总收入。这里列出的等式是3x+(-2)*(1-x)=(-2)*x+1*(1-x)。

通俗地说,这个等式的意思是,你在对手总是积极的时候得到的收益和你在对手总是消极的时候得到的收益是一样的,而且是最大的。方程的解给出x=3/8,也就是说,每八次出现三次正面,五次反面,是我们的最优策略。而把x=3/8代入收益表达式3*x+(-2)*(1-x)就可以得到每次的预期收益,计算结果是-1/8元。

同样,设正面出现美女的概率为y,背面出现美女的概率为1-y,等式-3y+2(1-y)=2y+(-1)*(1-y)

解y也等于3/8,美女的期望收益是2(1-y)-3y=1/8元。这告诉我们,当双方都采取最优策略时,平均每次美女赢1/8元。其实只要美女采用了方案(3/8,5/8),无论你采用什么方案都不会改变局面。如果都是正的,每次的预期收益是(3+3+3-2-2-2-2)/8 =-1/8元。

如果一切反其道而行之,每次的预期收益是(-2-2-2+1+1+1)/8 =-1/8元。而任何策略都只是上述两种策略的线性组合,所以期望是-1/8元。但是当你也采取最优策略的时候,至少可以保证你损失最小。否则你肯定会被美女采取的策略盯上,从而失去更多。这种博弈模型看似无用,但实际上可能涉及到金融市场定价中最重要的模型:定价权重模型。

总的来说,“博弈论”的本质是把日常生活中的竞争矛盾以博弈的形式表现出来,用数学和逻辑的方法分析事物的运行规律。既然有游戏的参与者,就一定有游戏规则的制定者。透彻理解竞争行为的本质,有助于我们分析和掌握竞争中事物之间的关系,也更便于我们制定和调整规则,使其最终按照我们预期的目的运行。

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。

作者:美站资讯,如若转载,请注明出处:https://www.meizw.com/n/181815.html

发表回复

登录后才能评论