纳什均衡理论(纳什均衡理论名词解释)

科学无国界我们是知识的搬运工。福利时间今天,我们将送出由Nature Natural Research编著、清华大学出版社出版的高质量科普读物《自然笔记:118

科学无国界

我们是知识的搬运工。

福利时间

今天,我们将送出由Nature Natural Research编著、清华大学出版社出版的高质量科普读物《自然笔记:118种化学元素的故事》。

纳什:如何科学追求对象?你知道吗?你知道吗?事实上,稀土并不那么稀有。铊曾被英国的“茶杯投毒者”用作杀人武器。火柴中的磷会导致工人“磷引起的颌骨坏死”。《茶花女》中对爱情的描写“既是祸也是福”也可以用来形容一种元素——镝。

在科学发展的长河中,一些最引人入胜的篇章无疑是由化学元素书写的:它们的发现、特性以及围绕它们的故事。然而,随着元素大发现时代的逝去,这些故事逐渐被埋没在旧纸堆里。《自然笔记:118种化学元素的故事》由全世界100多位科学家共同撰写。它最初以专栏的形式发表在《自然-化学》杂志上。当这些科学家解释元素的前世时,你会发现一张元素周期表背后有多少激动人心的、幽默的、讽刺的或震撼人心的故事。

本书由《自然-化学》杂志资深编辑安妮·皮琼博士作序,金庸院士、中国化学会和中国化学工业学会推荐。

只要你认真阅读了下面这篇文章,思考了文末提出的问题,严格按照互动:在评论区留言附上你的回答格式,就有机会获得奖品!

作者:约根·维斯达尔

翻译:Nuor

版本:xux

"

如果我们都攻击金发女郎,互相妨碍,那么没有人会得到她。接下来我们会去找她的朋友,她们会不屑一顾,因为谁都不想当备胎。但是,如果我们都不找金发女郎呢?我们不会互相影响或冒犯其他女士。这是我们能够成功的唯一途径。

"

如果你看过电影,你会发现这是电影《美丽心灵》(2001)中的角色约翰·纳什(johnf nash)第一次向朋友们解释他关于“支配动力学”的天才新发现。当然,事实上,这并不是真正的约翰·福布斯·纳什所想到的,这也不是他如何描述“博弈论”这个概念的。本文旨在更准确、更全面地描述纳什均衡的过程和价值。

什么是纳什均衡?

纳什均衡是一个非合作博弈的概念,涉及两个或两个以上的参与者。假设每个参与者都知道其他参与者的均衡策略,那么没有一个单一参与者可以通过单方面改变自己的策略来获得利益(Osborne et al,1994)。

该定理可以非正式地描述为:

如果没有一个玩家可以单方面改变自己的策略来获取更多的利润,那么这个策略就是纳什均衡。

也就是说,在一个两个人可以玩的那个博弈中,如果在参与人B的选择已知的情况下,参与人A的策略是最优的,参与人B的策略在参与人A的策略已知的情况下也是最优的,那么这一对策略就构成了纳什均衡。没有一个玩家可以通过单方面改变策略来获得更好的结果。最关键的是,玩家不知道对方的策略,只会根据自己的利益(也知道其他玩家的利益)选择最佳策略。

晋升到N名球员可以定义为:

纳什均衡的定义

用(S,F)来表示U个玩家的博弈。Si是I参与人的策略,S=S1×S2×S3×…×Su是所有策略的集合,f(x)=(f1(x),…,fu(x))是X ∈ S情况下的收益函数,是I参与人的策略,x-i是其他所有参与人(除I外)的策略集合。

当每个玩家I ∈{ 1,...,u}选择策略xi,策略配置为x = (x,...,x),参与人I得到收益F (x)。收益取决于每个人的策略,包括参与人I和其他参与人的。

如果没有一个玩家可以通过单方面改变策略获得更多的收益,那么这个策略集x*∈S就是纳什均衡,即:

?i,x? ∈ S? : f?(x*?,x*??) ≥ f?(x?,x*??)

纳什均衡的证明

Nash的论文证明(1950c)使用了Brouwer的不动点定理。多亏了大卫·盖尔,纳什以更简单的方式给出了同样的证明(角谷不动点定理)。

用角谷定理证明纳什均衡

为了证明纳什均衡(NE)的存在,假设R (σ)是参与人I在其他参与人策略下的最优策略。

r?(σ??) =阿根廷马克斯u?(σ?,σ??)

这里σ ∈ σ其中σ x σ是所有参与人的策略,U是参与人I的收益函数定义一个价值函数R: σ→ 2 σ,其中R = (R (σ),R (σ))。证明纳什均衡的存在就相当于证明R有不动点。

谷不动点定理表明,如果满足以下四点,则存在不动点:

σ是紧凸非空;

R(σ)不是空;

R(σ)是半连续的;

R(σ)是凸的。

条件1的前提是σ是单形的,所以它是紧的。“凸性”源于玩家混合策略的能力。玩家必须选择一个策略,所以σ不是空。

条件2和3可以用伯奇最大值定理证明。因为U是连续紧的,所以r(σ)是非[/k0/]半连续的。

4条件也是因为混合策略。假设σ,σ' ∈ r (σ),那么λ σ+(1-λ) σ' ∈ r (σ)。也就是说,如果两种策略产生的利润最大,那么两种策略的混合也会产生相同的利润。

所以R和纳什均衡都有一个不动点。

举个例子

一个正式的游戏通常包含三个要素:玩家、策略和每个玩家的收益。收益函数代表每个玩家对策略的偏好,策略集是游戏中玩家策略的列表。你可以解释示意图中的三个元素,称之为收益矩阵来表示两个参与人的策略(两个参与人各有两个策略):

纳什:如何科学追求对象?左图:博弈1的收益矩阵是一个“协调博弈”。右图:游戏2的收益矩阵,即“硬币配对”游戏(猜拳)

在每个博弈中,两个玩家可以选择策略A或b。

纯战略纳什均衡

策略的纯纳什均衡是指任何参与者都不能通过单边偏离和轮换策略获得更高的预期收益。

在博弈1中,如果他们选择不同的策略(A,B)或(B,A),两者的收益都是0。如果他们都选择策略A,他们都会得到收益2。如果他们都选择策略B,他们都会得到收益1。策略集(a,a)和(b,b)因此产生纳什均衡,因为单个参与者策略的改变会导致该参与者的收益降低。

在博弈2中,如果他们选择不同的策略(A,B)或(B,A),参与人1的收益是-1,参与人2的收益是1。如果他们都选择A或B,参与人1会得到收益1,参与人2会得到-1。这个博弈不存在纯纳什均衡策略,因为在每个策略集合中,都会有一个参与者从策略的偏离中获益。

混合策略纳什均衡

纳什的结果表明,在所有有限博弈中,至少存在一个纳什均衡点。因为第二局不存在纯策略的纳什均衡,所以混合策略一定存在纳什均衡:

混合策略纳什均衡是一组策略,其特征是至少有一个参与人玩随机策略,没有一个参与人可以通过单方面改变和轮换策略获得更高的预期收益。

在游戏2中,玩家不是选择单一的策略,而是按照一定的概率分布选择策略。在均衡中,每个参与者概率分布的选择使得所有其他参与者对他们的纯策略不感兴趣。

比如作为参与人1,我们可以一半时间用A,一半时间选B,根据抛硬币决定策略。2玩家唯一的理性反应就是做同样的事情。比如硬币配对博弈,当选择A和B的概率相等时,就是一个混合策略的纳什均衡。

解释

纳什在论文中提出了两种关于均衡的观点:一种基于理性,另一种基于统计人口。

在理性的解释下,玩家被认为是理性的,他们知道游戏的所有信息,包括其他玩家的选择偏好,这些信息是众所周知的。因为所有的玩家都知道彼此的选择策略和偏好,所以也可以计算出他们对于所有策略的收益,得到最佳策略。如果游戏只玩一次,所有玩家都期望相同的纳什均衡(高回报),那么没有人会想改变他们的策略。

基于统计总体假设,纳什指出:没有必要假设博弈方完全理解博弈的信息,或者有能力和意愿进行复杂的推理过程。这是因为“假设游戏的每个位置都有一组玩家,随着时间的推移会有随机的玩家参与游戏。如果一个玩家选择了平均频率稳定的纯策略,那么这个稳定的平均频率就是混合策略纳什均衡。”(纳什,1950c)。

正如哈罗德·库恩后来写道:

显然,诺贝尔奖委员会认真考虑了这两种解释。古诺可能会提出一个理性的解释,但是对于生物博弈来说很重要的统计解释完全是原创的。虽然这三篇论文都解释了非合作博弈,但只有这篇文章解释了这两种解释。当在诺贝尔研讨会上被问及为什么这些解释没有被纳入年度报告时,纳什回应道,“我不知道它们是否被剪下来用于数学年鉴。”

——摘自库恩等人的《本质的约翰·纳西》(2002)。

发现

与电影中的描述不同,传记作者西尔维娅·纳萨尔写道:纳什在普林斯顿大学读研究生时就想到了这个想法,研究博弈策略和经济谈判的数学模型。正如纳萨尔写道:

“在与冯·诺依曼会面后,纳什在与大卫·盖尔的一次谈话中说:‘我想我找到了一种推广冯·诺依曼最小最大定理的方法。基本思想是,在两个人的零和博弈中,最佳策略是……整个理论都是基于此。它适用于任何数量的人,不仅限于零和游戏。”

——引自西尔维亚·纳萨尔《美丽心灵》(1998)

1995年,盖尔将纳什和大卫·盖尔的对话转述给了纳萨尔。纳什当时正在研究所谓的“讨价还价问题”。双方都有机会让对方受益,但任何单方面(未经同意)的行动都不会影响对方的利益。想想经典的“切蛋糕选择协议”,一方切蛋糕,另一方优先得到自己想要的那部分。这种模式提供了所谓的无嫉妒切蛋糕模式。

正如纳萨尔所写,盖尔更着迷于纳什新结论的数学价值,而非其应用价值。1995年,他写道,“数学是如此美丽。”这在数学上是正确的。

“盖尔意识到,与冯·诺依曼的零和博弈相比,纳什的思想更适用于更广阔的现实世界。”他有一个可以延伸到谈判的概念。

——节选,西尔维亚·纳萨尔的《美丽心灵》(1998)

盖尔还把它起草给了国家科学院,以帮助纳什获得他的成果的荣誉。所罗门·莱夫谢茨代表他们提交了这份报告。1950年1月,《美国国家科学院院刊》第36卷发表了这篇不到一页的内容,题目是《N人博弈中的均衡点》。

纳什:如何科学追求对象?纳什(1950b)。n人游戏中的均衡点。美国国家科学院学报第36卷第1期。

标签

纳什的论文最终催生了三篇期刊论文和一项诺贝尔经济学奖(1994年)。

期刊论文

这三篇文章包含了纳什均衡存在的三种不同证明。第一篇题为《N人游戏中的均衡点》(1950b),是纳什和盖尔为《美国国家科学院院刊》写的一篇笔记。第二个叫“非合作博弈”(1951),发表在《数学年鉴》第54卷第2期,在《计量经济学》第21期发表的“两个人合作的博弈”(1953)中,纳什将他在谈判问题上的工作(Nash,1950a)扩展到更广泛的“威胁”可以发挥作用的情况(Kuhn et al,2002)。

诺贝尔奖

就在10月11日宣布1994年诺贝尔经济学奖的前几周,两位数学家——哈罗德·w·库恩(Harold W. Kuhn)和小约翰·福布斯·纳什(John Forbes Nash Jr .)拜访了他们的老师——阿尔伯特·w·塔克(Albert W. Tucker),后者年近90,病不起。纳什先生已经好几年没和他的导师说过话了。在库恩离开后的一个小时内,他们进行了一场数论的讨论。

当纳什离开房间时,库恩回来告诉塔克一个惊人的秘密:纳什不知道瑞典皇家科学院打算在1949年授予纳什诺贝尔奖,以表彰他在塔克领导下对经济学做出的巨大革命性贡献。这个奖是一个奇迹。

——纳萨尔1994

1994年10月11日,诺贝尔奖委员会宣布将1994年诺贝尔经济学奖授予约翰·福布斯·纳什博士,以表彰他对非合作博弈论中均衡的开创性分析:

约翰·福布斯·纳什介绍了合作博弈(能达成有约束力的协议)和非合作博弈(不能达成有约束力的协议)的区别。纳什提出了非合作博弈均衡的概念,后来被称为纳什均衡。

纳什:如何科学追求对象?哈罗德·库恩(左)和纳什(右)

原始链接:

https://medium . com/cantors-paradise/the-Nash-equilibrium-explained-c9ad 7 e 97633 a

【互动问题:生活中有哪些体现博弈论的知识或游戏?】

请严格按照互动的格式在评论区留言参与互动:问题的答案,格式不符合要求的一律无效。

*本活动仅限微信平台。

编辑:aki

↓点击标题查看↓

1.物理定律告诉你:表白可能是巨大的损失,分手必须赚血。

2.震惊!你昨天安装的扫帚甚至真的惊动了美国宇航局。

3.酒精和84消毒液可以一起用吗?

4.一次性医用口罩是怎么做出来的?怎么消毒?

5.数学很有趣。这支庞大的队伍带着一群数学和物理的博士横扫球场。

6.测温枪是怎么测你的体温的?

7.把等量的0度水和100度水混合,能得到50度的水吗?

8.人类为什么喜欢接吻?

9.病毒从哪里来?

10.一见钟情,靠谱吗?

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。

作者:美站资讯,如若转载,请注明出处:https://www.meizw.com/n/53526.html

发表回复

登录后才能评论