囚徒困境 纳什均衡

时间:2024-08-26 22:53:52编辑:花茶君

什么是纳什均衡?

纳什平衡,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。一个策略组合被称为纳什平衡,当每个博弈者的平衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。扩展资料经典案例:囚徒困境假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌 疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年。如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。参考资料来源:百度百科-纳什均衡

为什么严格控制的策略不能在任何混合策略纳什均衡中以正概率发挥作用?

严格控制的策略是指的什么?
我根据你的题意推测是指严格劣势策略(strictly dominated strategy)
在一个混合策略均衡当中,,在对方不改变策略的情况下,单独选择任意一个以正概率发挥作用的策略,其个人的效用(利得)是一样的。
即若a和b战略在玩家1的混合策略均衡中,那么必然有
u1(a,s2)=u1(b,s2)
这里u1是玩家1的效用函数,s2是玩家2的混合策略。
如果这里b是严格劣势策略,那么我们有
u1(a,s2)>u1(b,s2)
对于任意的p∈(0,1),我们有
u1(a,s2)>p*u1(b,s2)+(1-p)*u1(a,s2)=u1(s1,s2)
这里s1是任意的以正概率p选择b和正概率1-p选b的混合战略。
我们发现不论p是是什么值,玩家1的效用都低于纯战略a,
所以严格劣势策略不能在任何混合策略纳什均衡中以正概率发挥作用


什么是纳什均衡?

纳什均衡理论又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略。则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。一个策略组合被称为纳什平衡,当每个博弈者的平衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。扩展资料纳什均衡理论创始人约翰·纳什介绍——1928年6月13日—2015年5月23日,提出纳什均衡的概念和均衡存在定理,是著名经济学家、《美丽心灵》男主角原型,前麻省理工学院助教,后任普林斯顿大学数学系教授,主要研究博弈论、微分几何学和偏微分方程。由于他与另外两位数学家在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响,而获得1994年诺贝尔经济学奖。参考资料来源:百度百科——纳什均衡

上一篇:谢可寅家境

下一篇:阿帮