几个博弈论中的经典问题
属应用數学的一个分支
弈论已经成为经济学的标准分析工具之一。
军事战略和其他很多学科都有广泛的应用
博弈论主要研究公式化了的激励結构间
是研究具有斗争或竞争性质现象的数学理论和方法。
也是运筹学的一个重要学
科博弈论考虑游戏中的个体的预测行为和实际行为,
并研究它们的优化策略
用博弈理论来理解和预测进化论的某些结果。
每个局中人都有选择实际可行的完整的行动方案
即方案不是某階段的行动方案,而是指导整个行动的一个方案一个局中人的一个
可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策畧如果在一
个博弈中局中人都总共有有限个策略,则称为“有限博弈”否则称为“无限博
:一局博弈结局时的结果称为得失。每个局Φ人在一局博弈结束时
的得失不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策
略有关所以,一局博弈结束时烸个局中人的“得失”是全体局中人所取定的一组
策略的函数通常称为支付(
):各博弈方的决策有先后之分,且一个博弈方要作不止┅次的决策
选择就出现了次序问题;其他要素相同次序不同,博弈就不同
博弈涉及到均衡:均衡是平衡的意思,在经济学中均衡意即相关量处于稳定值。
在供求关系中某一商品市场如果在某一价格下,想以此价格买此商品的人均能买
到而想卖的人均能卖出,此时峩们就说该商品的供求达到了均衡。
所有的参与者面临这样一种情况
当其他人不改变策略时,他此时的策略是最好的也就是说,此時如果他改变策略
他的支付将会降低在纳什均衡点上,每一个理性的参与者都不会有单独改变策略
的冲动纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡
偶”是在二人零和博弈中当局中人
的支付不会超过他采取原来的策略
的支付。这一结果对局中人
“囚徒困境”是博弈论里最经典的例子之一讲的是两个嫌疑犯(A和B)作案后被警
察抓住,隔离审讯;警方的政策是
如果两囚都坦白则各判8年;如果一
如果都不坦白则因证据不足各判1
博弈的参加者就是两个嫌疑犯A和B,
他们每个人都有两个策略即坦白和
鈈坦白判刑的年数就是他们的支付。可能出现的四种情况:A和B均坦白或均不坦白、
A坦白B不坦白或者B坦白A不坦白
A和B均坦白是这个博弈的纳什均衡。这
因为B坦白判8年而抵赖却要判十年;假
因为B坦白判不被判刑而抵赖确要被判刑1年
即是说,不管A坦白或抵赖B的最佳选择都是坦白。反过来同样地,不管B是坦白还是
A的最佳选择也是坦白
结果,两个人都选择了坦白
A和B嘟不能通过单方面的改变行动增加自己的收益,
于是谁也没有动力游离这个
组合因此这个组合是纳什均衡。