请问你罗列的博弈论书籍的书能去哪里买得到？

www.51yue.net 2012-08-11 标签：博弈论书籍

当前位置： >>
博弈论中常见的一些例子
杨义群经济管理网、杨义群投资理财网博弈论中常见的一些例子1、（夫妻争执问题）一对新婚夫妻为晚上看什么电视节目争执不下，丈夫（记为 I 方）要看足球比赛节目，而妻子（记为Ⅱ方）要看戏曲节目.他们新婚燕尔，相亲相爱，所以若这方面的行动不一致，则是很伤感情的.因此，这对夫妻间的争执是一次非零和对策。 2、（entry deterrence 市场威慑）设某市场已被Ⅱ方（场内者）占据，现 I 方（场外者）正在考虑是进去争夺（记为策略 I1）还是不进去争夺（记为策略 I2），而Ⅱ方相应应考虑的是采取合作共享的态度（记为策略Ⅱ1）还是采取坚决斗争的态度（记为策略 Ⅱ2）。 3、（prisoner’s dilemma 囚犯困境）设有两个囚犯曾犯过大罪，现因犯小罪而被捕，正分别受警方审讯.这两个囚犯都明白：如果两人都拒不坦白犯过大罪，那么当局只能以当前的小罪而判处 1 年徒刑；要是两人都坦白犯过大罪，那么当局将判处 9 年徒刑；如果一人坦白，而另一人拒不坦白，那么坦白者将会立即获得释放，另一个将会被判处 10 年徒刑。(北京大学 1999 年研究生入学考试微观试题) 举出一个你在现实生活中遇到的囚犯两难困境的例子。 4、（两寡头降价竞争）这一模型，在数学结构上，与上例完全相同。设某一市场上仅有两个寡头，他们分别都可以选择降价与不降价两种策略。 5、（打假）设当局对商品采取查假行动的费用为 a 万元，查出假货后，罚款为 b 万元，且销毁的假货成本为 c 万元；若商人出售假货，而当局不采取查假行动，则商人可额外获利 d 万元，且社会的进一步损失为 e 万元。 6、（监督博弈）设税务局查税的费用为 a 万元，查出逃税后，罚款为 b（b＞a）万元，纳税人应纳的税金为 c 万元。则税务局与纳税人的该两人非零和对策模型的赢得表具体如下。 7、（boxed pigs 智猪博弈）设猪圈里有一个按钮与两只猪，大猪与小猪，按一次按钮，就会有 10 份食品进入，大猪与小猪同时吃的话，将分别能吃到 7 份与 3 份，但去按一次按钮，必须耗费 a 份食品，而且按按钮者，由于耽误了时间，还将少吃到 2 份食品。当 1＜a＜5 时，Ⅱ2（等待）是小猪的占优策略，所以大猪只能采用策略 I1（去按），于是，多劳者反而少得！这主要是小猪在此有机遇。当 a＞5 时，“等待”既是小猪的占优策略，也是大猪的占优策略，所以变成了占优战略均衡，大家都等待，陷入困境。 8、（两寡头产量竞争）设某市场只有两个寡头厂商，其中厂商 1 与 2 的产量分别记为 x 与 y，市场总产量记为 Q：＝x＋y. 又设，厂商 1 与 2 的产量边际成本都恒为 2，而且都没有固定成本，也即他们的成本分别为 2x 与 2y。再设，将这些产品全部销售出去的平均价格函数为 P＝8－Q. 于是，厂商 1 与 2 的利润分别为 9、(北京大学 1995 年研究生入学考试微观试题，招生专业：国民经济学、产业经济学、金融学、企业管理、管理科学与工程) A、B 两企业利用广告进行竞争。若 A、B 两企业都作广告，在未来销售中，A 企业可以获得 20 万元利润，B 企业可以获得 8 万元利润；若 A 企业作广告，B 企业不作广告，A 企业可以获得 25 万元利润，B 企业可以获得 2 万元利润；若 A 企业不作广告，B 企业作广告，A 企业可以获得 10 万元利润，B 企业可以获得 12 万元利润；若 A、B 两企业都不作广告，A 企业可以获得 30 万元利润，B 企业可以获得 6 万元利润。 10、(北京大学 1998 年研究生入学考试微观试题，2003 年浙江大学博士生入学考试微观试题) 家用电气市场上有两个厂商，各自都可以选择生产空调和彩电，彼此的利润如下列收益矩阵所示 11、可口可乐与百事可乐（参与者）的价格决策：双方都可以保持价格不变或者提高价格（策略）；博弈的目标和得失情况体现为利润的多少（收益）；利润的大小取决于双方的策略组合（收益函数）；博弈有四种策略组合，其结局是：（1）如果双方都不涨价，各得利润 10 单位；（2）如果可口可乐不涨价，百事可乐涨价，可口可乐利润 100，百事可乐利润-30；（3）如果可口可乐涨价，百事可乐不涨价，可口可乐利润-20，百事可乐利润 30；（4）如果双方都涨价，可口可乐利润 140，百事可乐利润 35；博弈的稳定状态有两个：都不涨价或者都涨价（均衡），均衡称为博弈的解，它是由博弈规则（即参与者采取什么策略会取得什么结局，市场的需求弹性、交叉价格弹性等）决定的。博弈论与诺曼底战役决策普林斯顿大学的一道习题题目：如果给你两个师的兵力，由你来当“司令”，任务是攻克“敌人”占据的一座城市，而敌军的守备力量是三个师，规定双方的兵力只能整师调动。通往城市的道路只有甲乙两条。当你发起攻击的时候，你的兵力超过敌人，你就获胜；你的兵力比敌人的守备兵力少或者相等，你就失败，那么，你将如何制定攻城方案？ “司令”发牢骚躺倒不干：“为什么给敌人三个师的兵力，而只给我两个师？这太不公平，兵力已经吃亏，居然还要规定兵力相等则敌胜我败，连规则都不公平，完全偏袒敌人。”为此你也许会大为不满。来个躺倒不干。其实，这次模拟“作战”，每一方取胜的概率都是 50％，即谁胜谁负的可能性是一半对一半。你这个司令能否神机妙算，指挥队伍克敌制胜，还得看你的本事。为什么说取胜的概率是一半对一半呢，让我们先学一点儿“纸上谈兵”。我们来分析一下：敌人有三个师，布防在甲乙两条通道上。由于必须整师布防，敌人有四种部署方案，即： A、三个师都驻守甲方向； B、两个师驻守甲方向，一个师驻守乙方向； C、一个师驻守甲方向，两个师驻守乙方向： D、三个师都驻守乙方向。同样，你有两个师的攻城部队，可以有三种部署方案，即： a、集中全部两个师的兵力从甲方向攻击； b、兵分两路，一师从甲方向，另一师从乙方向，同时发起攻击； c、集中全部两个师的兵力从乙方向攻击。和以前一样，如果我们用“+，-”表示我方攻克，用“-，+”表示敌方守住，就可以画出交战双方的胜负分析表：敌 A B C a -,+ -,+ +,b +,- -,+ -,+ c +,- +,- -,+ D +,+,-,+我假设你采取 a 方案，那么如果“敌人”采取 A 方案，你的两个师将遇到敌军三个师的抵抗，你要败下阵来，所以是（一，十）；如果“敌人”取 B 方案，你的两个师遇到敌军两个师以逸待劳的抵抗，你也要败下阵来，同样是（一，+）；但是如果“敌人”取 C 方案，你以两个师打“敌人”一个师，你就会以优势兵力获得胜利，结果是（十，一）；同样，如果“敌人”采取 D 方案，你攻在敌军的薄弱点上，你就能长驱直入，轻取城池，结果也是（十，一）。和以前的博弈表示略微不同的地方，是现在每个格子里面只有正负号，没有数目字。希望这不会使你感到不安。如果你还是喜欢有数目字，那也容易得很，每个正负号后面都加上同一个数目字就行，同一个 1．同一个 1944，或者同一个 1998。要紧是表达出输赢。这你就知道，在上述表达中，正负号要紧，具体数目字无所谓。诺曼底登陆模拟：取胜概率相等交战双方的胜负分析表画出来以后，从“＋，一”的分布来看，似乎双方取胜的机会都一样大。一直看《博弈论平话》的读者，可以运用劣势策略消去法把它化简。实际做这个题目的时候，如果先从我方入手，一下子是分不出优劣来的。a 和 b，b 和 c,a 和 c 之间，都说不上谁比谁优，谁比谁劣。于是，我们从敌方入手，尝试站在敌军的立场，比较策略 A 和 B。如果我军采取策略 a，敌军取 A 或 B 都会赢，结果一样。如果我军采取策略 b，敌军取 A 会输取 B 会赢，如我军采取策略 c，敌军取 A 或 B 都会输。可见，在敌军看来，策略 B 比策略 A 好：采取策略 A 会赢的话（如果我军取 a），采取策略 B 一定也会赢；采取策略 A 会输的话（如果我军取 b 或 c），采取策略 B 却不一定会输，因为假如我军取 b，敌军就赢了。同样，策略 C 和 D 比较，C 是优势策略，而 D 是劣势策略。智慧的或者说理性的局中人是不会采用劣势策略的，所以当做出博弈的矩阵表示以后，如果发现劣势策略，你就可以把它划去，这就是劣势策略消去法。现在，剩下上边那个三行两列的矩阵，六个格子中，（一，＋）比（十，一）多，似乎敌方的赢面比较大，其实不然。因为到了敌方不会采用“笨蛋”策略的时候，到了敌方只剩下 B 和 C 两个较优策略的时候，我方的三个策略之中，原来不是劣势策略的 b 现在就变成劣势策略了。我们也不是笨蛋，所以我们也应该把 b 删去。最后，得到下边那个两行两列的矩阵博弈表示。情况最终就是这样：敌军必取 B 或 C 那样的二一布防，一路两个师，另一路一个师，而我军必集中兵力于某一路实施攻击，即 a 或 c 那样的攻击策略。这样，你若攻在敌军的薄弱处，你就获胜，你若攻在敌人兵力较多的地方，你就失败，总之，敌我双方获胜的可能性还是一样大，“司令”先生：不要躺倒不干，你不比对方吃亏。这虽然是一个模拟的例子，却具有相当的现实意义，诺曼底战役前的情况，大体也是这个样子。跨海作战，攻方能够调动来渡海作战的兵力，通常总是比守方可以用于守备的兵力少。模拟作战中假设攻方兵力力两个师而守方的兵力为三个师，就是这样的背景。另外，渡海登陆作战，通常至少在一开始的时候，攻方要承受很大的牺牲。模拟作战中规定若攻守双方兵力相等则攻方失败，体现了这个意思。博弈论简介董志强１９９９－６对于一些非数学专业和经济学专业的人们来说，博弈论可能是一个极为陌生的概念。事实上，就是一些经济学专业毕业的学生，他们的博弈论知识也十分有限，我自己也是这样，略知皮毛而已（不，甚至连皮毛都未能真正了解）。因为国内学者把博弈论运用于经济学研究不过是近几年的事，也不普遍，而且它本身的内容也博大精深。但在国外，博弈论已成为占据主流的分析工具，如果你不懂得博弈论，那么你会被认为是没有真正懂得经济学。博弈论的提法可能太过于学术化，容易让人们退避三舍。其实它有一个非常通俗的名字——游戏理论（博弈论的英文名字叫做“Game Theory”，如果直译，就是“游戏理论”）。博弈论在我国还有一个名字，叫对策论。这些名字都很好理解，博弈字面意思就是赌博、下棋，赌博和下棋当然是游戏了，赌博和下棋的时候常常要千方百计地应付对手，自然是要讲究对策了。如果我们要进行一场游戏，首先肯定要有参加游戏的人，没有人参加，游戏就不会进行下去，游戏活动的参与人有一个学术名称叫“局中人”；其次，每一个“局中人”都有自己的“行动”，或者叫做“策略”、“对策”，如果行动不是单一的，那么这个局中人所有的行动构成一个集合，称行动组合或策略组合；另外，还应该约定输家要付出什么代价，赢家可获得什么利益，这在术语上叫做“支付”（或“报酬”）。当然，一场游戏肯定结果不是唯一的，各个参与人分散决策采取不同的行动，会造成不同的结果。但是纳什证明出，在有限个局中人参加的有限行为对策中，至少存在一个所有参与人的最优战略的组合，这叫做“纳什均衡”。处于纳什均衡状态下，每个人都不能通过改变策略来得到更大的收益，所以谁也不存在改变现状的动力。举一个具体的例子来说明一下。这个例子叫“囚犯困境”，是被一些教材广泛引用的例子，并且西方经济学者围绕这个例子发表过不下百篇学术论文。它是这样的（有兴趣的读者可参见青年经济学家张维迎的《博弈论与信息经济学》，这本书几乎成了经济学研究生的必读书）：两个嫌疑犯（A 和 B）作案后被***抓住，隔离审讯；警方的政策是“坦白从宽，抗拒从严”，如果两人都坦白各判 8 年，如果一人坦白另一人不坦白，坦白的放出去，不坦白的判 10 年，如果都不坦白则因证据不足各判 1 年。在这个例子里，局中人就是两个嫌疑犯 A 和 B，他们每个人都有两个策略即坦白和不坦白，判刑的年数就是他们的支付。可能出现的四种情况：A 和 B 均坦白或均不坦白、A 坦白 B 不坦白或者 B 坦白 A 不坦白，是博弈的结果。A 和 B 均坦白是这个博弈的纳什均衡。我们可以用下面的表来表述这个博弈，表中，第一个数字是 A 的支付（因为是判刑是负效用，故以负号记之），第二个数字是 B 的支付。囚犯 B 坦白抵赖坦白 -8，-8 0，-10 抵赖 -10，0 -1，-1囚犯 A我们看到，假定 A 选择坦白的话，B 最好是选择坦白，因为 B 坦白判 8 年而抵赖却要判十年；假定 A 选择抵赖的话，B 最好还是选择坦白，因为 B 坦白判不被判刑而抵赖确要被判刑 1 年。即是说，不管 A 坦白或抵赖，B 的最佳选择都是坦白。反过来，同样地，不管 B 是坦白还是抵赖，A 的最佳选择也是坦白。结果，两个人都选择了坦白，各判刑 8 年。在（坦白、坦白）这个组合中，A 和 B 都不能通过单方面的改变行动增加自己的收益，于是谁也没有动力游离这个组合，因此这个组合是纳什均衡。张维迎指出，囚徒困境反映了个人理性和集体理性的矛盾。如果 A 和 B 都选择抵赖，各判刑 1 年，显然比都选择坦白各判刑 8 年好得多。当然，A 和 B 可以在被***抓到之前订立一个“攻守同盟”，但是这可能不会有用，因为它不构成纳什均衡，没有人有积极性遵守这个协定。 “囚犯困境”在经济学上有很多应用，也有力地解释了一些经济现象。比如中东石油输出国组织（Organization of Petroleum Exporting Countries,简称 OPEC）的成立，本身要限制各石油生产国的产量，以保持石油价格，以便获取利润。但成员国并不遵守组织的协定，每个成员国都这样想，只要他们不增加产量，我增加一点点产量对价格没什么影响，结果每个国家都增加产量，造成石油价格下跌，大家的利润都受到损失。当然，一些产量增加较少的国家损失更多，于是也更加大量生产，造成价格进一步下降——结果，陷入一个困境：大家都增加产量，价格下跌，大家再增加产量，价格再下跌……我们不妨考察一下历史：1960 年，5 个产油国成立欧佩克（OPEC）。1973 年成员国扩大到 13 个。当时各国还少有产量欺骗行为。1973 年，阿-以战争爆发，为了报复以色列和西方国家，OPEC 突然大幅度削减石油出口，致使世界原油价格由$2.91/桶暴涨到 1974 年$10.77/桶。这一意外事件让 OPEC 看到了组建卡特尔的诱人前景。1978 年伊朗发生革命，其石油生产一度陷于瘫痪，既而两伊战争爆发，许多石油设施受到破坏，世界石油价格进一步涨到 80 年代初的 $40/桶。但是，高额的利润导致各个国家的产量欺骗行为（实际产量大于限产计划），即各国不再遵守产量协定，擅自提高产量以获取更大的市场和更多的利润，从而导致石油价格下跌——当然，价格下跌也与世界其他地区如墨西哥油田、阿拉斯加油田、北海油田等石油供给增加有关。1982 年世界石油价格为$32/桶，1984 年为$27/桶，1987 年为$18/ 桶，以后基本上在$15-18/桶之间波动。理论上，几乎所有的卡特尔都会遭到失败，原因就在于卡特尔的协定（类似囚犯的攻守同盟）不是一个纳什均衡，没有成员有兴趣遵守。最近发生的一个案例再次证明了这一点。今年 4 月，长虹突然宣布彩电降价，对彩电业带来了巨大震动。随即，康价佳老总陈伟荣、TCL 老总李东生、创维老总黄宏生达成默契：建立彩电联盟。直到 4 月 20 日下午，康佳仍表示不降价，但当晚陈伟荣突然改变主意，搞得李、黄措手不及。4 月 24 日，本来三方准备坐下来商讨降价后的进一步策略，结果又是陈伟荣爽约。那么不可能有卡特尔合作成功了？理论上，如果是无限期的合作，双方考虑长远利益，他们的合作是会成功的。但只要是有限次的合作，合作就不会成功。比如合作 10 次，那么再第九次博弈参与人就会采取不合作态度，因为大家都想趁最后一次机会捞一把，反正以后我也不会跟你合作了。但是大家料到第九次会出现不合作，那么就很可能再第八次就采取不合作的态度。第八次不合作会使大家在第七次就不合作……一直到，从第一次开始大家都不会采取合作态度。当然，这只是理论上的分析。现实中影响人们决策和态度的因素很多，所以，有些博弈的结果并不体现为纳什均衡。在国外曾做过一个“囚犯困境”的实验，被实验者是素未谋面的一个男生和一个女生。开始，这个男生每次都选择“坦白”，这是符合纳什均衡的。后来实验者有意安排了一次喝咖啡的机会，使男生发现自己的对手是一个漂亮的女生。结果以后的测验中，男生每次都选择不坦白以获取女孩的好感。不过，不管怎样，博弈论都是一个强有力的分析工具。现在，它不仅在经济学领域得到广泛应用，在军事、政治、商业征战、社会科学领域以及生物学等自然科学领域都有非常重大的影响，工程学中如控制论工程也少不了它。我们举的例子，只是帮助大家形成博弈论的基本概念，实际上它是非常精深的。现在与它紧密联系的经济学分支是信息经济学。信号游戏、拍卖形式、激励机制、委托人—代理人理论和公共财政学是博弈论和信息经济学研究的重要课题。应该感谢美国数学家冯?诺依曼（Von Neumann）和摩根斯坦（Morgenstern），是他们在《博弈论和经济行为》（1944）一书中提出了博弈论的经济思想。冯?诺依曼在数学、计算机、经济学等领域都有奇才般的贡献，可惜英年早逝。年，美国数学家统计学家纳什接连发表多篇论述对策论的文章，奠定了现代博弈论学科体系的基础。生活中的游戏——博弈无处不在董志强１９９９－７日常生活中的一切，均可从博弈论得到解释，大到近段时间北约轰炸南联盟，小到今天早上你突然咳嗽了几声。因为生活的本质，就是在进行一场游戏。可能你觉得，北约轰炸南联盟用博弈论来分析是可以的，但对自己早上咳嗽也可以用博弈论来理解觉得不可思议，因为自己就一个人，和谁进行游戏？非也，并非只有你一人，还有一个叫做“自然（Nature）”的“人”，你在同它进行游戏。你可以把“自然” 理解为无所不能的上帝，上帝现在有两种策略，让你生病或不生病。你咳嗽了，你就不得不根据自己咳嗽的信息判断上帝的策略，然后采取对应的策略。上帝采取让你生病的策略，你就采取吃药的策略来对付；上帝采取不让你生病的策略，你就采取不予理睬的策略。看，这不就是一场你和上帝进行博弈的游戏吗？ “自然”是研究单人博弈的重要假定。比如一个农夫种庄稼也是同自然进行博弈的一个过程。自然的策略可以是：天旱、多雨、风调雨顺。农夫对应的策略分别是：防旱、防涝、放心地休息。当然，自然究竟采用哪种策略并不确定，于是农夫只有根据经验判断（或根据气象预报）来确定自己的行动。如果估计今年的旱情教重，就可早做防旱准备；如果估计水情严重，就早做防涝准备；如果估计是风调雨顺，农夫就可以悠闲地东转转西走走了。又比如，农夫该在土地上种小麦还是水稻？也是一个同自然进行博弈的游戏。自然可以选择小麦买高价还是水稻卖高价，农夫则根据对自然的可能行动的猜测来确定自己的行动。与一般的博弈不同的是，不管“自然”采取何种策略，也不管你采取何种策略， “自然”的支付（或得益）都是为 0 的。生活中更多的游戏不是单人博弈，而是双人或多人的博弈。比如：商场谈判、政治斗争、夫妻吵架、恋爱结婚……都是这类博弈。再给大家介绍一个有趣的博弈例子。它出自张维迎教授的《博弈论与信息经济学》，讲的是猪圈里有一头大猪和一头小猪，猪圈的一头有一个饲料槽，另一头装有控制饲料供应的按钮。按一下按钮就会有 10 个单位饲料进槽，但谁按谁就要付出 2 个单位的成本。若大猪先到，大猪吃到 9 个单位，小猪吃到一个单位；若同时到，大猪吃 7 个单位，小猪吃 3 个单位；若小猪先到，大猪吃六个单位，小猪吃 4 个单位。各种情况组合扣除成本后的支付矩阵可如下表示（没格第一个数字是大猪的得益，第二个数字是小猪的得益）：小猪按大猪按 5，1 等待 9，-1 等待 4，4 0，0 //注：此例中，谁去按按纽则谁后到；都去按则同时到。在这个例子中，我们可以发现，大猪选择按，小猪最好选择等待，大猪选择不按，小猪还是最好选择等待。即不管大猪选择按还是不按，小猪的最佳策略都是等待。也就是说，无论如何，小猪都只会选择等待。这样的情况下，大猪最好选择是按，因为不按的话都饿肚子，按的话还可以有 4 个单位的收益。所以纳什均衡是（大猪按，小猪等待）。这个例子是一个多劳不多得的例子。现实中这种情况是很普遍的，一些努力工作的人和不工作的人得到与付出并不相称。改革也有类似的情况，在改革过程中利益的转移必定使一部分人先富一部分人生活水平没得到改善，前一部分人更有改革的积极性。也就是说，改革往往由“大猪”推动，“大猪”越多，改革速度越快。这个例子也可以反映斯密的“看不见手”教条，本来大猪是追求自身的利益，结果给小猪也带来了利益。它也解释了“搭便车”行为，例子中的小猪是一个典型的“搭便车”者，因为它坐享大猪的成果。在这里我们可以联系一下第二章提到的科斯定理，如果我们严格界定产权，是可以改变这种状况的。比如，以法律的形式规定，大猪按出的饲料归大猪支配，小猪按出的饲料归小猪支配，那么大猪小猪都存在去按的动力和积极性。相反，产权不清晰，比如吃大锅饭的情况下，结果是不劳有获、劳而少获，有点类似一幅漫画——卖力的驴子挨鞭子（一只驴子拉着一辆车，车上是一个农夫和另外几头驴子，农夫的鞭子落在拉车的驴子身上催它快跑；这只驴子并没有错，它遭罪只因为它比别的驴子强壮）。于是人们工作的积极性没有了。我想，这也是为什么我国改革开放不久，就提出了废除“大锅饭”，砸碎“三铁”（铁饭碗、铁交椅、铁工资）的原因所在了。在智猪博弈中，无论大猪采取何种行动，小猪都是采取等待。我们把小猪的“等待” 称为“占优战略”（有点“以不变应万变”的意思）。生活中这样的博弈也不少。比如，某一天你觉得应该是你太太的生日，但又不能肯定：如果是太太的生日的话，①你可以送一束花，太太会特别高兴，你的效用增加 5 个单位，②你不送花，但太太会埋怨你忘了她的生日，你的效用降低 2 个单位；如果不是太太的生日的话，①你可以送太太一束花，太太感到意外的惊喜，你的效用增加 3 个单位，②你不送花，结果生活同往常一样，可视为你的效用增加 0 单位。在这个博弈里，我们看到，“自然”可以有两种策略：确定今天是太太的生日或确定今天不是太太的生日，但不论“自然”采取何种策略，你的最好行动都是买花。买花是你的占优战略。博弈距阵如下（自然的得益皆为 0）：自然不是太太的生日 3，0 0，0是太太的生日你买花 5，0 不买花 -2，0夫妻吵架也是一场博弈。夫妻双方都有两种策略，强硬或软弱（或称鹰派和鸽派）。博弈的可能结果有四种组合：夫强硬妻强硬、夫强硬妻软弱、夫软弱妻强硬、夫软弱妻软弱。至于哪一种是纳什均衡，必须列出其支付矩阵才可以确定。支付矩阵不一定非要用量化确定的数字表示，也可以用支付函数表示。经济学家们常用支付函数进行讨论。根据生活的实际观察，夫软弱妻软弱是婚姻最稳定的一种，因为互相都不愿让对方受到伤害或感到难过，常常情愿自己让步。动物学的研究有相同的结论，性格温顺的雄鸟和雌鸟更能和睦相处，寿命也更长。夫强硬妻强硬是婚姻最不稳定的一种，大多数结局是负气离婚。夫强硬妻软弱和妻强硬夫软弱是最常见的一种，许多夫妻吵架都是这样，最后终归是一方让步，不是丈夫撤退到院子里点根烟，就是妻子避让到卧室里嚎啕大哭。犯罪和防止犯罪是罪犯和***之间进行博弈的一场游戏。***可以加强巡逻，或者休息。犯罪者可以采取作案、不作案两种策略。如果罪犯知道***休息，他的最佳选择就是作案；如果***加强巡逻，他最好还是不作案。对于***，如果他知道犯罪者想作案，他的最佳选择是加强巡逻，如果犯罪者采取不作案，自己最好去休息。当然，犯罪者和*** 都不可能完全知晓对方将采取的行动，因此他们都将估计对方采取某种行动的概率，从而决定自己要采取的行动。结果是，他们将以一定的概率随机地采取行动，这叫“混合策略”。我们可以简单地分析一下混合策略（对数字不感兴趣的读者可以不看下面一段）。下面是犯罪者与***的支付矩阵（假定犯罪者在***休息时一定作案成功，在***巡逻时作案一定会被抓住）：犯罪者不作案作案 *** 巡逻 0，0 2，-2 休息 2，0 -1，1 这个矩阵的数字含义可以表示，***巡逻，犯罪者不作案，双方都没有收益也没有损失；***巡逻，犯罪者作案，***因抓到罪犯受到表彰，得到效用 2 单位，罪犯被判刑丧失效用 2 单位；***休息，犯罪者不作案，***休息的很愉快得到效用 2 单位，犯罪者没有收益也没有损失；***休息，犯罪者作案，***因失职被处分而丧失效用 1 单位，罪犯犯罪成功获得效用 1 单位。这个博弈是没有纳什均衡的。但是，如果***知道犯罪者以 p 的概率选择作案(不作案概率就为 1-p)，他该怎样采取自己的行动？对***而言，巡逻的预期效用为 0×（1-p）+2p=2p，休息的预期效用为 2×（1-p）-1×p=2-3p。显然，当 2p&2-3p 即 p&0.4 的时候,***最好选择巡逻;反之2p&2-3p 即 p&0.4 的时候,***宁愿选择休息。假设***应以 q 的概率巡逻（休息的概率就为 1-q），那么犯罪者最好的行动是什么？他作案的预期效用是-2×q+1×（1-q）=1-3q，不作案的预期效用为 0×q+0×（1-q）=0。显然，当 1-3q&0 即 q&0.33 时，他的理性选择是作案，反之不作案。在这个博弈中，***以 0.33 的概率巡逻 0.67 的概率休息，犯罪者以 0.4 的概率作案 0.6 的概率不作案构成一个混合纳什均衡。上述混合纳什均衡可以这样理解，如果***以高于 0.33 的概率巡逻，犯罪者最好是躲避起来。犯罪者一旦躲避，***就没有收获，于是降低巡逻的概率，于是犯罪者重新活跃，于是***又提高巡逻概率……从一个长期来看，两者的均衡将维持在***以 0.33 的概率巡逻犯罪者以 0.4 的概率作案上面。现实中，我们看到，当严打的时候（***出击的概率较高），犯罪分子便收敛一阵（降低作案概率）；严打的时期一过，犯罪分子又开始兴风作浪，在不能容忍罪犯过分猖狂的时候，警界不得不再次开始严打。在上述例子中，可能大家觉得***和犯罪者都根据一定概率采取自己的行动不太好理解，那么可以尝试这样理解他们：作案的犯罪者越多，那么出动的***将会越多，作案的犯罪者越少，出动的***将越少；反过来，出动的***越多，作案的犯罪者就越少，出动的***越少，作案的犯罪者就越多。极端地假设一个例子（它有助于我们的理解），警局有 100 名***，犯罪集团有 100 名犯罪者，那么上例博弈中，***以 0.33 的概率巡逻而犯罪者以 0.4 的概率作案这一纳什均衡可以理解为：在巡逻的***少于 33 人时，犯罪集团最好派 40 名以上的犯罪者作案；在巡逻***多于 33 人时，犯罪集团最好派 40 名以下的犯罪者作案；反过来，犯罪集团派 40 名以下犯罪者作案，警局最优选择出动 33 名以下的警察；犯罪集团派 40 名以上犯罪者作案，警局最优选择出动 33 名以上的***。当然，如果犯罪集团倾巢出动，那么***的选择也是全部出动，但***一旦全部出动，犯罪者最好选择全部不作案，犯罪者一旦选择全部不作案，***最好全部选择休息……最后长期的均衡状态是，警局派 33 名***巡逻，犯罪集团派 40 个人作案。这可以解释现实中，为什么警界总安排有巡逻力量，而犯罪者也总保持一定的作案数量。一个分析的例子——求职欺骗博弈董志强１９９９－７现在我们用博弈论来分析现实生活的一个现象：求职中的欺骗行为。这个例子旨在为读者将博弈论运用于分析社会现象提供一个例子。从事过人力资源管理工作的人都知道，招募新雇员可能是最易导致失败的工作之一。一名求职者在将来的表现可能有两种：胜任工作和不胜任工作；而招募方的甄选决策也有两种：接受某个求职者和拒绝某个求职者。这样，一次招募行为就面临下面四种结果：雇主接受求职者将来称职 Ⅰ 将来不称职 Ⅲ 拒绝 Ⅱ Ⅳ显然，Ⅰ、Ⅳ两种结果都是成功的。Ⅱ、Ⅲ两种结果却说明招募工作失败了。情况Ⅱ 意味着，雇主错误地拒绝了一个将来表现会比较成功的求职者，从而不得不花费更多的精力和财力去甄选更多的候选人，使甄选费用增加，同时也可能使组织名声受到破坏（比如，你拒绝的是一个妇女，完全可能被妇联指责为歧视妇女）。情况Ⅲ意味着，雇主错误地接受了一个将来表现很差劲的人，这将给组织造成显著的成本费用，包括为该雇员支付的培训成本、员工无能造成的生产成本上升和赢利机会丧失，以及解聘此雇员的费用和选聘新员工的费用等。错误地拒绝或错误地接受一名求职者，都是雇员招募中面临的风险。不过，导致错误接受的因素较少且一般可以由雇主控制（如歧视、偏见等）。导致错误接受的因素较多且雇主很难控制它们，比如求职者有意夸大自己的能力，或者求职者某一方面突出给雇主形成胜任工作的错觉，以及求职者有意的信息隐瞒和诈骗行为等等，都可能导致雇主错误接受。这些因素中，求职者的信息隐瞒和诈骗最严重也最常见。事实上，求职者的信息隐瞒和诈骗行为一直是管理中的道德困境问题。比如，一名下岗女工为了应聘文秘工作谎称她曾受过专门训练（实际上她仅仅在培训班听过几次课），对她的这种行为应严厉指责吗？不过作为雇主，不论是同情还是指责她，显然都不能把她的话当作可靠信息，否则就会作出不利选择。问题是，许多的事实表明，很多的求职者都会有意进行信息隐瞒和信息诈骗。我们可以把招募和应聘看作雇主和求职者之间的一场博弈。求职者有两种策略：欺骗或不欺骗雇主；雇主也有两种策略：相信与不相信求职者。我们假设：求职者不欺骗而雇主相信，双方从彼此的坦荡与信任中可获得效用各 5 单位；求职者欺骗而雇主相信，那么求职者欺骗成功，获得 10 单位效用，雇主损失 10 单位效用（因为雇主可能因此作出错误的决策）；求职者欺骗而雇主不相信，求职者的伎俩被识破获得效用 0，雇主也未能从发现***中得到正效用，其效用也记为 0；求职者不欺骗而雇主不相信，那么求职者因觉得冤枉丧失 2 个单位效用，雇主因没有相信实话也可能决策失误，丧失 2 个单位效用。下面就是这个博弈的报酬矩阵（每格第一个数字表示求职者的效用，第二个数字表示雇主的效用：雇主相信求职者欺骗 10，-10 不欺骗 5，5 不相信 0，0 -2，-2当求职者不欺骗的时候，雇主的最佳选择是相信。但求职者预计雇主会相信的时候，便会采取欺骗。雇主一旦发觉求职者的欺骗行为就会采取不相信。在这个博弈中，求职者不欺骗而雇主相信带来的总体效用（5+5=10）最大，可惜它不是均衡点。只有求职者欺骗而雇主不相信才是一个纳什均衡。博弈的结果将是求职者欺骗，当然雇主也不会相信。这很好理解：假如现实生活中有人凭借欺骗的手段获得了职位（的确有这样的例子的，而且肯定很多，因为有媒体报道过有人曾伪造公文骗得了市委副书记职务，就更不要说一般的企业招募员工了），势必引起更多的人妄图走此捷径；而雇主一旦发觉更多的人开始有欺骗行为时就会采取审慎的态度，不会轻易相信求职的人们；面对雇主的不信任加剧，原来一些诚实的求职者也开始采取欺骗态度（因为反正你不会轻易相信我是诚实的，我干脆就就不诚实，而且别人骗得我也就骗得），于是更多的求职者不诚实；更多求职者不诚实又加剧了雇主对求职者的不信任……最后就到了我们的纳什均衡：求职者欺骗而雇主不相信。上述结论与现实情况是相符合的。生活中，人才市场的通常结果是：由于金钱、升官、新工作的名声等强烈诱惑，由于社会监督检查不力，越来越多的人企图通过“瞒天过海”的手段发迹；寻求工作的急迫心情使人们产生***的邪念；***成功的范例为进一步 ***推波助澜。我们不难看到这些事例：一个刑满人员为了求职隐瞒其服刑经历，一个高中生为了谋取较高的职位伪造学位***或购买假***。有调查表明，70%以上的求职者在应聘中有信息隐瞒和信息诈骗行为。甚至您可以想想您自己，在您的求职书中真的没有伪造和故意夸大的部分吗？尽管您非常明白，聪明的雇主会看透您求职书的某些部分。学生常常被认为是很单纯的，但我的调查，大学毕业生在他们的求职书中往往言过其实，其文字的煽动性大于纪实性。对于求职中的欺骗行为我很有体会，我的大学同学大多在一些企业的人力资源管理部门工作，使我多少对求职中的欺骗都有些感受。发生在别人身上也就罢了，有的时候发生在你身上可能令你哭笑不得。比如我自己，以前有些朋友借我的***和***去作假，没想到有一次弄假成真，我的名字被挂在一个单位的设计部门，“我”成了那儿的工程师可我自己居然还不知道，直到一年多以后才偶然地发现。好了，现在我的一切证件都不敢外借了。雇主可以不相信求职者，却不能不招募必要的雇员填充工作空位。面临求职者的信息隐瞒和欺骗行为，，他如何防范和规避可能发生的风险？我们可以假设求职者和雇主有各自的收益函数，然后讨论各种情况下的纳什均衡及其条件。不过那样太学术化，而且会使本书失去普通的读者。因此我省略了那样的做法。单单指出，雇主防范和规避求职者信息隐瞒或欺骗带来的招募风险的具体措施可包括两个方面： ①雇主应尽可能多掌握求职者的信息，以利形成正确判断，作出正确决策。这方面的工作包括向求职者毕业的学校及原雇主核实其工作情况，对雇员进行背景调查，以及利用其他一些可资利用的信息网络等； ②设法使求职者采取诚信态度。这一方面的内容包括 a.降低求职者欺骗成功的概率，打击其侥幸心理，比如采用申请表、笔试、绩效模拟和测验、工作抽样、面谈、专门的测评中心、履历调查、体格检查等多种手段进行甄选就是有效的办法，以及 b.增大求职者欺骗行为的成本（相当于降低求职者欺骗的效用），比如：出台有关制度，对求职者的重大欺骗行为予以制裁（如法律规定通过欺骗签定的劳动合同无效且须补偿受害方的损失）；向求职者暗示强硬信息——说谎将失去就业机会；在面试中询问有关专业知识方面的问题，如果工作是技术性的，求职者的欺骗行为很容易暴露；实行“降格录用”，即“高学历低就业”，比如研究生先作本科生使用，本科生先作专科生使用，确有能力才提高其就业待遇；约定低报酬的考察期，有能力和绩效方正式录用，正式录用后给予经济补偿；让求职者明白，每一雇员都可能面临历史调查，一旦发现隐瞒和欺诈行为，将受到处理；健全内部劳动力市场，规范内部晋升、报酬等制度。此外，选择采取欺骗手段可能性相对较小的群体作为招募对象（如到学校招聘学生），也是一种规避风险的措施。当然，在不对称信息条件下，不管机制多么完善，代理人的机会主义行为都不可能完全消除。也就是说，我们将没有办法彻底使求职者的欺骗行为在这个世界上消失，虽然，使更多的人不要欺骗是可能的.游戏规则董志强１９９９－７进行游戏，必然要有游戏规则。人生是一场游戏，人们同命运、他人进行博弈，也有一些规则；经济活动也是博弈，也要讲游戏规则。游戏规则可以简单地看作是博弈各方（局中人）必须在博弈过程中遵守的一些规定或约定。没有规矩，不成方圆。没有游戏规则，博弈就无法进行。我的理解，游戏规则是游戏参与者的共同知识。在人生和生活的博弈中，游戏规则非常的多，比如法律、道德等等各种正式的或非正式的约束都是游戏规则。违反规则的人，将受到规则的惩罚。游戏规则保证博弈能够有所依据地进行，但并不意味着规则一定是公正和平等的。比如在古代社会，奴隶主或地主可以***奴隶或农奴，这是游戏规则许可的，但游戏规则不许可奴隶或农奴有选择主人的权利。中国漫长的封建社会里，“君要臣死，臣不得不死；父要子亡，子不得不亡”、“三纲五常”、妇女的“三从四德”等等都是游戏规则，但这些规则都并不公正平等。生活中的游戏规则通常都是有某些集团或阶层建立起来，不可避免地，将维护一部分人而排斥另一些人，因此也不可能有普遍意义的的公正和平等。正如马克思指出，所谓 “民主”的国家只是统治阶级享有民主的国家，被统治阶级是没有民主可言的。什么规则可以是公平和平等的？我想应该是，假如有一个人，他不参与游戏活动，所有的博弈结果跟他没有厉害关系，由他按照公平和平等原则制造出的规则，才可能是公平的。比如，自然是超脱于人类社会的，自然界的“优胜劣汰”、“适者生存”等自然法则就是真正公平和平等的游戏规则。只要规则的制定者参加游戏，那么游戏规则的公正性就得不到保证。就想现在一些经济学家对国有企业受到保护的批评一样，政府是经济活动规则的制定者，但政府又在作为游戏参与者处处践踏规则。在我看来，游戏规则本身也是在博弈中建立起来的。比如，一个社会要建立自己的道德体系，总是在不断的斗争中建立起来。大家从历史和当代都可以看到，在一个道德观念大变革的时期，总是各种观念纷纭，口诛笔伐，激烈争辩甚至运用暴力工具，然后慢慢地有一种观念占据主流，于是以此观念为主体的道德体系开始建立起来。一个国家的法律体系，也是在不断的斗争中建立起来，我的意思不是简单地指那些议员在是否通过一项法案时不停争吵直到最后达成妥协，也包括为使法律成为人人遵守的规则而付出的努力，比如在法令初期对以身试法者的毫不手软。统治者建立的游戏规则的权威性常常建立在许多被统治者的被制裁上面——也有例外，战国商鞅立木建信说明也有其他的方法来提高规则的权威性；资本主义国家偶尔也牺牲一点点资产阶级的利益向广大劳动阶层贫民显示规则的权威。还有，大义灭亲也是牺牲自己的利益维护规则的权威性。那些在游戏规则中受到不平等待遇的人们，通常采用这么一些手段作为博弈的策略： ①改变自己的效用函数，即改变自己对于人生的期望。比如“认命”、信教，养成对生活逆来顺受的品德或者同流合污（比如《绍兴师爷》里的董知县，年轻时刚正廉洁结果屡屡受挫，心中很是愤懑，后来对官场的黑暗习以为常，有时也仿效几招，官倒越做越大了）； ②退出游戏。比如自杀。当然不仅只是自杀，有的人看透官场的黑暗（即感受到官场游戏规则的不公平）而隐归乡野也是退出游戏； ③更改游戏规则。比如发动起义、革命，建立新的国家和制度。改革也是更改游戏规则。其实人生在世，受到的众多约束都是游戏规则。如果你没有能力建立有利于自己的新规则，那么还是老老实实地接受既有的规则吧。不过，现在许多的年轻人都对世俗的道德提出了挑战，他们要建立一种多元化的游戏规则——这也许是值得高兴的，因为多元化意味着更多的自由。最后有一点想说的是，现代社会的游戏规则已经愈来愈有利于知识阶层，如果你没有能力改变现状，那么你就应该多学点知识，才可能在游戏中立于不败之地。信息的作用董志强１９９９－７（《信息产业报》2000 年６月 26 日以《信息经济学与人生博弈》为题转载）在博弈论里面，信息是一个非常重要的概念。现代经济学最为激动人心的领域之一的信息经济学就建立在博弈论的基础上。虽然信息在信息经济学中有严格的定义，即：信息就是知识差。但是既然我们现在不是讨论学术，所以您也不妨就把信息理解成为您平时所理解的信息，没有关系——这不过意味着你理解的信息比信息经济学里的信息范围更宽一些而已。信息对生活的影响是深刻的。从人们赶时髦的一些流行的提法诸如信息经济、知识经济、信息战我们就可以感觉到。更有一些走极端者竟然量出了这样的观点：知识经济的出现彻底否定了斯密以来的两百多年积累和发展起来的经济学理论。从人类历史以来，人们从来没有象现在这样深刻地意识到信息对于生活的重要影响。也从来没有任何一个时代象现在一样，报纸漫天飞，广告遍街是，电台电视台频道不计其数，互联网更是把触角伸向世界每一角落——您每天都在信息的狂轰烂炸下苟延残喘！信息实际上也是知识，拥有某方面信息就是拥有某方面知识。比如，你拥有一条信息是甲商场货品比乙商场货品便宜，就相当于你拥有“知道在甲买东西更便宜”的知识。信息是重要的，在商业争斗、军事战争、政治角逐中都表现得十分明显。《孙子兵法》云：知己知彼，百战不殆。这说明掌握足够的信息对战斗的好处是大大的。在生活的“游戏” 中，掌握更多的信息一般会有好处的。比如，你要恋爱，你得明白他（她）有何所好，然后才能对症下药投其所好，不至于吃闭门羹。你猜拳行令（南方的人们喜欢在喝酒时猜拳助兴），如果你知道对方将出什么，那你绝对赢。信息是否完全会给博弈带来不同的结果。有一个劫机事件的例子（张维迎,1996）可以说明。假定劫机者的目的是为了逃走，政府有两种可能的类型：人道型和非人道型。人道政府出于对人道的考虑，为了解救人质，同意放走劫机者；非人道政府在任何时候总是选择把飞机击落。如果是完全信息，非人道政府统治下将不会有劫机者（这与现实是相符的，在汉武帝时期，法令规定对劫人质者一律格杀勿论，有一次一个劫匪绑架了小公主，武帝依然下令将劫匪射杀，公主也死于非命，但此后国内一直不再有劫人质者），人道政府统治下将会有劫机者。但是，如果想劫机的人不知道政府的类型，那么他仍然有可能劫机的。所以我想，一个国家要防止犯罪的发生，仅有严厉的刑罚是不够的，还要让人民了解那些刑罚（进行普法教育）。因为，他不知道会面临刑罚，他就不会用那些规则来约束他的行为。在我国，法盲是很多的，许多悲剧也正是因为不了解法律而酿成的。加里·贝克尔认为影响个人犯罪的因素有被发现的概率和处罚的严重程度，我认为还要加上个体对法律的了解程度这一项——这表明，进行普法教育是重要的。更进一步讲，一项制度要规范人们的行为，必须要使人们具备关于这项制度的“共同知识”。比如，规定“车辆右行”的交通规则，就必须使每个司机都具备“车辆右行”的知识，否则交通仍是混乱的。你当然可以对不守规矩的司机进行处罚，是其明白自己的错误从而具备“车辆右行”的知识，那么可能的结果是，每个司机被处罚一次后，“车辆右行”才成为共同知识——与其这样，还不如一开始就对申请驾照的人进行交通知识教育。总之，对人们进行关于“制度”的知识教育是重要的。在上面的劫机案例中，非人道主义的政府最好把自己的信息传递给所有的人民，才能使劫机现象不发生。生活中，作为个人而言，有时候也需要把自己的信息传递给别人。比如求职，你就需要尽可能把你的优势长处展示给招募者。教育程度就是你求职时需要向雇主传递的一个重要信息。大家应该还记得我们讲到过人力资本，那时我们认为较高教育水平劳动力具有较高的劳动生产率，因此所得报酬也较高。但一个叫斯宾塞的经济学家指出：教育水平只是一种信号，可能并不与劳动生产率有相关关系。可以这样理解他的意思：接受教育水平较高的人常常是更具有学习能力的人，较高的教育水平传递了这么一个信息，我具有较强的能力。作为企业，当然更愿意雇佣能力较强的人，于是教育程度就成了企业过滤人才的一个标准。实际上，高教育水平也许并没有带来高产出。当教育程度作为一个信号的时候，我们就可以解释为什么那么多人要去争取一个***甚至伪造学历，而且许多企业单单看了求职者的***就决定录用而没有仔细去验证求职者的真实能力如何，直到最后才发现，自己接受的大学高材生原来是个高分低能之辈。教育为什么能作为一种信号，而且为什么需要这种信号？用“柠檬市场”原理可以解释。“柠檬市场”本身讨论的是旧车市场，现在我们以劳动力市场来进行同样的讨论。假设劳动力市场上的求职者质量只有两种：高质量和低质量。求职者自己知道自己是高质量还是低质量，但雇主不知道求职者是高质量还是低质量。假设：高质量求职者要求的薪资是 500 元以上，雇主愿意给高质量的求职者 600 元以下的薪资，即双方可以在薪资 500~600 元的区间达成交易；低质量的求职者要求的薪资在 300 元以上，雇主愿意给低质量的求职者的薪资在 350 元以下，即双方可以在薪资 300~350 元的区间达成交易。如果，信息是完全的，那么雇主将给高质量求职者开出 500~600 元的薪资，给低质量求职者开出 300~350 元的薪资。但是雇主没有信息区分求职者是高质量还是低质量，于是，为保险起见，以 475（（600+350）/2）元以下的薪资雇佣求职者——结果，高素质求职者将退出劳动力市场，因为雇佣价格低于他的劳动力最低供给价格；当雇主发现雇佣的求职者全是低素质的时候，他就会把薪资压到 350 元以下，整个劳动力市场就只有低素质求职者了，这就是“劣货驱逐良品”的效应。更一般地，如果假设劳动力质量服从于[0，1]间的连续均匀分布，我们还可以退出劳动力市场瘫痪的结果，即劳动力市场上没有劳动力供给。当然，在现实中，劳动力市场没有瘫痪的例子，但低效率却是常见的。显然，高质量的求职者为了获得满意的薪资，必须向雇主传递表明他是高质量劳动力的信息。人们选来选去，发现教育可以作为这样的信息，因为一般地接受教育越多，意味着拥有更多的知识，也意味着更具有学习的能力等。于是，大家看到，***在寻找一份满意工作的过程中发挥了重要作用。在劳动经济学中，有一个统计歧视理论，也支持了上述看法。雇主明明知道并非每一个受过高等教育的人的能力一定超过只受过初等教育的人（即存在某些只受过初等教育的人的能力高于某些受过高等教育的人的情况），但他在最初雇佣时开出的价格常常仍然依据学历来确定。因为，如果他不加分别地给予两者相同的工资，他将面临不利选择，分开等级给予工资虽然仍面临风险，但却可以将风险降低，其期望收益可以提高。上述描述的是一场雇主先行的博弈，教育作为一种信号。大家还可以想想看，如果假 ***泛滥，且雇主对***真假难辨，即***不再传递求职者具有高素质的信息，那么*** 在找工作过程中还能发挥重要作用吗？现在你有大学***，但这个社会也有假***泛滥。所以，雇主常常还得考虑你的***的可信度（即真实程度）然后作出自己的决策。现在你可以向雇主表示：可以向你毕业的学校调查，如果***有任何水分，那么你甘愿接受高额的罚款。这就使你的***的可信度提高了，实际上你也并没有付出那笔罚款。这种行为在博弈论中称“承诺行动”。承诺行动可以改变博弈的结果。比如，红军和白军争夺一个小岛，如果红军誓死保卫小岛，白军就最好放弃进攻（有点穷寇勿追的味道），如果红军保卫小岛的决心并不坚定，白军就最好进攻。现在，红军就可以采取一个“承诺行动”，一上岛就砸掉船只，拆掉桥，显示出背水一战誓与小岛共存亡的决心，于是白军觉得红军誓死保卫小岛是可信的，最好放弃进攻。与承诺有点相似的是“威胁”。它相当于“如果你不……我就……”。威胁可信，有助于改变博弈结果；威胁不可信，它无助于改变博弈的结果。《圣经（旧约）》上有个故事：两个妇女为孩子的所有权发生争执，到所罗门国王面前请求判决。一个妇女说孩子是自己生的，被另一名妇女抢去了；另一名妇女称孩子本来就是自己亲生的。于是国王命下人取来剑，说：“把孩子切成两半，让他们每人拿走一块。”结果一个妇女说：把孩子给她吧，不要杀了他。另一个妇女说：切吧，谁也别想要孩子。于是孩子判给了第一个妇女。在这个故事中，国王就采取了“威胁”。但是，如果那个假母亲意识到国王不可能真的杀掉孩子（即威胁是不可信的），国王还能知道谁是真的母亲吗？相反，春节期间走红的《绍兴师爷》里的方师爷就比国王聪明，他遇到一个同样的案子，但他的办法是让两个母亲把孩子往自己身边拉，谁抢到孩子归谁。结果，真母亲不忍看孩子受罪就放弃了，当然最后孩子判给了他。我认为，方师爷采用的激励机制比所罗门国王的激励机制更有效。在生活当中，承诺、威胁也是一些常用的策略。比如，父亲阻碍女儿跟某男青年来往，女儿可以自杀威胁父亲，但是父亲会判断这种威胁是否可信。在商业斗争中，某些商家为了防止对手作某件事（比如降价），常常宣布保留采取进一步（报复）措施的权利，其实也是一种威胁，它或许只是恐吓，或许是真的。现在，即使你采取了一个承诺行动，向雇主许诺如果***有假则如何如何，但如果雇主认为你这个承诺是不可信的——是的，人家凭什么要相信你的空口声明呢？——那么，你又能怎么办？或许，你只有花更高的代价去传递更令人感到可靠的信息，比如说你可能会同意学校多收一点钱制造带有防伪标记的***。这在商业经营中也比较常见，比如在以次充好盛行的情况下，高质量产品的销售商总会力图建立良好的商业信誉，这样，它就可以从商誉中获得好处：人们相信它的产品是高质量的，也愿支付更高的价格。是不是其他的次品销售商也可以建立商誉呢？一般地，高质量产品销售商建立的商誉可以长期带来收益；而次品销售商建立的商誉可能只有一次起作用，因为人们姑且相信它而购买一次产品，但随即发现买了次品，于是次品销售商的商誉就下降甚或不存在了。如果，把建立商誉的花费看作一项固定成本，那么良品销售商所花的费用可在长期分摊，而次品销售商的花费只能一次性回收（否则得不偿失）。因此，如果建立商誉得成本较大的话，次品销售商是不愿去建立商誉的。我们看到，许多良品的商誉都是花不小的代价建立的，有的甚至经过几十年才累积了一个品牌，而消费者对它们也格外信赖。相反，如果建立商誉的成本很小，那么大家都会建立“商誉”，结果等于谁也没建立商誉，消费者也不领情。比如，在大街上，我们看惯了“跳楼价”、“自杀价”、“清仓还债，价格特优”等招牌，这也是商誉，但谁相信它是真的呢？向别人传递信息很重要，但隐瞒信息或宣布虚假的信息也很重要。比如前面提到的政府和劫机犯博弈的案例，人道政府最好就隐瞒自己的特性，并伪装成非人道政府，也可以实现没有劫机现象（如果是重复博弈可能人道政府难以隐瞒自己的特性，因为只要发生一次劫机，人道政府的特征就暴露了）。商战中，信息战是一种常用的伎俩。重庆通讯市场曾发生过一起案例说明了隐瞒信息的重要性。去年 5 月某日，中国联通重庆公司在报上突然发布广告：次日手机降价。中国电信重庆公司随即获悉这一消息，当天下午即商讨对策，晚上将电信手机降价方案送往报社立即发排。第二天清早，电信一些员工和雇佣的临时的广告派发员将电信手机即日降价的广告发往过往的行人。结果，电信打了一个漂亮的“后发制人”的仗。联通的失败在于，他们把谋划已久的降价商业秘密没有保守到真正的最后时刻，它为电信采取行动留下了时间空间。还有一个有趣的观点就是，我认为，那些没文化的“暴发户”的暴发，正好是建立在他们缺乏某一方面的信息上。信息即知识，当某个赢利机会到来的时候，没有文化的人看到的只是赢利机会，而拥有较多知识的人不幸还拥有了这样的知识：不可一风而上。于是没文化的人去了，赢得了利润，而知识分子坐失良机。这样的一个事实可以演化成下面一个博弈：假设有一个只市场，有两个人进行争夺。如果甲（知识分子）进入，乙（低文化者）也进入，那么造成过度进入，双方都亏损 3000 单位；如果甲进入乙不进入，则甲赢利 1000 单位，乙赢利 0 单位；如果乙进入甲不进入，则乙赢利 1000 单位，甲赢利 0 单位；如果甲乙都不进入，则甲、乙赢利都为 0 单位。博弈的报酬矩阵如下：甲（知识分子）进入不进入乙（低文化者）进入 -3000，-，0 不进入 0，这个博弈中，纳什均衡是（甲进入，乙不进入）或（乙进入，甲不进入）。即给定甲进入，乙就不进入，给定乙进入，甲就不进入。但是现在，乙不知道两人共同进入将导致双方亏损，他只看到进入的利润，于是他将不考虑甲的行为，采取进入行动；而甲，因为掌握太多的信息，包括知道乙“不知道两人共同进入将导致双方亏损”而必定采取进入行动，于是乙只好放弃进入。平时，我们讲知识分子做事总是顾虑太多，在这个博弈里面，我们看到正式知识分子的顾虑使社会产出最大（0），如果知识分子不顾虑，那么社会产出就因为混乱而降低了（-6000）。而且，知识分子牺牲自己的可能赢利机会来使社会产出最大化。所以，我一直认为知识分子是真正默默奉献的一个阶层，而社会的分配体系却很少考虑知识分子的牺牲。但上述例子并不说明知识越多越不好。对个人而言，可能有时过多的知识反而使赢利机会被迫放弃，即信息越多并不必定越好。但对全社会而言，可以想一下，如果大家都缺乏知识和信息的话，结果是大家都“进入”，社会产出完全无效率——因此，具有更多的知识仍是必要的。我们一直强调信息的重要性，其实我们是想强调掌握信息的不同组合对博弈结果的影响是重大的。换句话说，博弈的均衡常常取决于知识结构。

请问你罗列的博弈论书籍的书能去哪里买得到？

参考资料

随机推荐