管理经济分析01：博弈论与经济学

1 综述

经济学假设每个参与经济活动的人都是理性的，每个人都可以在一定的偏好和给定的约束条件下，做出最优的决策；博弈论就是在其他参与者的战略方案已知的情况下，决策者做出的最优反应。

但是在实际的经济活动中，并不是每个参与者都能理性的做出决策；首先，一个经济活动者的决策行为受其他决策这的影响，他做出的决策并不一定是最优的，比如在囚徒博弈中，他们都知道 [不坦白] 是对他自己也是最整体最好的方案，这是理性使然；但是几乎所有的囚徒在非重复博弈中，都选择了坦白，这也是理性的选择，这样的理性来源于他对其他人的理性做出的判断。因此，理性是基于其决策的场景而言的，理性的结果得到不一定是最优解，而是适用于场景的相对损失较小的解。

新古典经济学假设市场有足够多的经济主体，从而产生了充分的竞争，并且参与者之间不存在信息壁垒，也即市场是具有完全信息的完全竞争市场；然而，我们面临的真实的市场情形是，参与经济活动的市场主体是有限的，信息也存在各种各样的壁垒，经济活动参与者做出的决策都是基于其对其他参与者的行为的判断，而做出的使自己获得最大收益。

也就是说，博弈论强调的是在给定约束下充分发挥个人理性以获得最大效用；即当个人无法完全掌控全局，而最终结果由群体决策时，个人为了使自己的利益最大化而做出的策略选择。这其中涉及到参与主体间的相互作用及其均衡问题。

2 非合作博弈的非技术性概述

博弈：对抗双方在对抗过程中，采取的相互依存的策略组合及行动的集合

博弈论的本质：参与者的策略是相互依存的，参与者的利益是相互制约的，每个个人都需要根据自己掌握的信息，选择对自己最有益的策略并采取行动。

由此，确定博弈论的基本要素：

概念	描述
参与者	在经济活动中，能够在给定约束下做出最优选择决策主体
行动	参与人的决策变量
战略	参与人行动的规则
信息	参与人在决策中的知识
支付函数	参与人从博弈中能够或的效用水平
结果	博弈论分析者感兴趣的要素集合
均衡	所有人最优战略或行动组合

根据参与人行动的先后和掌握知识的多少，将博弈划分为如下四类：

		行动是否具有先后次序
		静态	动态
掌握知识的多寡	完全信息	完全信息信息静态博弈（纳什均衡）	完全信息动态博弈（泽尔腾,1965）
掌握知识的多寡	不完全信息	不完全信息静态博弈（海萨尼,1967-1968）	不完全信息动态博弈（泽尔腾,1975; 威尔逊, 1986; 泰勒尔, 1991）

2.1 完全信息静态博弈

每个人都知道其他人的策略和支付矩阵

2.1.1 囚徒博弈–集体理性缺失

囚徒困境的故事讲的是，两个嫌疑犯作案后被警察抓住，分别关在不同的屋子里接受审讯。警察知道两人有罪，但缺乏足够的证据。警察告诉每个人：如果两人都抵赖，各判刑一年；如果两人都坦白，各判八年；如果两人中一个坦白而另一个抵赖，坦白的放出去，抵赖的判十年。

得到的矩阵：

于是，每个囚徒都面临两种选择：坦白或抵赖。然而，不管同伙选择什么，每个囚徒的最优选择是坦白：如果同伙抵赖、自己坦白的话放出去，抵赖的话判十年，坦白比不坦白好；如果同伙坦白、自己坦白的话判八年，比起抵赖的判十年，坦白还是比抵赖的好。结果，两个嫌疑犯都选择坦白，各判刑八年。如果两人都抵赖，各判一年，显然这个结果好。

囚徒困境所反映出的深刻问题是，人类的个人理性有时能导致集体的非理性；聪明的人类会因自己的聪明而作茧自缚，或者损害集体的利益。

拓展一：重复博弈

在重复的囚徒困境中，博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时，合作可能会作为平衡的结果出现。欺骗的动机这时可能被惩罚的威胁所克服，从而可能导向一个较好的、合作的结果。反复的、接近无限的重复次数时，纳什均衡趋向于帕累托最优，从互相背叛趋向于互相忠诚。【必须是不确定次数的重复博弈】

拓展二：固定次数重复博弈

假定最后一次博弈，两个囚徒都认为没有必要跟对方合作，因为不需要继续进行下一次博弈，合作其收益可能为-1,也可能是-10，但是其不合作的收益要么是0，要么是-8；此时，合作是严格劣势策略，此时必然会选择不合作。

每个人都这么想，那么在倒数第二次，他们也不会合作；以此类推,…，最终人就是相互背叛

2.1.2 智猪博弈–搭便车的弱者

假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽，另一头安装着控制猪食供应的按钮，按一下按钮会有10个单位的猪食进槽，但是谁按按钮就会首先付出2个单位的成本。按钮和猪食槽在相反位置，按按钮的猪要付出2个单位的成本，并且丧失了先到槽边进食的机会。

若小猪先到槽边进食，因为缺乏竞争，进食的速度一般，最终大小猪吃到食物的比率是6∶4；若同时到槽边进食，大猪进食速度加快，最终大小猪收益比是7∶3；若大猪先到槽边进食，大猪会霸占剩余所有猪食，最终大小猪收益比9∶1。

分析：

大猪按，自己可以吃6个单位，损失2个单位，收益为4；小猪收益为4
大猪不按，自己吃9个单位，收益为9；小猪收益为-1
小猪按，自己吃1个单位，损失2个单位，收益为-1；此时大猪收益为9
小猪不按，自己吃3个单位，收益为4；此时大猪收益为4

那么，在两头猪都有智慧的前提下，最终结果是：小猪选择等待，大猪去按按钮。

对应于现实的例子：高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择，对它的留意和研究可以给企业节省很多不必要的费用，从而使企业的管理和发展走上一个新的台阶。这种现象在经济生活中十分常见，却很少为小企业的经理人所熟识。

2.1.3 性别战–让人相信你是头倔驴

有一对夫妻，丈夫喜欢看足球赛节目，妻子喜欢看肥皂剧节目，但是家里只有一台电视，于是就产生了争夺频道的矛盾。假设双方都同意看足球赛，则丈夫可得到2单位效用，妻子得到一单位效用；如果都同意看肥皂剧，则丈夫可得到1单位效用，妻子得到2单位效用；如果双方意见不一致，结果只好大家都不看，各自只能得到0单位效用

如果对方一意坚持，则顺从对方比与对方抗争要好。一方坚决选择自己喜欢的节目时，顺从至少可以得到1单位效用，而抗争则只能得到0单位效用。这与现实中的故事是一致的，夫妻双方一方坚持己见的时候，另一方常常会迁就一些，做出让步。

性别战博弈结构的显著特点是，博弈有两个均衡，博弈双方各自会偏爱一个均衡，比如丈夫偏爱（足球赛，足球赛）均衡，而妻子偏爱（肥皂剧，肥皂剧）均衡；不过他们还是有一些共同利益的，因为任何一个均衡中，他们都可以得到比非均衡状态更多的赢利。在性别战中，究竟哪一个均衡会出现？也许这取决于夫妻两在家庭的地位，如果什么都是丈夫说了算，那么很可能出现丈夫偏爱的均衡。或者也可能出现轮流做主的情况。但更多的时候，在性别战博弈中建立一个强硬的形象也许是有好处的。”

性别战博弈的启示是：在对方不会拆台的情况下，都有共同达到赢利的目标时，成功达到均衡的关键是谁先采取行动，谁就能够占领先机，获得优势。

2.1.4 懦夫博弈或斗鸡博弈–让人相信你是莽夫

两个司机的车不是开向悬崖，而是在一个可能彼此相撞的过程中开车向前。每个人可以在相撞前转向一边而避免相撞，但这将使他被视为“懦夫”；他也可以选择继续向前；如果两个都向前，那么就会出现车毁人伤的局面；但若一个转向而另一个向前，那么向前的司机将成为勇士。

如果一方坚持要进行博弈，那么另一方难以退出博弈(退出博弈也会被视为“懦夫”)。局面就变成了骑虎难下；而此时，冒险选择向前而获胜的一方，总是将自己的幸福建立在了对方的痛苦之上。假定博弈参与的一方是鲁莽、不顾后果名声的人，另一方是足够理性的人，那么鲁莽者极可能是博弈的胜出者。如果这种懦夫博弈进行多次，则冒险选择向前而成功的参与人就更有信心在将来采取这种策略，他很可能会树立起一种粗暴的形象使得对手在未来的对局中害怕而获得好处。

游戏中有一点很重要，那就是如果你能判定对方一定会选择不转向，那你就一定要转向。所以，只要你能想办法让对方认为你是肯定不会转向的，那你就可以迫使对方选择转向。这时候，发出什么样的信号，让对方相信你不会转向，就成了你最需要考虑的问题。这里有一个方法，那就是放弃自己的选择权。比如，在这个游戏中，你可以用一块布蒙住自己的眼睛。这实际上是告诉对手，你放弃“转向”这一选择。而对手知道你已经没有能力选择转向了，那么他为了不受重伤，就只能选择“转向”了。

2.1.4 市场进入阻扰博弈

潜在进入企业决定进入一个新的产业，但是不知道在位者企业的成本函数，也不知道是阻扰还是默许；在位者的是知道进入者的成本函数的

进入者不进入的垄断利润为300，进入之后寡头利润和为100，斗争会使利润化为乌有；进入成本为10

2.2 完全信息动态博弈

上述博弈存在三个问题：

可能存在多个纳什均衡，究竟哪个会真实发生？
每个人选择自己策略时，假定其他人策略给定，不考虑自己选择如何影响他人选择
由于不考虑自己选择，对他人选择的影响，纳什均衡允许不可置信威胁存在；如2.1.5的(不进入, 斗争)的情况

对应三种动态博弈的处理策略：

即某个结果不可能出现，则剔除；通过精炼，缩小纳什均衡解的范围
行动是有先后顺序的，先做出决策的人，会对后来者产生影响
泽尔腾剔除不可置信威胁，决策者会随机应变

拓展型：

参与人
每个参与人选择行动的时点
每个参与人每次行动时，可供选择的行动集合
每个参与人在每次行动时掌握的有关对手过去行动选择的信息
支付函数

使用博弈树来描述市场阻扰模型：

在位者的斗争，作为不可置信威胁存在，在信息经济学中的一个重要概念 <承诺行动>；那么承诺成本越高，承诺就越置信

经典例子是：破釜沉舟

2.3 不完全信息静态博弈：贝叶斯纳什均衡

在给定自己类型和别人类型的概率分布的情况下，实现每个人的期望效用最大 海萨尼变换

2.3.1 高成本和低成本的市场阻扰博弈

那么，对于在位者而言，如果斗争为高成本时，会选择默许；如果斗争成本为低成本时，会选择斗争

但是进入者不知道这样的情况，他进入还是不进入，取决于对在多大程度上认为在位者选择斗争，也即他对在位者是低成本还是高成本的判断。

海萨尼转换：

假定高成本的概率为p,则低成本的概率为1-p:

进入者的进入的收益函数为：p * 40 + (1-p) * (-10); 不进入的期望收益为0；

当p > 1/5 时，进入者有利可图，会进入，当 p < 1/5 时，选择不进入

2.3.2 求爱博弈

假设你是一位女士，接受男士求爱的标准是你对他是否良善的判断；

如果他品格良善，他求爱你就接受，收益为100；他求爱你不接受，男士损失50；男士不求爱，双方损失均为0

如果他品格恶劣，他求爱你接受，你损失100，男士收益100；他求爱你不接受，男士损失-50；男士不求爱，损失为0

那么假设男士品德良善的概率为p, 则品德恶劣的概率为1-p：

你的收益为：p * (100) + (1-p) * (-100) = 200 * p – 100；也即你对求爱者品德良善的概率判断大于0.5，则接受求爱

2.4 不完全信息动态博弈

后行动者关注先行动者的行为，增加对先行者的知识，不断完善和修正自己的判断，由此决定自己的行动
先行者知道自己的信息会被别人利用，就会设法传递对自己有利的信息

精炼贝叶斯均衡

泽尔腾的颤抖手均衡
克瑞普斯和威尔逊的序贯均衡
佛德伯格和泰勒尔的精炼贝叶斯均衡

条件：

给定每个人有关其他人类型的信念的情况下，他的战略选择是最优的
每个人有关他人类型的信念都是使用贝叶斯法则从所观察的行为中获得
不仅要定义每个人的策略组合，还要定义参与人的信念

黔驴技穷：

老虎第一眼见到驴，认为庞然大物，躲着
过段时间，老虎出来打探毛驴的本领；毛驴大叫一声，老虎躲闪
再过一段，老虎又来打探，毛驴一蹬腿，老虎得知毛驴真本事，直接吃掉

拓展在位者阻扰模型：在位者指定价格P，其中包含成本函数的信息；只有低成本企业才有利可图，高成本企业不敢进入；进入者根据在位者制订的价格，判断他是高成本企业还是低成本企业，推断出其为低成本，就进入。

今天的文章管理经济分析01：博弈论与经济学分享到此就结束了，感谢您的阅读。

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。
如需转载请保留出处：https://bianchenghao.cn/62644.html