博弈论和纳什均衡的三个经典案例_纳什均衡理论的意义[通俗易懂]

博弈论和纳什均衡的三个经典案例_纳什均衡理论的意义[通俗易懂]作为补充材料来学习吧~_(斗鸡博弈)假设汤姆和吉米是

博弈论和纳什均衡的三个经典案例_纳什均衡理论的意义[通俗易懂]

第五章 弗洛伊德的梦——博弈和大脑

大脑和经济学

曾经有一段时间——就像在弗洛伊德的年代——心理学家们无法准确地回答人类行为背后的大脑机制。但随着现代神经科学的兴起,情形改变了。比如,人类的情绪不再像过去一样是个谜。科学家们可以观察当人们感到轻蔑、厌恶、恐惧或者愤怒、同情和恋爱时大脑的内部的活动,更不用提吸毒获得快感的时候。人类决策的驱动力可以追溯到特定脑区间的信号传递。因此人类的经济或是其他行为,可以不再用经济学家的“理性”和金钱效用来分析。实际上,看起来大脑是用多巴胺,而非美元来衡量效用。而且这只是神经经济学这门新学科对理解人类经济行为的贡献之一。

《神经元》杂志在2002年10月发表了一期专刊,刊登了一系列关于人类决策的文章,其中的很多都在探索神经经济学研究提出的新观点。蒙特格和伯恩斯在那期专刊上的文章中提出化学物质多巴胺是大脑用来测量潜在行为相对获益的货币。那篇文章引用了很多证据来支持这个观点,即一个活动回路连接了大脑的两个部分——一部分靠前,在前额后面,另一部分则深埋在大脑中部——通过产生更多或更少的多巴胺来主导决策行为。证据表明多巴胺水平预测了不同选择的可能奖赏。多巴胺一直以来被认为是大脑最主要的快乐分子,和产生快乐感觉的行为有关。但并不只是快乐控制着多巴胺的产生。实际上,看起来大脑的多巴胺货币调节了对快乐的期待(或某种形式的奖赏)。蒙特格和伯恩斯展示了大脑的某些产生多巴胺的神经细胞负责监控期待奖赏和实际奖赏的差异。如果一个选择带来了和预期完全相同的奖赏,多巴胺细胞保持一个平稳的活动水平。当快乐超过了预期,那些细胞疯狂地释放多巴胺。如果奖赏不如预期,多巴胺就减少。这个监控系统也考虑了奖赏的时机——如果晚餐推迟了,多巴胺就会减少。当预期的奖赏没有实现,多巴胺监测系统告诉大脑改变它的行为。通过这种方式,对奖赏的期望可以指导大脑的决策。蒙特格和伯恩斯指出,重要的一点是,并非所有大脑都相同。一个人梦想的奖赏可能是另一个人可怕的噩梦。一些人只在期待巨大的奖赏时才会做冒险的选择;一些人冒险只是为寻找乐趣。神经经济学的一个前景就在于它可以通过大脑扫描来确定这些个体差异。

在蒙特格和伯恩斯描述的一个实验中,人们在电脑屏幕上选择A或者B,然后观看屏幕上的一条杠来看看自己是否赢得了奖赏(这条杠记录了游戏进行中的累积奖赏“点”)。随着游戏进行,电脑会根据玩家的选择来调整奖赏。一开始,选择A使杠上升得更多,但频繁地选择A会使B成为奖赏更多的选择。当A的奖赏下降,一些玩家很快就发现了并转向更多地选择B。但有些人会一直选择A,赌它会回到开始的高奖赏率。这表现出一些大脑比另一些大脑更倾向于冒险——一些人保守地玩;另一些人喜爱冒险。[事实上,蒙特格说对这两类玩家更准确的标签应该是“匹配者(matchers)”和“优化者(optimizers)”。“我称他们保守和冒险是因为可以拿它们开些有趣的玩笑。”他说道。]对我来说,听起来更像是他们该被称为“转换者”和“顽固者”。然而标签并不重要。这个实验最吸引人的结果是大脑扫描所揭示出来的。当然可以肯定,两组人的大脑活动方式不同,特别表现在一小组叫做伏隔核的脑细胞上。这是一个与药物成瘾相关的脑区,“冒险型”玩家(顽固者)的这个脑区更活跃。

然而最巧妙的是,你可以在比赛一开始就区分出哪些人是冒险者,哪些人是安全型的玩家,甚至当他们的行为还未表现出差异时。这类证据可以推翻行为主义者认为只有行为才重要(或者才能被了解)的旧看法。在游戏初期,两个玩家可以表现相同,做出完全相同的选择。但是通过扫描他们的大脑你将会看到不同,这使你可以预测当奖赏率发生变化时他们会怎么玩。“那些整体来说更冒险的人和那些转换选择的人不同——甚至没有人会转换类别。”蒙特格告诉我们。更有趣的是,两组人也存在着遗传上的不同。因此神经经济学家为经济学家提供了一种他们不曾拥有过的工具,带来了新的希望:通过观察大脑内部活动,科学也许可以真正走上发现支配人类行为的自然法典之路。

批注:感觉这章内容其实没说什么。。。

第六章 谢顿的解决方案——博弈论、文明和人性

进化心理学如何看待人性

被广泛宣传的进化心理学的热衷者也坚持认为,人类今天的行为反映了人类进化早期时的物种的基因选择。这个概念意味着人性是一个种族共同的传承,塑造了人类今天对环境的本能反应,这取决于他们在猎群时代怎么做才能生存下去。哈佛大学的心理学家斯蒂夫·平克(Steven Pinker)是这一观点的典型支持者。他在自己的书《白板》(The Blank Slate)中怀着极大的热情宣扬他的信念。他认为,“人类大脑在出生时是空白,而完全靠经验来塑造”的观点是没有意义的。进化已经把人性的一般特征编入程序,存储在指导大脑发展的基因硬盘驱动器里了。所以,今天所说的人性起源于人类进化的早期。“从进化的角度对于人性的研究可知,许多心理的能力(比如我们对多脂肪食物的渴望,对社会地位的渴望,对冒险的性关系的渴望),与对当前环境的现实要求相比,更好地适应了我们祖先对环境的进化要求。”平克在书中提到。

换句话说,今天的人类只是穿着衣服的猎群者而已。表面上看来,如果这个观点是正确的,它或许对于博弈论和其他人类科学是件好事。如果自然法典被刻入存在于人类基因的天赋,它将大大开阔解密掌控人性的法则并预测人类行为的前景。毕竟,自然法典存在的这个概念可能被解释为有这样一些所有人类种族成员都遵循的普遍的行为程序。然而,尽管人们对进化心理学领域所做的智能研究给予应有的尊重,一些从中得出的结论的依据相当没有道理。与其说支持进化心理学,博弈论更有助于指出它垮掉的原因。进一步说,博弈论起的作用与阿西莫夫的小说主角哈里·谢顿起的作用极为相似。哈里·谢顿找到了阐述他的社会物理学或心理史学的方法。

人类社会的多样性

临近20世纪末,讲求实际的人类学家独立地制订出了一项类似的为分析人类社会行为的计划。通过在地球上与世隔绝的小社会中进行最后通牒游戏(和一些其他的形式),科学家发现人类天性并不那么普遍。事实证明,后工业社会中的大学生并不能完美地成为整个人类种族的代表。这个全世界范围的游戏计划是由人类学家乔·亨利希(Joe Henrich)提出来的。之后在1996年,一个加州大学洛杉矶分校(UCLA)的研究生和东秘鲁马奇根加的农民进行了这个最后通牒游戏。游戏的规则同大学生的一样:给一个选手一定金额的钱并且让他必须和第二个选手分享这笔钱。第二个选手可以接受(第一个选手留下的剩余的钱)或者拒绝。当他拒绝时,所有钱将被收回,谁也得不到什么。到亨利希在秘鲁试验最后通牒游戏时,这个游戏已在大学生中广泛流传。大学生经常把金额出到总数的40%以上。人们往往接受这样的给予金额。有时候,如果出钱太少,就会遭到拒绝。在马奇根加,亨利希注意到,人们往往会给出更低的金额——而且大抵还是会被接受。

“我们也希望马奇根加人和其他人做出一样的选择,”加州大学洛杉矶分校的人类学家罗伯特·博依德(Robert Boyd)告诉我,“他们做出的选择是如此迥异,使得我不知道该再期待些什么。”当世界上的其他人只计情感而不计收益时,马奇根加人真正地了解了博弈论的理性选择的规则了吗?或者其他孤立的文化也会出现同样的现象?很快亨利希、博依德和其他人从麦克阿瑟基金会得到了经费,并利用这些资金在四块大陆上的15个小规模社会群体中重复了这个游戏。结果让人十分费解。从斐济到肯尼亚,从蒙古到新几内亚的参与者,游戏的结果既不同于大学生的,也不同于经济学理论所讲的,但不管怎样他们都以愉快收场。在某些文化中,比如马奇根加,给予低金额是典型的并被广泛接受的。但在其他文化中,金额经常很低却往往被拒绝。在一些文化中,人们有时给予特别慷慨——甚至比一半还多。但在有些社会这样慷慨的给予又很可能会被拒绝。而在其他组中,不管给予多少,从来没出现过拒绝的情况。“它确实让你对人类社会性的本质重新思考,”现在于亚特兰大爱默里(Emory)大学就职的亨利希对我说,“人类社会性多种多样。只要你的理论是有关人类行为的,你就必须解释它的多样性。”

批注:但是“白板说”依然可以说,来自于不同地方和不同时间的狩猎群体吧?

这种跨文化的博弈论的研究,清楚地展示了不同文化背景下的人在从事经济活动时并非像传统经济学教科书上所描述的那样自私。而且研究还表明,在群体日常生活的文化细节方面中确实存在行为的差异性。组内成员也存在个体差异,如性别、年龄、教育程度,甚至个人财富方面的个体差异,但这些因素并不怎么影响成员拒绝他人给予金额的可能性。做出这样的选择,相对于个体特性来说,更明显地取决于一个社会参与的各种经济行为。特别是,平均的给予金额似乎反映了一个社会与其他群体交易的数量。研究表明,在市场交易中运用更多的经验,并没有把竞赛变残酷,反而使市场更公平有序。

比如,吝啬的马奇根加人,与世界的大部分地区经济上是分离的——事实上他们就连与自己家人外的其他人发生联系都很难。所以他们基于市场的经济活动是非常有限的,他们都表现得非常自私。在具有更多“市场综合”的文化中,像肯尼亚奥玛人的牲畜交易,最后通牒游戏的给予金额普遍偏高,平均占总数的44%,而且经常会达到总数的一半。

奥玛人的平均给予金额同美国大学生的十分接近。但美国大学生有时会给出低金额,奥玛人却很少这样做。大学生发现,他们给出的低金额通常会被拒绝,相反在某些社会中无论多低的金额都会被接受。比如蒙古西部的吐尔库特(Torguud)蒙古人,低金额就很少被拒绝。即使这样,吐尔库特的平均给予金额仍达到30%~40%——尽管事实是给予者如果给予金额更低可以得到更多。显然相对于金钱来讲,蒙古的本土文化更看重公平。并且吐尔库特人并不十分在乎因拒绝一个给予的金额而一无所有。

通过对不同社会的研究,人类学家发现了文化因素规定无私行为的各种不同方式。比如在巴拉圭的Aché,猎人们通常将一天的猎物留放在村子的周边。部落的成员们再找回猎物与村民分享。所以在做最后通牒游戏时,Aché人经常给出高金额,往往比总数的一半还多。印度尼西亚捕鲸为生的Lamalera人也是这样,他们公正仔细地把捕获的鲸鱼的肉平分。尽管如此,文化在其他社会里的影响是不相同的。在坦桑尼亚,哈扎人分肉吃,但他们对此不满并且一旦有机会就会走开摆脱分享。但是,不分享的人有可能会遭到受人排斥的风险,以及社会的谴责和流言蜚语。这样使得在进行最后通牒游戏时,哈扎人给出低金额时会遭到很高的拒绝率。

另一方面,给予高金额并不总是意味着该文化中渗透着利他主义。巴布亚新几内亚岛的奥和格瑙人经常给出高于一半的金额,但是这样的慷慨也经常受到回绝。表面的原因是奥和格瑙人认为接受别人的馈赠意味着你今后还有义务报答人家。一份过高的给予金额甚至可能会被看成一种侮辱。科林·卡麦勒(Colin Camerer),一位在跨文化博弈研究领域中与人类学家合作的经济学家,认为这种结果是另一种对经济行为上的文化影响的扭曲。“给予过多的金钱,不会显得格外慷慨,这实际上是一种吝啬的表现——是自降身份的,”卡麦勒解释道,“因此金钱被贬值了,因为人们不想受到侮辱,也不想负债。”

这种跨文化的博弈实验所产生的惊人结果表明,博弈并不必要用科学家预想的办法来衡量。博弈实际上接近于一种文化实践的形式,而不是单纯地用来测试经济行为。选手们明显地都在尽力体会博弈与真实生活的相关联系并都做出相应的表现。相关联系并都做出相应的表现。

“人们在实验中的所作所为确实大大改变了我们的想法,”卡麦勒在加利福尼亚学院与我的一次谈话中说,“我们将数学的偏见沿袭到博弈论中来了。”换句话说,最初的信念是“当你参与了博弈时,这就像一个聪明的孩子坐下来玩垄断大亨或者扑克……他们读懂规则,弄清楚该做什么——他们把它当成一个逻辑问题来处理。但是这些人把它当作类比推理——这与生活中的什么相似呢?”所以,博弈实验所表明的是,在不同的文化背景下,生活形态是各异的,并且经济行为恰恰反映了文化生活中的这些差异。博弈论阐述了文化与经济行为的相互影响,说明人类的思维方式不是放之四海而皆准的。人类文化不是单一的,而更像是博弈论中的综合策略

博弈、基因与人性

在许多社会中显示的公正及行为的多样性,很难与人类心理通常是由过去进化所形成的这样的观点相一致。进化心理学的强硬解释可以随处预测类似的行为。然而,博弈实验项目却给进化心理学家出了一道难题。“我认为如果最终结果是,世界各地的人都是……冷酷自私的,进化心理学家们就会说,‘看,我早告诉过你,’”博伊德说。“但若结果不是这样的话……对他们来说那就不是一个令人满意的事实。从另一个角度来讲那却是相当有力的证据。”但他指出,进化论对于人类心理学来说仍然重要。“受过教育的人都不应该怀疑心理学是进化论的产物——那是与生俱来的,”博伊德说。“问题是,它如何起作用?”

正如卡麦勒所说,进化心理学家总是可以退却到可靠的说法,即祖先的环境造就了人与人之间的不同。但在那种情况下,最初关于单一的“人类天性”的主张就显得相当的薄弱了。“我认为你可以拒绝接受有关文化多样性的强硬说法。”卡麦勒说。我认为认识到这一点很重要,即对于进化心理学和它智慧的先驱——生物社会学的敌对人士所提出的“基因决定论”的反对,并不是他们下意识的反应。关于进化心理学局限性的结论是有证可寻的。随着近十几年来进化心理学经常受益于有利的宣传潮涌,越来越多发人深思的批评(不是刻薄的论战)也渐渐地开始出现。

其中最有意思的一条批评来自于迪卡布北伊利诺斯大学的哲学家大卫·布勒(David Buller),他批判性地评价了一些进化心理学的主张“成功”的方法的严谨性,并且发现证明它们的证据事实上是模棱两可的。在2005年出版的书以及同年发表在《认知科学的潮流》上的一篇论文中,布勒区分了纯粹的进化论研究和心理学的关系——进化心理学用一个小写字母e和p表示,从进化心理学来看,论文中的范例是基于“普遍人性学说”和“关于思想的适应性建筑是大量模块化的假设”。布勒写道。“进化心理学家主张认为我们的心理适应能力是‘模块’或者说有特殊用途的‘小型计算机,’它们在更新世时代,都用来解决我们原始猎群祖先所面对的生存或繁衍的问题。”他主张认为许多进化心理学家声称的“发现”都在评论分析下土崩瓦解。进化心理学家说他们的工作解释了嫉妒在性别上的差异,一种能发现“欺骗”的与生俱来的能力(如,当一些人获取好处却没能履行义务),以及收养子女比其亲生子女更容易受到父母虐待的趋势。布勒说,无论进化心理学的解释看起来多么合理,其潜在的真实证据还是有很多缺陷的。某些情况下,这些观点所依赖的数据可能是偏执或不完善的,而且有时研究方法并不足以严密能够排除关于结果的其他可能性解释。例如,布勒坚持认为,旨在阐述大脑的“欺骗探测器”模块的卡片选择任务的结果,也能够通过没有模块但思考有逻辑性的大脑来解释。他写道,“虽然进化心理学的范式是一个大胆创新的说明性框架,它并没能从进化论的角度为人类心理学提供一个精确的理解。”

布勒的批判体现了一个长久以来备受争议问题的最新发展阶段,这是一个关于基因和进化在塑造人类文化和行为模式的作用的争论,一个被普遍认为是关于先天和后天——基因和环境之间的对决的问题。进化心理学观点把巨大的力量归因于指导人类行为的基因天赋;许多科学家、哲学家与其他流派的学者发现关于基因力量独裁决定论的信仰让人尤为不悦。无论如何,像布勒的异议——不管它们是否有很好的依据——都不应该被认为是支持一种极端的观点,即否认基因在行为中起的任何作用(让人惊讶的是,有时仍然被表达出来)——或者更精确的,人类行为之间的差异。当然,没有基因,就没有行为——因为那样就将没有大脑,没有身体,无从开始。真正的问题是,个体基因组成的多样性是否导致人和文化中所显现的行为趋势的多样性。近年来,关于此问题最深入的研究者曾倾向于赞成基因在某些程度上起作用。任何说基因根本不起作用的人肯定不关心分子遗传学研究,尤其是在神经系统科学领域的研究。而且,正如进化心理学家所认为的那样,现代神经系统科学的确为许多大脑功能中的模块性提供了一些证据。但是,最近的神经系统科学也主要通过展示大脑的灵活性来举进化心理学的范例。事实上,为特定行为做准备的大脑的确是有特定系统的。但是,事实上,人类大脑在体验之后适应趋势的能力上展示了很强的灵活性(术语叫可塑性)

所以,人性是什么呢?博弈论所能描述的人性又是什么呢?

的确存在人性,但人性并不是像极端的进化心理学家所描述的那样单一的人性。它是一种混合的人性,在仔细考究下,这个特性在由博弈论主宰的世界里应该是很明显的。进化,归根结底是博弈论的终极实验,在这个实验里,回报就是生存。正如我们所见,进化博弈论不能预测哪种单一行为策略在博弈中获胜。它就像一个仅由鹰和鸽子组成的社会——处于一个不稳定的状态,与纳什均衡相去甚远。而博弈论的规则利用策略的多样性,促使不同物种的生物为了幸存和繁衍,尝试各种不同的行为。

透过博弈论的镜头,我们可以看出进化论在人类心理学的作用仍然重要,但它比持强硬路线的进化心理学家所认为的更加微妙。博弈论确保进化产生出物种的差异、行为的混合,而且在人类问题上,产生文化的多样性。

所以看起来,博弈论本身已经回答了为何它至少没有像它最初所阐述的那样起作用的问题。纳什最初的博弈数学的分析被解释得有点过于狭隘。单单就将其应用于经济学来讲,它预测的行为就经常与人类真实所为不一致,但那是因为数学是在一个假设和计算的抽象领域中起源并发挥作用。如今,通过在全世界使参与者融入其本身文化氛围进行博弈实验,科学家已经证明,被应用于经济学和行为学研究的纯数学方法能够被真实世界的因素所改进。

“我的目的是让数学家松开他们在博弈论的缰绳,不再仅用数学的思维来思考博弈……”卡麦勒告诉我。相反,他说,博弈可以看成是对“正在世界上发生的事进行X光拍摄。”从这个角度看,博弈论变得更有力了。它成为一个工具,一个用来诠释人类行为复杂性以及理解无数推进人类历史前进的交互作用的工具。这正是哈里·谢顿一直找寻的用来开创一门社会科学的东西。

当然,阿西莫夫有许多现实生活中的前辈,他们同样探求类似的社会科学。事实上,阿西莫夫所引证的统计物理学,作为心理史学的引导,将其受到的启示归功于应用统计学于人类的先驱者——尤其是由天文学家改行的社会学家:阿道夫·凯特勒(Adolphe Quetele)。

批注:“赢”太灵活了。。。就生物学而言是生存,就经济学而言是钱,就大脑而言是多巴胺……不过“博弈论确保进化产生出物种的差异、行为的混合,而且在人类问题上,产生文化的多样性”这点还是有道理的——生存的问题🤔。

今天的文章博弈论和纳什均衡的三个经典案例_纳什均衡理论的意义[通俗易懂]分享到此就结束了,感谢您的阅读。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/89302.html

(0)
编程小号编程小号

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注