首页 > 精品范文库 > 12号文库
博弈论
编辑:落日斜阳 识别码:21-987373 12号文库 发布时间: 2024-05-05 00:26:19 来源:网络

第一篇:博弈论

【内容提要】本文主要讲述博弈论的理论以及博弈论在教育中的应用;同时着重讲述博弈在中学教育的设计和培养学生以及日常生活中的一些具有教育意义的案例;并且本文重点讲述了教育的一些培养方案和方法,以及一些教育计划。【关键字】博弈论理论

博弈在教育的应用

教学设计 培养方案 【正文】我是一名就读于泉州师院专业是地理科学的学生,地理科学专业是师范类的专业,本学期我的校选课是博弈论,对博弈论有了较为浓厚的兴趣,所以我总结了教育与博弈论的关系以及博弈论的应用。“博弈论”是一种“游戏理论”,来自英文“Game Theory”。“Game”的基本意义是游戏,因此“”就是一种“游戏理论”。实际上,博弈论也很像象棋、围棋、扑克等。数学家们将这些具体的问题抽象化,通过建立完备和体系来研究其变化及其规律。

其实,博弈论主要研究人们的策略的相互依赖行为。博弈论认为,人是理性的,即人人都会在一定的约束条件下最大化自身的利益,同时人们在交往合作中利益有冲突,行为互相影响,而且信息常常是不对称的。博弈论也研究人们的行为,在直接相互作用时的决策,以及决策的均衡等问题。

作为大学生的我们来说,博弈论有让我们理解的理由。博弈论是人们深刻理解各种经济行为和社会问题的基础。现在人们说的博弈论,一般指非合作博弈论。它的特征是:人们行为相互作用时,当事人不能达成一个有约束力的协议。或者也可以说,行为人之间的合约对于签约人没有实质性约束力。博弈论是我们大学生应该学习博弈之间的约束力以及博弈的奥妙。

我们知道一种博弈论的例子。其实在上课的时候老师就已经提及了这样的一个例子,这个例子是什么呢,这个例子就是通过博弈的一些奥妙解决问题的,所以说博弈论是很有助于我们日常生活的。

在市场竞争中寡头之间通过竞价,尤其是通过降价争夺市场是市场竞争中十分普遍的行为。但削价竞争并不一定是成功的策略,因为一个寡头的降价往往会引起竞争对手的报复,此时降价不仅不能扩大销量,而且还可能会降低利润率。下面我们用一个双寡头两种价格的价格竞争模型来说明上述现象。

假设寡头1和寡头2 是双寡头市场上的两个寡头,它们共同用相同的价格销售相同的产品。现在假设这两个寡头不满足它们各自的市场份额和利润,都想通过降价来争夺更大的市场份额和更多的利润。如果只有一方降价而另一方维持原来的高价,则降价方的目的显然是可以达到的。然而当一方的降价引起对手的报复时,这种目的就不一定能达到。假设两寡头在原来的“高价”策略下各可以获80 万元的利润;如果得某个寡头单独降价,那么它可以获130万

元利润,此时另一寡头由于市场份额缩小,利润也下降到20万元利润。如果另一寡头 也跟着降价,则两寡头都只能得到60万元假设寡头采用“高价”策略,那么寡头1采用“高价”得策略80万元,采用“低价”策略得30万元,显然寡头应该采用“低价”策略。假设寡头采用“低价”策略那么寡头采用“高价”策略得益2为万元,采用“低价”策略得益60万元,显然寡头也应该采用“低价”策略。用同样的方法分析寡头的情况,也可知道不管寡头 的策略是什么,寡头都应该选择“低价”策略。因此,这个博弈的最终结果一定是两寡头都采用“低价”策略,各得到万元的利润。由于本博弈是一个非合作博弈问题,且两博弈方都肯定

对方会 按照个体行为理性原则决策,因此虽然双方采用“低价”策略的均衡 对两个博弈方来说都不是理想的结果,但因为两博弈方都无法信任对方,都必须防备对方利用自己的信任(如果有的话)谋取利益,所以双方都会坚持采用“低价”策略,各自得到万元的利润,各得80 万元。

还有一个例子是这样的。如果很想对商业多了解一点,于是你向十所学校的企业管理学院提出入学申请,结果有9家录取你,只有1家没有通过。不幸的是,你最想去的就是拒绝你的那一所学校。这是因果报应吗?不是!这是逆向选择(你把你最不想交往的人吸引过来时,就出现了逆向选择的结果。

从学校的角度来看,最可能获得入学机会的学生大概是那些学校最不想要的人。假设学校随便选100个高中生让他们入学,哪些学生最可能接受这个机会?是入学测验考得很好的那些人吗?可惜不是,而是那些想要上大学但却考不上其他大学的学生,他们大概也是这所大学最不想收的学生。这就可以通过博弈的一些知识来解释和解决问题了。博弈论的解释有时是很微妙的,有时候是很让人意外的。

我认为,教学是一种以教材为中介,学生在教师的指导下掌握知识的认识活动。其实我想指出,“知识”是指人的行为、见解、理解力和态度、技能及人的能力中任何一处可以长久保持的东西。我认为这个教学概念界定指出了教学活动的最基本特征。我认为教学过程是教学过程中最需要博弈的一个环节,教学过程是我们作为师范类学生能够教育好学生的一个重要环节,也是一个非常关键的环节。

教师基本功大赛是在大学教学的第一次进行博弈,因为是第一次的教课所以要学会的也非常的多。作为大学生我们学院开展教师基本功大赛。大赛是美好的,虽然有时候会因为这样而浪费一些时间,但是他给我带来的博弈知识是无穷的。如教学过程是学生在教师引导下的一种特殊的认识过程,或者教学过程是以认识为基础的心理过程和以能力为核心的个性心理特征的统一培养和发展的过程;教学过程是以智育为核心的德、智、体全面培养和发展的过程。由于对教学过程本质认识的差异,而形成对教学过程的概念各有不同,包括教学过程的具体特性以及对教学过程本质本身的认识。

那么究竟什么是教学过程呢?对这一问题虽然经过了长时间的讨论,仍没有形成共识,但对于教学过程是一个特殊的认识过程这样一个基本观念已经得到大多数人的认可:即教学过程是以传授知识为基础的。这是它的本质特征之一。知识的传授和学习成为教学过程的最根本的特点。从知识和能力的关系分析,教育史上曾有“形式教育”与“实质教育”之争。实质教育论形成于赫尔巴特时期,兴盛于斯宾塞时期。斯宾塞以什么知识最有价值”为口号,将知识按重要程度分类。形式教育论的主要代表人物之一裴斯泰洛齐的名言是:官能的发展取决于对学生能力进行适当反复操练而形成的习惯,而不是取决于知识。这两大教育派别的争论在今天的延续就是教学过程的主要任务是传授知识还是发展能力,两者的关系究竟如何。毫无疑问,教学和发展是教学过程的两大功能,都不能偏废,但何者是最是最基本的,研究表明,知识的掌握是发展能力的基础,脱离了知识的学习和技能技巧的形成,能力便失去了赖以形成的手段和借以表现的形式,成为无源之水,无本之木。当然,我们并不是主张教学过程只要传授知识而忽视能力的培养,而是主张在打好扎实的知识基础的前提下,发展智力、能力,并且以发展了的智能学习更多的新知识,达到两者的统一。

教学过程其实也有很多很多的博弈论的知识。教学是一项具有明确目的的培

养人的社会实践活动。在这个社会实践活动中,使学习者学习和掌握基础知识和基本技能,发展学习者的智力,培养学习者的能力,使学习者形成一定的思想品质,促进学习者身心健康的发展。为达到这样的教学总目标,教师必须依据一定的教学思想或理念,结合自己对教学过程的理解和认识,以各种方式、方法对师生双边活动进行周密地思考和精心地设计。

社交的能力其实就是博弈能力的一种体现。社交能力是指进行社交生活的能力,和朋友、教师、邻居,以及陌生人交谈,陈述自己的想法和意见的能力即是社交能力。在友人遇到困难时帮助他,在朋友受欺负时援助他,这种能力也是社交能力。在十字路口按红绿信号灯的指示行走,靠右走,爱护公共财物,做到不毁坏、不污损,遵守公共道德,把玩具让给伙伴们玩等集体参与的能力,都属于社交能力。现在的孩子虽然学习能力较高,但缺乏社交能力和处世常识,无法进行良好的集体生活。要孩子将来进入社会后能顺利地从事社会活动,就要让孩子从小养成良好的社会能力。

我觉得一个具有很高的语言智能的人能用语言精确地表达自己的意思,且与人交流时语言清楚有力。一个具有很高语言智能的人阅读和书写都很好,通常具有很大的词汇量,能将单词的运用作为一种有效的交际手段。对一个具有很高语言智能的人来说,单词不仅可以表达意思,还可以进行绘画。诗人都具有很强的语言智能,他们牢牢地抓住语言,使之能表达错综复杂的情感。显然,小说家和记者具有很强的语言智能,那些市场创意和电台节目主持工作的人员也具有很强的语言智能。政治家凭借他们说什么或怎么说来影响公众、发展自己的追随者,他们当然具有很强的语言智能。语言智能的组成元素包括阅读、书写、做诗、演讲能力和听力以及对其他语言的熟悉程度。几乎在每一个领域或专业中,都需要拥有语言智能。

时间有时候效率观念淡薄。在实际教学中,有些教师缺乏强烈的时间效率观念,不注意通过教学双边活动的优化调控,最大限度地提高课堂有效教学的时间量,不去反思怎样通过改进教学设计和帮助学生改进学习方法等途径提高教学效率和质量,而是一味强调增加学习时间和刻苦用功的重要性,从而使许多学生的学习长期处于投入大、负担重、效率低、质量差的被动境地;有的教师上课不能充分利用教学时间保质保量地完成教学任务,结果,只能让学生在课前课后占用大量时间进行预习、复习。有的教师只注意提高部分学生的课堂教学时间效率,却忽视了另一些学生尤其是差生的教学时间效率,从而使部分学生的课堂实用时间和学术学习时间明显偏少,损害了这部分学生的成长和发展。更有甚者,有些教师视教学为儿戏,课前不认真备课,在课堂上随意发挥,废话连篇,节奏松垮,毫无教学计划和效率效益意识。这种教学时间效率观念淡薄的情况在中小学有些教师的思想中程度不同地存在着,成为教师教学观中的一个严重问题。博弈论如果能被很好的应用的话那么这些严重的问题可能就会容易的解决。

博弈论给我将来的教学是有帮助的,虽然说我不一定会当老师,但是博弈论的应用以及学习博弈论的过程是受用的,力量是无穷的,因此我将会好好继续学习博弈的知识们争取在其他的领域也用上博弈的知识,这样学有所用是很令人期待的。

参考文献:

《博弈论》作者:范如国

《生活中的博弈论》作者: 孙恩棣著 《活学活用博弈论》作者: [美]米勒著

《战略投资学 实务期权和博弈论》作者:(美)Han T.J.Smit 《爱心护天才:博弈论大师纳什的故事》 《博弈论与经济学》作者: [法]蒙特等著 《管理博弈论》作者: 侯光明 《现代教学论》作者:樊豫陇编著

《提高教学有效性的实践探索》作者:毛国锋 《教学设计》作者:王丽娟

《在生活中培养孩子的多智元》作者:衍健编著 《立体培养方案》作者:冯化平

第二篇:博弈论

智猪博弈的启示:生活中好些情况的发生,是和规则联系在一起的。规则发生变化,情况也会变得不一样,结果会不同。对于决策者来说,想要得到不同的结果必须采取不同的规则。规则的制定直接影响到能否实现预期的结果。其一,“搭便车”现象在生活中随处可见:股市上等待庄家抬轿的散户;等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资;公司里不创造效益但分享成果的人。虽然政府,社会,公司尽量避免这类想象的发生,但是,由于制度制定不合理,这类现象就不可避免。对于这种规则虽然合理性太差,但是想要改变却极为困难,多是由于涉及到既得利益者的利益。其二,“人浮于事”现象在工作中的出现就是由于规则的制定,没有调动工作的积极性,自己的劳动是为他人提供便利,大家没有竞争意识。除非大家都去贡献才能让大家都得利。其三,“平态现象”在工作中的表现是谁有需要,就去工作,如果工作对于他没有要求或者本身对工作不太负责,就易出现有工作就做,没工作或不是自己的工作就不去做,缺少合作,竞争意识也不强。也难以调动员工的工作的积极性。另外,这种规则实施起来成本最高,又不能得到预期效果,不利于资源的优化配置。其四,“多劳多得”现象,这种规则的设计比较好,能较好的达到的预期效果,又能起到节约成本的作用,对于调动员工的积极性和增强竞争意识都是不错的选择。

囚徒困境的启示:在信息得不到完全沟通的情况下,单个的选择人会从利己的角度出发做出选择,其结果是个人利益得到一定程度的实现,但却使整体利益得到损害。在现实的生活中,常用来解释个体理性与群体理性的矛盾及从现实的利益出发合作的必要性。个体理性与群体理性:各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局,只有当他们都首先替对方着想时,或者从全局利益出发作出选择时才会使群体获得最大利益。合作的必要性:是否选择合作,不仅要从自身出发,还要看合作者的态度及其可能做出的选择出发。如果双方有共同的利益追求,而合作本身又可给双方带来最大利益的话,合作是双方利益的共同选择。但是,当合作的一方选择背叛时,被合作方如果继续选择合作,无疑是得不偿失的。最好的选择是“一报还一报”自身在多次博弈时选不选择合作,要看对方的选择。同时,合作的必要性的博弈得出的结论是生活中总有些人在生活中选择背叛,而制度就是对背叛者必要的约束,这样社会才能保持长久的合作关系,才能推动社会的长久进步!

第三篇:博弈论

博弈论的目的在于巧妙的策略,而不是解法。学习博弈论的目的,不是为了享受博弈分析的过程,而在于赢得更好的结局。博弈的思想既然来自现实生活,它就可以高度抽象化地用数学工具来表述,也可以用日常事例来说明,并运用到生活中去。博弈时时存在,它就在你的身边。《博弈论的诡计》就是试图通过日常生活中常见的例子,来介绍博弈论的基本思想及运用,并且寻求用种智慧来指导生活决策的方法。阅读本书,我们除了了解到令人震撼的社会真实轨迹之外,还可以学到最合适的为人处世方法。

读完本书受益匪浅。

首先,作者深入浅出讲解了博弈论这个本来显得高深莫测的概念,并且通过古今中外的实例加深了读者对于所讲述博弈论模型的理解;其次,给读者提供了另一种策略型的视角去看待生活中的人和事;最后,本书的重点更多在于讲解建立在某些前提下的策略模型,局限性较大,而没有真正着重到实际操作的层面,所以本书并非指南操作型书籍,更多的是教你如何运用这种思维方式去看待生活中遇到的问题或矛盾。

具体来讲,每个章节都讲述了一个典型的博弈模型,撇去大量实例后,基本可以用一两句话概括中心思想。

第一章,博弈论的概念。讲构成博弈论的基本条件以及部分专用术语。

第二章,囚徒困境。不管对方采取任何策略,我方总会选择占优策略。

第三章,重复博弈。如果是有限次数的博弈,背叛是不可避免的,重点就在于如何不让对方看到博弈的尽头和维持长期的博弈合作关系。

第四章,一报还一报策略。精明的人际关系准则。具体模式为善良(开始总是保持合作),惩罚(一旦对方背叛,能够识别并且进行报复动作),宽容(不因为一次背叛怀恨在心,对方改过自新后依然选择合作;不要每次背叛都进行惩罚,能够辨别对手背叛的原因,给予对方改过的机会,采取“事不过三”原则),简单(赏罚分明,让对手明确你的原则),不妒忌(不耍小聪明占便宜,不争强好胜)。

第五章,人质困境。多人的囚徒模式告诉我们,需要协调甚至个人牺牲才能有所收获的事,实施起来会很难以及对手也会是朋友。

第六章,酒吧博弈。如何识别临界点以及少数者策略。

第七章,枪手博弈。先发未必优势,后发如何制人。

第八章,猎鹿博弈。帕累托效率没有实现在于个体对集体合作和资源的背叛。

第九章,智猪博弈。小猪如何依附大猪,大猪的跟随智慧以及冒险来得越早越好。

第十章,警察小偷博弈。混合策略均衡,随机、不可预测性很重要。

第十一章,斗鸡博弈。学会见好就收,给对手留条活路。

第十二章,协和谬误。不要留恋无法挽回的付出。

第十三章,蜈蚣博弈。从终点出发的逻辑推理方法。

第十四章,分蛋糕博弈。讨价还价的艺术。

第十五章,鹰鸽博弈。不要小看尽管不是最优的约定俗成的力量。

第十六章,脏脸博弈。如何传递私人信息成为共同知识。

第十七章,信息不对称。保护个人私有信息的同时,尽量获得对手的私有信息,避免信息不对称造成劣势。

第十八章,信息传递。广告和学历都是信息传递的典型模式。

第十九章,信息甄别。如何从大量资源中筛选对自己的有益信息。

第二十章,策略欺骗。利用思维定式寻求突破点。

第二十一章,承诺与威胁。达到自己目的的两种手段。

第四篇:博弈论

生活中的博弈论

——生活中的博弈论结课论文

博弈论,观词达意,即“搏斗中的策略”,英文原意为Game theory,同样是指对有关赌博、比赛和竞争时策略的论述。在选择生活中的博弈论这门课之前,自己对这个理论就有很大的兴趣,因为不仅理论本身是妙趣横生的,更重要的是它存在于生活中的各个方面。也许人们没有听说过这个名词,但也一定有博弈的思想。无论是大到整个经济学,还是小到人与人之间的日常,处处都有它的影子。

我之所以对博弈论有兴趣,最初不是看到它的高深,或它的实用性,而是被它的趣味性所吸引。第一次在书中读到“囚徒困境”后便记住了这个名词。后来自己在课堂上学过“概率论”,并且还一度认为“概率论”与博弈论有很多相似之处,认为博弈论也是利用了概率的知识而已。可通过后面越来越多的学习和了解,才发现远不是这么简单。下面我用例子来说明这一观点。

比如我曾看过另一个博弈论的经典案例:美女的硬币。大意是说,如果一个人要和你玩硬币,两个正面,美女给你3元;两个反面,美女给你1元;若一正一反,那就需要你给美女2元。这样的游戏,你玩不玩?

在没有学习概率论之前,也许我会粗略的认为这个游戏一定要玩,因为光是游戏规则就偏向了自己这一方,而美女则看起来是吃亏的。当学习了概率论之后,我还是觉得这个游戏可以玩,因为如果假设双方出正反面的机率是相等的,那么美女和自己一方的赢输概率也是相等的,既然平等竞争,又岂能推脱?

然而,我们之所以认为博弈论是实用的,是贯穿于生活各个方面的,就是因为它的严谨性和现实性。因为在现实的商业竞争中,竞争的各方都不是仅仅听天由命,而是一群“高智商”的竞争者在挖空心思要赚取最大的利润。所以,在美女的硬币这个案例中,我们不能简单认为双方出正反的概率相等,反而一定不会相等。美女为了尽最大可能赢得比赛,一定会考虑自己出正反面时的赢钱机率。

对于我们,会考虑无论对方出正面还是反面,我们都要有最大的效益,并且效益是相等的。假设我们出正面的概率是x,反面的概率是1-x。为了使利益最大化,应该在对手出正面或反面的时候我们的收益都相等,不然对手总是可以改变正反面出现的概率让我们的总收入减少,由此列出方程就是3x+(-2)*(1-x)=(-2)*x+1*(1-x)。最后结果是我们每八局出三次正面,五次反面时的效益是最大的,但是这个期望的效益是多少呢?是-1/8.由此可见,聪明的双方竞赛时,我们赢钱的可能是小的,赔钱的可能是大的。这就是博弈论的魅力所在。

当然,我们大家都听说过“田忌赛马”的故事,在面临自己的马匹质量明显劣于对方的情况下依然获得了胜利,这就凸显了田忌的智慧,也凸显了田忌对“博弈”恰到好处的运用。其实在博弈论的角度上去看到就是,田忌用一匹5分的马耗去了一匹10分的马的精力,用自己最小的成本让对方的损失最大化,从而相当于让自己获益。

当然,今天我的题目是“生活中的博弈论”。而生活是自然的,是随机的,生活并不完全是由人能够去控制的。那么这时的博弈论就更像是一场在“自然下的选择”。生活中我们处处都要面临各种各样的选择,并且这种选择所带来的结果具有一定的未知性。这时候,只有最聪明的人才能做出最明智的抉择。

电影《美丽心灵》我看了很多遍,里面有一个很有意思的桥段:在一个酒吧里,有一个绝色美女,以及她的四个朋友,纳什的三个男同学都对这个绝色美女垂涎三尺,也都想把这个美女纳为己有。此时纳什提出了他的观点:我们是一个组队,如果每个人都去做对自己有利的事情,那么我们之间会互相伤害,最后一无所获,但如果我们做的事情对自己和组队都有利,就会全部收益。所以他说不能去追求那个最美的,而是应该追求四位普通美女。因为四个人都去追求那个美女很有可能被拒绝,而且她的朋友也不会甘愿做“second choice”,最终他们将谁也追不到。就是这么一个事情,让纳什觉得亚当史密斯的管理动力学是错的,从而经过他的研究,诞生了伟大的“纳什均衡理论”。虽然这是出于电影情节的考虑,但也反映了,博弈论确实与生活息息相关。

另外,我们以考试中的学生作弊和防止学生作弊为例。很容易知道,如果一个考场具有以下几点:考场干净整洁,监考老师认真负责,教室有摄像头,被抓作弊后果严重。那么这个考场几乎是没有学生会去冒险作弊的,因为被抓的机率很大,而被抓后后果很严重。但如果其中某个条件缺少,那么作弊现象就一定会增多。学生自己会分析他作弊与否所带来的利益最大化。如果监考不严格,或者被抓后无严重后果,那么为了取得更好的成绩,为了不挂科,他会甘愿铤而走险。

其次我们知道,作弊的群体中往往是成绩差的学生,这又是为什么呢?很简单,因为差生的“作弊成本”最低。如果优等生和差生通过作弊可以得到额外的10分,收益是一样的。但考试规则是被抓作弊“取消考试成绩”,那么优等生和差生一旦被抓,损失的将是平时在学习上花费的所有努力,显而易见,优等生比差生在平时更用功,也就越不太可能选择冒险。

再如,曾经毛主席提出过这样的作战理念:敌进我退,敌退我追,敌驻我扰,敌疲我打。通俗来讲就是,在敌人最强大的时候我躲避,降低自己的损失,在敌人占弱势或敌人休息时我进攻,增大自己的战绩,即磨灭对方精力,在武装力量不如对方时便死缠烂打,也正是这样优秀的作战策略让共军获得胜利。

不仅是在生活中,战争中,而且在社会上,官场中,博弈论也有具体的体现。比如曾经红极一时的话题——“高新能否养廉”的辩论。有支持者就从博弈论的角度阐述“高薪可以养廉”的观点,具体如下:

在其它社会条件都相同的条件下,给公务员提高薪水后是怎样起到减少腐败的作用呢?我们知道,官员为什么要贪污,是因为他想获得更多的利润,或者是他认为仅靠原有的薪水难以达到理想的生活标准。尽管制度和法律的众多约束,也难以阻止众多腐败现象的发生。而如果提高了他们的工资,同时也会大幅度提高他们的“贪污成本”。即提高薪水之后,公务员会对自己的工作有更多认同感,在社会上也更有“面子”,若贪污一旦被抓,失去的将是一个较为高薪的职业和很有荣誉感的社会地位。在这么大的后果下,一些公务员便会安于现有的已经有所提高的生活水平,从而约束自己的违法行为。

由此可见,确实是“生活”中处处充满博弈论。有人认为博弈论很“时髦”,很高深,所以不想去做更多的了解。其实并非如此,博弈论虽属于数学,但其中并非有很艰深的数学公式,而且我们只要了解了基本的博弈论,便能够更理性,更聪明的对待生活,和对待每个十字路口的选择,让自己成为生活中的赢家。

在这里,衷心感谢老师在课堂上精彩有趣的讲解。让我对博弈论更有兴趣,也受益匪浅。

参考资料:

1、剑桥大学网易公开课:博弈论之合作与结局

2、剑桥大学网易公开课:博弈论之声誉和决斗

3、《妙趣横生博弈论》(美),钟志强译本

第五篇:博弈论

博弈之囚徒困境论

打破囚徒僵局,走出囚徒困境 囚徒困境理论

在学习和生活中,我们会遇到诸多面临决策,进退两难的问题,那么如何决策呢?不同的策略带来不同的损益,有时当博弈双方都以自己的最大利益为策略博弈时,结果相反,时双方都陷入自己所要逃避的困境,这便是囚徒困境!囚徒困境经典案例①:

警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:

若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。

若二人都保持沉默(相关术语称互相“合作”),则二人同样判监1年。甲乙背板(指证乙犯罪)默认 背叛(指证甲犯罪)(-5,-5)(0,-10)默认(-10,0)(-1,-1)

数字代表双方在不同情况下服刑年限

若二人都互相检举(相关术语称互相“背叛”),则二人同样判监8年。嫌疑人甲、乙双方均不知对方的策略,且都是自私利己之人。

囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:

若对方沉默、背叛会让我获释,所以会选择背叛。

若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。

二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑5年。

(二)生活中的囚徒困境 博弈在现实生活中不出不在。博弈双方大到国际贸易国与国之间的竞争,小到个人与个人之间的经济交易;动物之间同样也存在博弈,甚至植物在阳关下吸收养分也存在博弈。有竞争就有博弈,有交易就有博弈,博弈渗透到生活中的每个角落。参与博弈的双方或多方如何采取策略,保障自己最大的利益和最小的损失;往往利益最大的也是风险最大的,一旦失败,损失也是最大的,如何决策,这便使得博弈人陷入“囚徒困境”。博弈的囚徒困境覆盖面极广,涉及军事决策,政治手段,企业经营,市场策略,生活理财等诸多方面。

企业在市场经营决策中,和竞争对手既是博弈的双方,也是囚徒双方,利益最大的选择是双方共有的,同时也是损失最大的,如何决策,使自己受益最大,合作求双赢,殊死博弈,两败俱伤,一场空。

在个体之间存在行为和利益相互制约的博弈结构中,以个体理性和个体选择为基础的分散决策方式,无法有效地协调各方面的利益,并实现整体、个体利益共同的最优。简单地说,“囚徒的困境”问题都是个体理性和集体理性的矛盾引起的;这便是囚徒困境的内在根源。

(三)囚徒困境现实意义及启示

“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。

“纳什均衡”对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。《国富论》中有这样一句名言:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益”。从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。因此,从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。但它必须符合以下黄金定律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。

但前提是人所不欲勿施于我。囚徒困境的现实意义就是个人理性导致集体非理性。在囚徒博弈的模型中,只存在一个纳什均衡,即:在参与者理性的情况下,坦白为最优策略。这同时导致了集体利益的最小化。事实上,在囚徒困境中的最佳策略取决于对方采用的策略,特别是取决于这个策略为双方合作留出多大的余地。而这个原则的基础是:以后对于现在的权重足够大,即:未来是重要的。如果未来是重要的,那么就要选择合作,而合作的策略取决于对方的策略。于是结论是:没有最优策略!那么,如何使得博弈双方走出“囚徒的困境”呢?

(四)打破囚徒僵局,走出囚徒困境②

要破解囚徒困境,就要跳出囚徒困境模型本身,打破囚徒困境博弈的死局,从更高的层面上给以制度性的约束,或让大家都明白合作的好处。如何走出囚徒困境? 1.报复与惩罚(株连制):假如每一个拒供的囚徒都可以在刑满释放后对供认的囚徒实施报复,那么每个囚徒就可能因担心未来的报复而在现实选择拒供,使得出现(默认,默认)的均衡结果。合作就自然达成了。现实中,的确有很多犯罪团伙的成员,被捕后拒不坦白,很大程度上与一个由第三方实施的惩罚机制有关。因为在犯罪团伙中,如果出卖“兄弟”,将永远无法在“江湖”立足,并且其家人也将受到黑社会的追杀。正是这样的第三方惩罚机制,使得报复和惩罚是可信的,从而促成了囚徒的合作。

2.“人质”方案:在囚徒困境中,两个囚徒当然也清楚自利行为的后果是集体失利,每个人的状况都将更糟糕。因此,如果每个人都相信对方不会招供,那么合作拒供的结果也将可以出现。也就是说,如果可以克服信任问题,那么合作达成也是可能的。顺理成章,促进信任的“人质”方案,常常也会促进合作,走出囚徒困境。

3.长期关系和重复博弈:建立长期关系,使得囚徒困境可以多次重复,如果这个“多次”足够长,那么人们就有可能为了长远的将来利益而牺牲眼前,合作也是可以达成的。

参考文献:①1950年,由就职于兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。②打破“囚徒格局”参考:郑也夫·《走出囚徒困境》·“寻找均衡”与“和平之门”。

博弈论
TOP