欢迎光临
我们一直在努力

南开19秋《初级博弈论》课程期末复习资料

可做奥鹏全部院校作业论文!答案请添加qq:599792888 或 微信:1095258436

《初级博弈论》课程期末复习资料

 

一、客观部分:(单项选择、多项选择、不定项选择、判断)

(一)、判断题

★考核知识点:博弈方的策略和得益,

★考核知识点: 两人博弈

★考核知识点:静态博弈与动态博弈概念

★考核知识点: 完全信息博弈的概念

★考核知识点: 上策均衡

★考核知识点: 严格下策反复消去法

★考核知识点: 纳什均衡的一致预测性质

★考核知识点: 混合策略和严格下策反复消去法

★考核知识点: 动态博弈的非对称性

★考核知识点: 纳什均衡的问题

★考核知识点:子博弈的概念

★考核知识点: 重复博弈的策略、子博弈和均衡路径

★考核知识点: 唯一纯策略纳什均衡博弈的有限次重复博弈

★考核知识点: 两人零和博弈的无限次重复博弈

★考核知识点:子女对父母的赡养义务

★考核知识点:ESS的概念

★考核知识点: 囚徒的困境

★考核知识点: 两人博弈

★考核知识点: 单人博弈

★考核知识点:博弈方的能力和理性

★考核知识点: 上策均衡的概念

★考核知识点: 严格下策的概念

★考核知识点: 一致预测的概念

★考核知识点: 混合策略和严格下策反复消去法

★考核知识点: 动态博弈的策略和结果

★考核知识点: 子博弈的概念

★考核知识点: 子博弈完美纳什均衡的概念

★考核知识点: 重复博弈的概念

★考核知识点: 两人零和博弈的有限次重复博弈

★考核知识点: 无限次重复博弈

★考核知识点: 有限理性博弈分析框架

★考核知识点: ESS的概念

★考核知识点: 囚徒的困境

★考核知识点: 赌胜博弈

★考核知识点: 博弈过程

★考核知识点: 非合作博弈的概念

★考核知识点: 严格下策的概念

★考核知识点: 纳什均衡的一致预测性质

★考核知识点: 上策均衡和纳什均衡的关系

★考核知识点: 上策均衡和帕累托最优的均衡,

★考核知识点: 相机选择和策略中的可信性问题,

★考核知识点: 逆推归纳法

★考核知识点: 子博弈的概念

★考核知识点: 重复博弈的得益

★考核知识点: 有限次重复博弈

★考核知识点: 触发策略

★考核知识点: 有限理性博弈分析框架

★考核知识点: ESS的概念,

二、主观部分:

(一)、简答

★考核知识点:游戏与博弈

附2.1.1(考核知识点解释)

游戏和博弈的共同特征:

①都有一定的规则,规定游戏的参加者可以做什么,不可以做什么,应当按怎样的顺序做,什么时候游戏结束或一旦参加者犯规怎样处罚。

②都有一个结果,如一方赢一方输,平局或参加者各有所得等。

③策略至关重要,游戏者不同的策略选择常会带来不同的游戏结果。

④策略与利益具有相互依存性,即每一个游戏者所得结果的好坏,不仅取决于自己的策略选择,也取决于其他参加者的策略选择。

 

★考核知识点:有限次重复博弈的民间定理

附2.1.2:(考核知识点解释)

用wi,记博弈方i在一次性博弈中最差的均衡得益,用w记各博弈方的wi构成的得益数组。

不管其他博弈方的行为如何,一博弈方在某个博弈中只要自己采取某种特定的策略,最低限度保证能获得的得益称为“个体理性得益” 或“保留得益”。

博弈中所有纯策略组合得益的加权平均(权数非负且总和为1)数组称为“可实现得益”。

定理:设原博弈的一次性博弈有均衡得益数组优于w,那么在该博弈的多次重复中所有不小于个体理性得益的可实现得益,都至少有一个子博弈完美纳什均衡的极限的平均得益来实现它们。

 

★考核知识点:纳什均衡与严格下策消去法

附2.1.3:(考核知识点解释)

命题2.1:在n个博弈方的博弈                   中,如果严格下策反复消去法排除了除          之外的所有策略组合,那么          一定是该博弈的唯一的纳什均衡

命题2.2:在n个博弈方的博弈中                  中,如果

是G的一个纳什均衡,那么严格下策反复消去法一定不会将它消去

上述两个命题保证在进行纳什均衡分析之前先通过严格下策反复消去法简化博弈是可行的

 

★考核知识点:唯一纯策略纳什均衡博弈的有限次重复博弈

附2.1.4:(考核知识点解释)

设原博弈G有唯一的纯策略纳什均衡,则对任意整数T,重复博弈 G(T)有唯一的子博弈完美纳什均衡,即各博弈方每个阶段都采用G的纳什均衡策略。各博弈方在G(T)中的总得益为在G中得益的T倍,平均得益等于原博弈G中的得益。

 

 

★考核知识点:防共谋均衡

附2.1.5:(考核知识点解释)

如果一个博弈的某个策略组合满足下列要求:

(1)没有任何单个博弈方的“串通”会改变博弈的结果,即单独改变策略无利可图;

(2)给定选择偏离的博弈方有再次偏离的自由时,没有任何两个博弈方的串通会改变博弈的结果;

(3)依此类推,直到所有博弈方都参加的串通也不会改变博弈的结果。

满足上述要求的均衡策略组合称为 “防共谋均衡”。

 

★考核知识点:均衡的类型

附2.1.6:(考核知识点解释)

根据效率差异将市场均衡可分以下四种不同的类型

①市场完全失败。如果市场上所有的卖方,甚至质量“好”的商品的卖方,都因为担心卖不出去而不敢将商品投放市场,当然市场就完全不能运作,如果此时潜在的贸易利益确实是存在的,则我们称这种情形为“市场完全失败”。

②市场完全成功。如果只有质量好的商品的卖方将商品投放市场,而质量差的商品的卖方不敢将商品投放市场。此时因为市场上的商品都是好的,因此买方会买下市场上的所有商品,实现最大的贸易利益,我们称这种情况为“市场完全成功”。

③市场部分成功。如果所有卖方,包括有好商品的和有差商品的,都将商品投放市场,而买方也不管好坏商品都买进。这样的情况称为“市场部分成功”。因为这种情况下能够进行交易,潜在的贸易利益能够实现,但同时也会存在部分“不良交易”,即买方买进差商品时蒙受的损失。

④市场接近失败。如果所有好商品的卖方都将商品投放市场,而只有部分“差”商品的卖方将商品投放市场,同时买方不是买下市场上的全部商品,而是以一定的概率随机决定是否买进,即双方都采用混合策略。这样的市场称为“市场接近失败”。这种市场的总体效率低于市场完全成功和市场部分成功,但比市场完全失败要强

 

★考核知识点:博弈的定义

附2.1.7:(考核知识点解释)

规定或定义一个博弈需要设定下列四个方面:

①博弈的参加者(Player)——博弈方

②各博弈方的策略(Strategies)或行为(Actions)

③博弈的次序(Order)

④博弈方的得益(Payoffs)

 

★考核知识点:有限次重复博弈与无限次重复博弈的差异

附2.1.8:(考核知识点解释)

虽然无限次重复博弈与有限次重复博弈一样,也是基本博弈的重复进行,但两者还是有重要区别的:

①无限次重复博弈没有结束重复的确定时间,也就是最后一次重复。

②无限次重复博弈不能忽视不同时间得益的价值差异和贴现问题,必须考虑后一期得益折算成前一期得益的贴现系数,对博弈方选择和博弈均衡的分析必须以平均得益或总得益的现在值为根据。

 

★考核知识点:混合策略和严格下策反复消去法的关系

附2.1.9:(考核知识点解释)

在包括混合策略的情况下,关于严格下策反复消去法的结论仍然是成立的。即①任何博弈方都不会采用任何严格下策,不管它们是纯策略还是混合策略;②严格下策反复消去法不会消去任何纳什均衡,包括纯策略纳什均衡和混合策略纳什均衡;③如果经过反复消去后留下的策略组合是惟一的,那么一定是纳什均衡。因此,在考虑混合策略的情况下,我们仍然可利用严格下策反复消去法进行分析,而且实际上引进混合策略只有使严格下策反复消去法的用处更大。

 

★考核知识点:子博弈的含义

附2.1.10:(考核知识点解释)

子博弈:“由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分”。这个定义实际上隐含了几个方面的含义:

a.因为原博弈本身不会成为原博弈的后续阶段,因此子博弈不能从原博弈的第一个节点开始,即原博弈不是自己的一个子博弈。

b.包含所有在初始节点之后的选择节点和终点,但不包含不跟在此初始节点之后的节点。

C.不分割任何的信息集。即如果一选择节点包含在一子博弈中,则包含该节点的信息集中的所有节点都必须包含在该子博弈中。这一条可以说是专对有多节点信息集的不完美信息动态博弈而言的。

 

★考核知识点:动态博弈的基本特点

附2.1.11:(考核知识点解释)

动态博弈的基本特点:

(1)动态博弈的策略和结果

①策略是在整个博弈中所有选择、行为的计划

②结果是上述“计划型”策略的策略组合,构成一条路径

③得益对应每条路径,而不是对应每步选择、行为

(2)动态博弈的非对称性

动态博弈的非对称性——先后次序决定动态博弈必然是非对称的。

 

★考核知识点:暗标拍卖的基本特征

附2.1.12:(考核知识点解释)

暗标拍卖的基本特征:

⑴密封递交标书;

⑵统一时间公证开标;

⑶标价最高者以所报标价中标。

 

★考核知识点:纳什均衡的一致预测性

附2.1.13:(考核知识点解释)

如果所有博弈方都预测一个特定的博弈结果会出现,那么所有的博弈方都不会利用该预测或者这种预测能力,选择与预测结果不一致的策略,即没有哪个博弈方有偏离这个预测结果的愿望,因此这个预测结果最终真会成为博弈的结果。

 

★考核知识点:无限次重复博弈的民间定理

附2.1.14:(考核知识点解释)

 

 

 

 

★考核知识点:纳什定理

附2.1.15:(考核知识点解释)

在一个由n个博弈方的博弈                   中,如果n是有限的,且    都是有限集(对         ),则该博弈至少存在一个纳什均衡,但可能包含混合策略。

 

★考核知识点:完美贝叶斯均衡的概念

附2.1.16:(考核知识点解释)

一个策略组合和相应的判断满足下列4个要求,称为一个“完美贝叶斯均衡”:

要求1:在各个信息集,轮到选择的博弈方必须具有一个关于博弈达到该信息集中每个节点可能性的“判断”。对非单节点信息集,一个“判断”就是博弈达到该信息集中各个节点可能性的概率分布,对单节点信息集,则可理解为“判断达到该节点的概率为1”

要求2:给定各博弈方的“判断”, 他们的策略必须是“序列理性”的。即在各个信息集,给定轮到选择博弈方的判断和其他博弈方的“后续策略”,该博弈方的行为及以后阶段的“后续策略”,必须使自己的得益或期望得益最大。此处所谓“后续策略”即相应的博弈方在所讨论信息集以后的阶段中,针对所有可能情况如何行为的完整计划

要求3:在均衡路径上的信息集处,“判断”由贝叶斯法则和各博弈方的均衡策略决定

要求4:在不处于均衡路径上的信息集处,“判断”由贝叶斯法则和各博弈方在此处可能有的均衡策略决定

当一个策略组合及相应的判断满足这样四个要求时,称为一个“完美贝叶斯均衡”。这是完美贝叶斯均衡的比较完全的定义方法。

 

★考核知识点:逆推归纳法的问题

附2.1.17:(考核知识点解释)

①逆推归纳法只能分析明确设定的博弈问题,要求博弈的结构,包括次序、规则和得益情况等都非常清楚,并且各个博弈方了解博弈结构,相互知道对方了解博弈结构。这些可能有脱脱离离实际的可能

②逆推归纳法也不能分析比较复杂的动态博弈

③在遇到两条路径利益相同的情况时逆推归纳法也会发生选择困难

④对博弈方的理性要求太高,不仅要求所有博弈方都有高度的理性,不允许犯任何错误,而且要求所有博弈方相互了解和信任对方的理性,对理性有相同的理解,或进一步有“理性的共同知识”

 

★考核知识点:海萨尼转换

附2.1.18:(考核知识点解释)

 

 

 

 

 

 

 

★考核知识点:子博弈和子博弈完美纳什均衡;逆推归纳法

附2.2.1:(考核知识点解释)

定义:从动态博弈的最后一个阶段博弈方的行为开始分析,逐步倒推回前一个阶段相应博弈方的行为选择,一直到第一个阶段的分析方法,称为“逆推归纳法”。逆推归纳法是动态博弈分析最重要、基本的方法。

逆推归纳法的逻辑基础:动态博弈中先行为的理性的博弈方,在前面阶段选择行为时必然会先考虑后行为博弈方在后面阶段中将会怎样选择行为,只有在博弈的最后一个阶段选择的,不再有后续阶段牵制的博弈方,才能直接作出明确选择。而当后面阶段博弈方的选择确定以后,前一阶段博弈方的行为也就容易确定了。

逆推归纳法的一般方法:从动态博弈的最后一个阶段开始分析,每一次确定出所分析阶段博弈方的选择和路径,然后再确定前一个阶段的博弈方选择和路径。逆推归纳到某个阶段,那么这个阶段及以后的博弈结果就可以肯定下来,该阶段的选择节点等于一个结束终端。我们甚至可以用不包括该阶段与其后所有阶段博弈的等价博弈来代替原来的博弈。

定义:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分,称为原动态博弈的一个“子博弈”。

并不是动态博弈的任何部分都能构成子博弈,也不是所有多阶段动态博弈都有子博弈。

首先子博弈不能包括原博弈的第一个阶段,这也意味着动态博弈本身不会是它自己的子博弈。

其次子博弈必须有一个明确的初始信息集,以及必须包含初始阶段之后的所有博弈阶段,这意味着子博弈不能分割任何信息集,也意味着在有多节点信息集的不完美信息博弈中可能不存在子博弈等。

定义:如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。

子博弈完美纳什均衡能够排除均衡策略中不可信的威胁和承诺,因此是真正稳定的。

逆推归纳法是求完美信息动态博弈子博弈完美纳什均衡的基本方法。

子博弈完美纳什均衡能够排除策略组合中不可信行为选择的原因,是虽然包含不可信行为选择的策略组合可以构成整个博弈的纳什均衡,但其中的不可信行为选择,至少在博弈的某些子博弈中不符合博弈方的自身利益,因而不构成纳什均衡,因此要求在所有子博弈中都是纳什均衡的子博弈完美纳什均衡,就排除了其中存在不可信行为选择的可能性,从而在动态博弈分析中具有真正的稳定性。

 

★考核知识点:纳什均衡;无限策略博弈分析和反应函数;

附2.2.2:(考核知识点解释)

 

纳什均衡:在博弈                   中,如果由各个博弈方的各一个策略组成的某个策略组合        中,任一博弈方的策略  ,都是对其余博弈方策略的组合                的最佳对策,也即

对任意       都成立,则称         为G的一个纳什均衡

古诺模型的纳什均衡也可以通过对划线法思路的推广来求。划线法的思路是先找出每个博弈方针对其他博弈方所有策略(或策略组合)的最佳对策,然后再找出相互构成最佳对策的各博弈方策略组成的策略组合,也就是博弈的纳什均衡。在无限策略的古诺博弈模型中这样的思路实际上也是可行的,只是其他博弈方的策略现在有无限多种,因此各个博弈方的最佳对策也有无限种,它们之间往往构成一种连续函数关系。

其实对一个一般的博弈,只要得益是策略的多元连续函数,我们都可以求每个博弈方针对其他博弈方策略的最佳反应构成的函数,也就是反应函数,而解出的各个博弈方反应函数的交点就是纳什均衡。这种利用反应函数求博弈的纳什均衡的方法称为“反应函数法”。

 

★考核知识点:混合策略和混合策略纳什均衡

附2.2.3:(考核知识点解释)

混合策略:在博弈                   中,博弈方  的策略空间为

,则博弈方  以概率分布              随机在其  个可选策略

中选择的“策略”,称为一个“混合策略”,其中         对        都成立,

把策略扩展到包括混合策略时,纳什均衡概念仍然成立,其本质规定性也仍然相同,即如果一个策略组合满足各博弈方的策略相互是对其他博弈方策略的最佳对策时,就是一个纳什均衡。不过现在其中的策略既可能是纯策略,也可能是混合策略。这时候纳什均衡意味着任何博弈方单独改变自己的策略,或者随机选择各个纯策略的概率分布,都不能给自己增加任何利益。如果确实是一个严格意义上的混合策略组合(即未退化为纯策略组合的)构成一个纳什均衡,称则为一个“混合策略纳什均衡”。

猜硬币博弈中找混合策略纳什均衡概率分布的思路,即令各个博弈方随机选择纯策略的概率分布,满足使对方或其他博弈方采用不同策略的期望得益相同,从而计算出各个博弈方随机选择各纯策略概率的方法,在求其他严格竞争博弈的混合策略纳什均衡时也适用。当然,在博弈方人数较多,各个博弈方的纯策略数量较多,而且也不那么对称的博弈中,寻找混合策略纳什均衡要困难一些。

第一个原则,不能让对方知道或猜到自己的选择,因而必须在决策时利用随机性。第二个原则是他们选择每种策略的概率一定要恰好使对方无机可乘,即让对方无法通过针对性地倾向某一策略而在博弈中占上风。

 

★考核知识点:动态博弈的扩展性表示;子博弈完美纳什均衡

附2.2.4:(考核知识点解释)

动态博弈各个博弈方的选择行为有先后次序,每个博弈方的选择行为会形成依次相连的时间阶段,因此动态博弈中一个博弈方的一次选择行为常称为一个“阶段” 。动态博弈中也可能存在几个博弈方同时选择的情况,这时这些博弈方的同时选择构成一个阶段。一个动态博弈至少有两个阶段,因此动态博弈有时也称为“多阶段博弈”,也有称动态博弈为“序列博弈”

采用一种通过选择节点、从选择节点出发的表示博弈方各种可能选择的线段,以及博弈终端处的得益数组表示动态博弈的方法。这种表示法称为“扩展形”,也有称其为“博弈树”的。由于扩展形可以反映动态博弈中博弈方的选择次序和博弈的阶段,因此是表示动态博弈的最佳方法。正因为动态博弈常用扩展形表示,因此有时也被称为“扩展形博弈”。

定义:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分,称为原动态博弈的一个“子博弈”。

定义:如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。

子博弈完美纳什均衡能够排除均衡策略中不可信的威胁和承诺,因此是真正稳定的。

逆推归纳法是求完美信息动态博弈子博弈完美纳什均衡的基本方法。

 

 

★考核知识点:逆推归纳法;子博弈完美纳什均衡

附2.2.5:(考核知识点解释)

定义:从动态博弈的最后一个阶段博弈方的行为开始分析,逐步倒推回前一个阶段相应博弈方的行为选择,一直到第一个阶段的分析方法,称为“逆推归纳法”。逆推归纳法是动态博弈分析最重要、基本的方法。

逆推归纳法的逻辑基础:动态博弈中先行为的理性的博弈方,在前面阶段选择行为时必然会先考虑后行为博弈方在后面阶段中将会怎样选择行为,只有在博弈的最后一个阶段选择的,不再有后续阶段牵制的博弈方,才能直接作出明确选择。而当后面阶段博弈方的选择确定以后,前一阶段博弈方的行为也就容易确定了。

逆推归纳法的一般方法:从动态博弈的最后一个阶段开始分析,每一次确定出所分析阶段博弈方的选择和路径,然后再确定前一个阶段的博弈方选择和路径。逆推归纳到某个阶段,那么这个阶段及以后的博弈结果就可以肯定下来,该阶段的选择节点等于一个结束终端。我们甚至可以用不包括该阶段与其后所有阶段博弈的等价博弈来代替原来的博弈。

由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分,称为原动态博弈的一个“子博弈”。

定义:如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。

子博弈完美纳什均衡能够排除均衡策略中不可信的威胁和承诺,因此是真正稳定的。

逆推归纳法是求完美信息动态博弈子博弈完美纳什均衡的基本方法。

子博弈完美纳什均衡能够排除策略组合中不可信行为选择的原因,是虽然包含不可信行为选择的策略组合可以构成整个博弈的纳什均衡,但其中的不可信行为选择,至少在博弈的某些子博弈中不符合博弈方的自身利益,因而不构成纳什均衡,因此要求在所有子博弈中都是纳什均衡的子博弈完美纳什均衡,就排除了其中存在不可信行为选择的可能性,从而在动态博弈分析中具有真正的稳定性。

 

★考核知识点:划线法;箭头法; 纳什均衡;一致预测性

附2.2.6:(考核知识点解释)

博弈方的最终目标都是实现自身的最大得益。在具有策略和利益相互依存性的博弈问题中,各个博弈方的得益既取决于自己选择的策略,还与其他博弈方选择的策略有关,因此博弈方在决策时必须考虑其他博弈方的存在和策略选择。根据这种思想,科学的决策思路应该是:先找出自己针对其他博弈方每种策略或策略组合(对多人博弈)的最佳对策,即自己的可选策略中与其他博弈方的策略或策略组合配合,给自己带来最大得益的策略(这种相对最佳对策总是存在的,不过不一定惟一),然后在此基础上,通过对其他博弈方策略选择的判断,包括对其他博弈方对自己策略判断的判断等,预测博弈的可能结果和确定自己的最优策略。

划线法是一种非常简便的博弈分析方法,由于它以策略之间的相对优劣关系为基础,因此在分析用得益矩阵表示的博弈问题时具有普遍适用性。

箭头法的基本思路是对博弈中的每个策略组合进行分析,考察在每个策略组合处各个博弈方能否通过单独改变自己的策略而增加得益。如能,则从所分析的策略组合对应的得益数组引一箭头,到改变策略后策略组合对应的得益数组。最后综合对每个策略组合的分析情况,形成对博弈结果的判断。

纳什均衡:在博弈                   中,如果由各个博弈方的各一个策略组成的某个策略组合        中,任一博弈方的策略  ,都是对其余博弈方策略的组合                的最佳对策,也即

对任意       都成立,则称         为G的一个纳什均衡

“一致预测性”:如果所有博弈方都预测一个特定的博弈结果会出现,那么所有的博弈方都不会利用该预测或者这种预测能力,选择与预测结果不一致的策略,即没有哪个博弈方有偏离这个预测结果的愿望,因此这个预测结果最终真会成为博弈的结果。也就是说,这里“一致预测”中“一致”的意义是,各博弈方的实际行为选择与他们的预测一致,而不是不同博弈方的预测相同、无差异。

纳什均衡具有一致预测的性质,而且只有纳什均衡才有这种性质,任何非纳什均衡的预测都不是一致预测,因此一致预测正是纳什均衡的本质属性。

赞(0)
未经允许不得转载:奥鹏作业网 » 南开19秋《初级博弈论》课程期末复习资料

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址