matlab知识点归纳整理,matlab逆向云发生器

第6讲完全信息动态博弈 ——逆向归纳法和子博弈完美均衡完全且完美信息动态博弈完全且完美信息动态博弈参与人1从行动集A1选择行动a1 参与人2观察到a1，之后从行动集A2选择行动a2 两个人的收益分别为u1(a1,a2)和u2(a1,a2) 完全且完美信息动态博弈均衡策略结果 E1 {大，(L/L,L/S)} 都选择大 E2 {大，(L/L,S/S)} 都选择大 E3 {小，(S/L,S/S)} 都选择小完全且完美信息动态博弈逆向归纳法背后假设：参与人在每个节点都是理性的当参与人2行动的时候，他已经看到了参与人1的行动，那么他的问题是：如果隐函数定理成立，那么解为R2(a1) 完全且完美信息动态博弈逆向归纳法参与人1可以预测到参与人2对于其行动的反应，那么参与人1的问题是：完全且完美信息动态博弈逆向归纳法我们称 (a*1,R(a*1))为逆向归纳均衡策略逆向归纳解不包含不可置信的威胁：参与人1预测参与人2的最优反应，这一预测排除了参与人2不可置信的威胁，即参与人2在第二阶段到来时做出不符合自身利益的反应。 E2 {大，(L/L,S/S)} 完全且完美信息动态博弈考虑如下博弈完全且完美信息动态博弈逆向归纳法的理性假定：逆向归纳重点关注了偏离均衡会怎么样。不过只有偏离均衡才能有2选择的机会，而这时假设1是理性的就与1选择R矛盾了。此时似乎应该假设1非理性。我们不需要这么理解，1选择R可能是理性不是共同知识。逆向归纳法的理性假定：一种可能是“参与人1是理性的”为共同知识，但是“参与人2是理性的”不是共同知识，参与人1希望参与人2非理性。另一种可能是“参与人2是理性的”为共同知识，但是“参与人1是理性的”不是共同知识，参与人1希望参与人2认为他非理性。这两个解释说明了逆向归纳法为什么可以假设1会在第一阶段选择R。 “颤抖的手”均衡完全非完美信息动态博弈逆向归纳法的主要特征是，当我们考虑博弈的子博弈，利用逆向归纳法计算的均衡仍然是子博弈的均衡。子博弈完美将这个概念推广到一般的完全信息动态博弈完全非完美信息动态博弈纳什均衡是子博弈完美均衡，当且仅当它是这个博弈每个子博弈的纳什均衡。那么什么是子博弈？完全非完美信息动态博弈扩展型博弈的子博弈：始于单点信息集n 包含博弈树中n之下所有的决策结和终点结(不在n以下的除外) 没有对任何信息集形成分割。例子子博弈的均衡给定这个结果另一个纳什均衡另一个例子任何纳什均衡都是子博弈完美的子博弈完美均衡的背后：序贯理性：参与人需要在博弈的每一点最大化自己的支付，在每一点重新优化其决策，并考虑到自己在未来会重新进行优化。这就是忽略沉淀成本和理性预期弱纳什均衡对于博弈微小变化不稳健。犯错误的概率称为“颤抖”。这两个思路并不相同。考虑下面的例子：三个纳什均衡: (in up) (out up) (out down) 这三个都是弱纳什均衡。 (in up) (out up)是子博弈完美均衡。但是(in up)不是颤抖的手均衡。