首页 > 编程知识 正文

matlab知识点归纳整理,matlab逆向云发生器

时间:2023-05-05 21:54:44 阅读:278838 作者:2592

第6讲 完全信息动态博弈 ——逆向归纳法和子博弈完美均衡 完全且完美信息动态博弈 完全且完美信息动态博弈 参与人1从行动集A1选择行动a1 参与人2观察到a1,之后从行动集A2选择行动a2 两个人的收益分别为u1(a1,a2)和u2(a1,a2) 完全且完美信息动态博弈 均衡 策略 结果 E1 {大,(L/L,L/S)} 都选择大 E2 {大,(L/L,S/S)} 都选择大 E3 {小,(S/L,S/S)} 都选择小 完全且完美信息动态博弈 逆向归纳法 背后假设:参与人在每个节点都是理性的 当参与人2行动的时候,他已经看到了参与人1的行动,那么他的问题是: 如果隐函数定理成立,那么解为R2(a1) 完全且完美信息动态博弈 逆向归纳法 参与人1可以预测到参与人2对于其行动的反应,那么参与人1的问题是: 完全且完美信息动态博弈 逆向归纳法 我们称 (a*1,R(a*1))为逆向归纳均衡策略 逆向归纳解不包含不可置信的威胁:参与人1预测参与人2的最优反应,这一预测排除了参与人2不可置信的威胁,即参与人2在第二阶段到来时做出不符合自身利益的反应。 E2 {大,(L/L,S/S)} 完全且完美信息动态博弈 考虑如下博弈 完全且完美信息动态博弈 逆向归纳法的理性假定: 逆向归纳重点关注了偏离均衡会怎么样。不过只有偏离均衡才能有2选择的机会,而这时假设1是理性的就与1选择R矛盾了。此时似乎应该假设1非理性。 我们不需要这么理解,1选择R可能是理性不是共同知识。 逆向归纳法的理性假定: 一种可能是“参与人1是理性的”为共同知识,但是“参与人2是理性的”不是共同知识,参与人1希望参与人2非理性。 另一种可能是“参与人2是理性的”为共同知识,但是“参与人1是理性的”不是共同知识,参与人1希望参与人2认为他非理性。 这两个解释说明了逆向归纳法为什么可以假设1会在第一阶段选择R。 “颤抖的手”均衡 完全非完美信息动态博弈 逆向归纳法的主要特征是,当我们考虑博弈的子博弈,利用逆向归纳法计算的均衡仍然是子博弈的均衡。 子博弈完美将这个概念推广到一般的完全信息动态博弈 完全非完美信息动态博弈 纳什均衡是子博弈完美均衡,当且仅当它是这个博弈每个子博弈的纳什均衡。 那么什么是子博弈? 完全非完美信息动态博弈 扩展型博弈的子博弈: 始于单点信息集n 包含博弈树中n之下所有的决策结和终点结(不在n以下的除外) 没有对任何信息集形成分割。 例子 子博弈的均衡 给定这个结果 另一个纳什均衡 另一个例子 任何纳什均衡都是子博弈完美的 子博弈完美均衡的背后: 序贯理性:参与人需要在博弈的每一点最大化自己的支付,在每一点重新优化其决策,并考虑到自己在未来会重新进行优化。这就是忽略沉淀成本和理性预期 弱纳什均衡对于博弈微小变化不稳健。犯错误的概率称为“颤抖”。 这两个思路并不相同。考虑下面的例子: 三个纳什均衡: (in up) (out up) (out down) 这三个都是弱纳什均衡。 (in up) (out up)是子博弈完美均衡。 但是(in up)不是颤抖的手均衡。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。