• 1.摘要
  • 2.基本信息
  • 3.基本内容
  • 4.比较
  • 5.动态认知

后向归纳法

后向归纳法是求解动态博弈的经典算法 ,是一种逆推的动态规划方法,即从最后一项逐次往前推导,其认知机制的探讨多是基于静态的认知模型展开的。

基本信息

  • 中文名

    后向归纳法

  • 外文名

    Backward induction

  • 拼音

    Hòu xiàng guī nà fǎ

  • 隶属

    数理科学

  • 学科

    运筹学

  • 简称

    BI

基本内容

后向归纳法是一种逆推的动态规划方法, 即从最后一项逐次往前推导,适合于结果比较明确,而想预知开始的一类问题。瞬时不确定性决策即具有这一特点。这类问题要想有一个比较好的结果,即结果是比较明确的, 但是由于每一步都涉及到决策,由于不同的博弈会带来不同的结果,可以引入概率( 概率可以用别的数学方法求出,或者凭经验给出。也可以从后往前推,应用后向归纳法进行求解。

比较

前向归纳法正好与后向归纳法相反,前向归纳法是指参与人通过其他参与人早期的、过去的决策推断出一些信息,以帮助求解动态博弈。它是从一个初始或者说从现在水平出发,去推导后一时期。后向归纳法是求解动态博弈的经典算法 ,是一种逆推的动态规划方法,即从最后一项逐次往前推导。

后向归纳法虽然比较实用,但是由于要一个时期、一个时期地重复依次计算,所以需耗费大量时间。而前向归纳法可以避免这种重复过程。

动态认知

在动态博弈中, 关于选手理性选择的刻画往往是基于一类静态的认知模型而展开进行的。在这类认知模型中,不仅需要描述出理性决策路径上选手们的知识(或信念),而且还需要说明当一个不是理性决策路径上的行动如果被对手选择到时,每个选手原有的初始知识(或信念)、在此情形下选手对于原有知识(或信念)所进行的修正以及其对手关于该选手修正后的知识 (或信念)等。例如, 在一个动态博弈中,选手 2 初始时知道(或相信)理性选手1应该选择马上结束博弈的行动,然而,他还需要知道(或相信),如果选手 1 让博弈继续进行, 给出机会让他进行选择时, 选手1所基于的知识(或信念)是什么,以引导选手2,在此情形下做出理性选择。 因此, 这类模型必然会涉及复杂的条件知识(或信念 )系统或层级式系统和信念修正的问题。同时, 基于此类模型,选手初始时理性的公共知识是不能蕴涵后向归纳法的结果。