• 1.摘要
  • 2.基本信息
  • 3.基本内容

范例推理

范例推理CBR是由目标范例的提示而得到历史记忆中的源范例,并由源范例来指导目标范例求解的一种策略。它是一种重要的机器学习方法。它是指借用旧的事例或经验来解决问题、评价解决方案、解释异常情况或理解新情况。

基本信息

  • 中文名

    范例推理

  • 是由

    目标范例提示得到历史记忆中的源

  • 类型

    机器学习方法

  • CBR是区别于

    规则推理的一种推理和学习模式

基本内容

范例推理CBR是由目标范例的提示而得到历史记忆中的源范例,并由源范例来指导目标范例求解的一种策略。它是一种重要的机器学习方法。CBR是区别于基于规则推理的一种推理和学习模式,它是指借用旧的事例或经验来解决问题、评价解决方案、解释异常情况或理解新情况。

一、原理和特征?

类比是人们经常运用的解决问题的方法,有人甚至认为类比是人类问题解决过程中最主要的心理机制。人们在问题解决的过程中,常常依赖以前解决相似问题的经验,来得到新问题的解决办法。有时已有的问题解决方法可直接运用来获得新问题的解,但更多的情形是经验中并没有解决新问题的现成答案,而是需要根据问题的求解目标修改过去解决类似问题时曾用过的方法以适应目前问题的要求,或综合曾经成功运用过的多种方法来获取最终的解决方案。基于范例推理(Case Based Reasoning,CBR)正是以人类解决问题的这种实际心理历程为基础的一种人工智能范式。?

基于范例推理既是人类推理的一种重要形式,也是人工智能研究中的一种范式。它不同于通过链式推理产生问题结论的基于规则的推理,是一种基于过去实际经验或经历的推理。?

基于范例推理,其工作原理是从众多的已知范例中挑选出一个或多个和当前新问题最相似的范例,对它(们)的解决方案进行修改,从而得到新问题的解决方案。CBR系统的核心包括四个部分:(1)范例库(case base):存储先前的经验;(2)检索机(indexing mechanism):用一种有意义的方法排列范例;(3)匹配算法(matching algorithm):比较新范例与旧范例的相似度;(4)调整机制(adaptation or inference mechanism):推演得出最后的解法。?

CBR系统的运作过程可概括为“4Rs”,即(1)提取(Retrieve);(2)重用(Reuse);(3)修改(Revise)和(4)存储(Retain)。基于范例推理的步骤如下:(1)提出新问题作为目标范例,定义新问题的特征或属性;(2)检索范例库,根据问题的要求,在范例库中找出与目标范例最为相似的范例(源范例),其关键是找出对新问题的解决有最大潜在启发价值的旧范例;(3)根据修正规则来修改检索到的旧范例,为新范例进行计算求解,为成功解决问题提供参考;(4)将有利用价值的新范例存储到范例库中,并对CBR系统的作相应的调整,以完成CBR的学习功能。CBR既是模拟人类推理和思考过程的方法论,也是建造智能计算系统的人工智能技术。?

CBR系统是利用范例库中存储的先前解决类似问题的办法进行推理,范例库可以从某个知识丰富的数据库中抽取,也通过各种知识获取(knowledge acquisition)方法来得到。CBR系统从过去的经验出发进行推理,能够通过引用范例解释其推理,如果范例库中没有现成的精确的解法,CBR系统会作出调整给出一个近似的解法,系统用检索或匹配机制来判定范例间的相似性,几乎不需要抽取专家知识。因此,CBR具有符合人类解决问题的心理适宜性。?

CBR有两种基本类型:解释型CBR和问题求解型CBR。解释型CBR是应用旧范例构建一种分析和证明,以对新范例作出某种解释;问题求解型CBR则是通过调整旧范例的解答以满足新问题的要求。前者多应用于咨询系统中,后者在计划、设计工程中更为常用。?

基于范例推理和其它人工智能范式相比有许多优势。首先是获取知识相对容易。开发基于规则推理的系统时,需要领域专家和知识工程师密切合作获取规则或模型,而在许多复杂领域中,很难从对专家解决问题的的研究中获得能用语言符号明确表述的该知识领域中的规则和原理,导致知识获取的瓶颈问题。在CBR中,不需要对经验分解或抽象以形成规则,知识表征的单位是范例,而范例在许多领域容易收集,获取代价较低。其次是知识维护容易。随着系统的运行,知识系统常需要更新,在基于规则的推理系统中增加新规则可能会和原有的规则产生冲突,甚至导致非常大的系统变动;基于范例推理则不存在这样的问题,它可以不需要专家的干预而把缺少的范例添加到范例库中。三是解决问题范围的扩大。其它人工智能范式多为演绎推理模式,所有关于问题的答案都预先包含知识库中,不具有创新求解能力。CBR主要基于类比推理,通过适应性修改可以形成与旧范例的解决方案不同的创新解答。最后是用户接受度高。基于范例推理的根据是历史事实,事实胜于雄辩,因此对用户更有说服力。?

二、研究问题?1、范例库的建立?

范例库是CBR中的重要组成部分,它是CBR 中主要的知识库。范例库的大小及其组织结构直接影响CBR系统应用的效率和效果。如何表示范例,如何组织范例,如何建立范例库的索引,是建立范例库的主要问题。实际上,这是三个相互联系着的问题。?

(1)范例表示?

CBR系统所依赖的知识主要存储在范例中,范例的集合构成范例库。一个范例可以是一个病人的病历,也可以是一个菜谱、一个法律的范例,可以是一座简单房子的平面图,也可以是一座音乐厅的最详细的全部设计图。?

在CBR范例库的建造中,一个合理的、一致的范例表示方法是必不可少的。范例应该包含什么?一般认为,范例可以定义为能够导致特定结果的一组特征或属性的集合。从问题求解的角度来看,一个范例的内容主要由三部分组成:一是问题或情境描述(situation);二是解决方案描述(solution);三是结果描述(outcome),即可以表示为三元组:C=<问题或情境描述 解决方案描述="解决方案描述" 结果描述="结果描述">。怎样用一种合适的方式把范例的三个部分表示出来,是CBR系统首先要解决的问题。在CBR系统中没有通用的范例表示方法,往往需要在分析具体问题领域的基础上通过选择、综合或修改现有的各种知识表示方法来实现。最简单的方法是对范例进行属性抽取,然后对各个属性赋值。有人采用框架方法表示范例。?

另外,一个范例既可以作为整体来存储,也可以把范例分解为部分分别存储在不同的模块中单独使用。前者适合于结构性差的范例,存取简单但应用时不够灵活;后者适合于结构性强的范例,应用和维护时较灵活。 ?

(2)范例的组织与索引?

索引是通过以重要属性组合范例来对范例分类和存储,其目标是在对已有范例进行索引后,当给定一个新范例时,如果范例库中有与该范例相关的范例,则可根据索引快速找到那些符合需要的相关范例。一个范例的索引就是这个范例的重要属性的集合,这些属性可以将这个范例同其他范例区分开来。索引问题的主要任务包括:选择什么类型的索引,如何定义索引词汇表,如何构建索引的搜索空间等。?

良好的范例索引能使范例提取快速而准确。良好范例索引的建立是建立在对问题领域和问题目标充分理解的基础之上的。Kolodner认为,索引问题就是在适宜的时候提取可应用范例的问题,也就是给每个范例贴标签以表明在什么条件下该范例能用来作出有用的推理。他曾给出良好索引的四个品质:一是预测性,能够明确范例的问题解决目标;二是抽象性,具有一定的抽象度,以便能够适应问题情境的变化;三是具体性,索引应是无需作进一步解释就可在将来问题情境中加以再认;四是有用性,索引应能以一种有用的方式把范例区分开来,能够对面临的决策提供指导。?