古老的知识表示研究:
时间:
1960-1970s:语义网络(Semantic Net)
1970s-1980:产生式规则(Production Rule)
1980s-1990s:框架系统(Frame Systems)&KL-ONE
1990s-2000s:一阶谓词逻辑(Description Logic)/DAML+OIL
2000s-2010s:The semantic web(RDF&OWL)
分类:
一阶谓词逻辑(Horn Logic、Description Logic)
语义网络(Semantic Net)
产生式规则(Production Rule)
框架系统(Frame Systems)
描述逻辑(Description Logic)
描述逻辑(Description Logic):
描述逻辑是跟知识图谱最接近的表示方法,描述逻辑是一阶谓词逻辑的可判定子集,主要用于描述本体概念和属性,对于本体知识库的构建提供了便捷的表达形式。
核心表达要素:
概念Concepts-解释为一个领域的子集:学生,已婚者
关系Relations-解释为指该领域上的二元关系:朋友,爱人
个体Individuals-一个领域内的实例:小明,小红
描述逻辑的知识库O,O:=<T,A>, T为Tbox、A为Abox
TBox包含内涵知识,描述概念的一般性质
定义:引入概念以及关系的名称:Mother、Person
包含:声明包含关系的公理
Abox包含外延知识(又称断言知识),描述论域中的特定个体
概念断言-表示一个对象是否属于某个概念,例如Mother(Helen),
关系断言-表示两个对象是否满足一定的关系,例如has_child(Helen,Jack)
一阶谓词逻辑中的Horn Logic:
Horn Logic是一阶谓词逻辑的子集,主要特点是表达形式简单,复杂度低。Prolog语言就是基于Horn Logic逻辑设计实现的。
核心表达要素:
原子Atoms:P(t1,t2...tn),P是谓词,ti是项(变量或者常量),例如has_child(X,Y)
规则Rules:由原子构成:H:-B1,B2,...Bm.
H成为Head;B1,B2,...Bm称为Body,例如:has_child(X,Y):-has_son(X,Y)
事实Facts:没有体部且没有变量的规则,例如:has_son(Helen, Jack):-
优缺点:
优点:接近自然语言,容易被接受,且易于表示精确知识;有严格的形式定义和推理规则,易于精确实现。
缺点:无法表示不确定性知识,难以表示启发性知识及元知识;组合爆炸;以人逻辑为主导,并不适用机器。
产生式系统(Production Systems):
产生式系统是一种更广泛意义的规则系统,专家系统多数是基于产生式系统:
Feigenbaum研制的化学分子结构专家系统DENDRAL
Shortliffe研制的诊断感染性疾病的专家系统MYCIN
产生式系统的核心表达形式:
IF P
THEN Q CF=[0,1]
其中P是产生式的前提,Q是一组结论或操作。CF是确定性因子,也称置信度。
框架系统(Frame System):
框架理论的基本思想:认为人们对现实世界中事物的认识都是以一种类似于框架的机构存储在记忆中,当面临一个新事物,就从记忆中找出一个合适的框架,并根据实际情况对其细节加以修改、补充,从而形成对当前事物的认识。框架系统在很多NLP任务如Dialogue系统中都有广泛的应用。
基本表达要素:
框架:一种描述对象(事物、事件或概念等)属性的数据结构。
一个框架由若干个“槽”(slot)结构组成,每个槽又分为若干个“侧面”。
一个槽:用于描述所论对象某一方面的属性。
一个侧面:用于描述相应属性的一个方面。
槽和侧面所具有的属性值分别成为槽值和侧面值。
举例:
<框架名>
槽名1:侧面名1 值1,值2….值p1
侧面名2 值1,值2….值p2
侧面名m1 值1,值2….值pm1
槽名n:侧面名1 值1,值2….值r1
约束:约束条件1
约束条件n
语义网络(Semantic Network):
1968年提出,作为人类联想记忆中的一个显示心理学模型,并在他设计的可教式语言理解器TLC中用作知识表示方法。