知识图谱推理
# 1. 什么是推理
利用机器来实现类似于人类心智的推理能力,是人工智能自诞生以来最核心的目标和任务之一。
# 1.1 多种类型的推理
# 1)演绎推理(Deductive Reasoning)
是一种 Top-down logic,分为以下几种:
🖊 肯定前件假言推理(Modus ponens):
🖊 否定后件假言推理(Modus tollens):
🖊 三段论(Law of syllogism):
# 2)归纳推理(Inductive Reasoning)
是一种 Bottom-up logic,The derivation of general principles from specific observation, for example, if all swans that we have observed so far are white, we may induce that the possibility that all swans are white is reasonable.
其实日常生活中的推理都是这种近似正确的推理,尽管不是百分百正确,但很有用
🖊 Inductive Generalization:
🖊 Statistical syllogism:
# 3)溯因推理(Abductive Reasoning)
是一种 Inference to the best explanation,a form of logical inference which starts with an observation or set of observations then seeks to find the simplest and most likely explanation for the observations.
溯因推理关注的是结果的可解释逻辑
# 4)类比推理(Analogical Reasoning)
是一种 Inference via Analog,In a narrower sense, analogy is an inference or an argument from one particular to another particular, as opposed to deduction, induction and abduction, in which at least one of the premises, or the conclusion, is general rather than particular in nature.
比如我们已经学过做草莓饼干,现在我们要做菠萝饼干,那我们会去寻找两者的相同和不同之处。
# 1.2 常被研究的推理任务
# 1)Reasoning in Description Logic
- TBox 存储抽象的概念,ABox 存储事实性描述
- 这是一种精确的符号表示
# 2)Reasoning in NLP
比如 NLP 中的一个任务:Natural Language Inference,给定两句话,让机器来判断它们之间是否存在蕴含或者冲突的关系。例如“他正在打鼾”蕴含了“他正在睡觉”
# 3)Reasoning in CV
Visual Reasoning,比如根据一张图识别出各物体之间的关系。
# 2. 知识图谱推理简介
常见的知识图谱推理方法的分类:
# 2.1 基于符号表示的推理
TBox vs ABox:
演绎推理不存在可解释性的问题,因为每一个推理得出的结论都可以回溯和给出推理的过程。
Simple logic deduction with ontological axioms(rules) performed mostly over TBox or Schema of KGs:
Deductive reasoning with ontology can be very complex when considering more ontological axioms(can be reformulated as rules) or Datalog-like rules:
# 2.2 基于向量表示的推理
像 TransE 等模型的基本思想是将知识图谱中的实体和关系都投影到向量空间,再通过向量空间完成推理计算。这些模型的训练通常以知识图谱的三元组为训练输入,通过定义一个约束函数,对向量表示进行学习。
但将表示向量化和参数化的后果是丢失可解释性,我们能得到一个结果,但并不知道为什么能得到这个结果。
图神经网络也可以用来处理知识图谱的数据,它善于捕获图的结构特征。
# 3. 基于符号逻辑的知识图谱推理
# 3.1 基于 Ontology 的推理
// TODO,可见浙大网课 PPT
# 3.2 基于 Datalog 的符号推理
// TODO,可见浙大网课 PPT
# 3.3 基于产生式规则的推理
产生式系统:一种前向推理系统,可以按照一定机制执行规则从而达到某些目标,与一阶逻辑类似,也有区别
// TODO,可见浙大网课 PPT
# 4. 基于表示学习的知识图谱推理
# 4.1 基于嵌入学习的知识图谱推理
# 1)知识嵌入模型:TransE
关系推理的评价指标:
- Hit@n:所有预测样本中排名在 n 以内的比例,n 常用的取值为 1,3,10
- MR: Mean Rank 所有预测样本的平均排名
- MRR:Mean Reciprocal Rank 先对所有预测样本的排名求倒数,然后求平均
符号推理 vs 向量推理
TransE 的问题:
- 无法处理一对多、多对一和多对多问题:
- 关系的性质:
# 2)其他典型的知识嵌入模型
TransH、TransR、TransD、DistMult、Analogy ……
可以看到,为了区分和处理复杂的关系语义,我们就不得不增加新的参数,参数越多,对知识图谱语料的要求就越多,训练的代价也随之增加。因此,平衡语义的建模和表达能力、参数的多少是选择和设计合适的知识图谱嵌入模型所需要考虑的问题。
# 4.2 基于规则学习的知识图谱推理
Most of tasks can be modeled as rule-based reasoning。
- 很多工业界应用出于可靠性考虑,仍然更多相信和依赖于人工定义规则,但可扩展性和推理鲁棒性都较差
- 学术界更多关注怎样利用机器学习,特别是表示学习方法从大量噪音数据中自动归纳和总结出规则,但规则可靠性多需要人工校验,且基于表示学习的方法可解释性差
// TODO,具体模型可参考 PPT
# 4.3 Ontology Embedding—本体概念层推理
Ontology Embedding:侧重于对本体中概念体系进行学习,这包括类与类之间的关系,类与实例之间的关系,以及类与属性之间的关系等。
Ontology Embedding vs KG Embedding:
- 本体嵌入和知识图谱嵌入本质上都是一种知识表示结构的嵌入,只不过嵌入的内容有所不同,本质上也没有严格的区分和界限
- Onto Embedding侧重于 Tbox 概念层的表示学习,KG Embedding 则更加侧重于 Abox 实例层的表示学习
- 概念层的表示学习通常被用来增强实例层的学习效果,同时,实例层也被经常用来实现概念层,如本体 axiom 的学习
// TODO,具体模型可参考 PPT