基于不确定知识图谱的规则学习与推理技术研究
这是一篇关于知识图谱,不确定性,表示学习,规则学习,规则推理的论文, 主要内容为近年来,知识图谱在许多知识驱动的人工智能应用中起到越来越重要的作用。然而随着知识图谱的规模不断增大,人工构造图谱的方式已经难以满足需求,许多自动化的图谱构建步骤如实体链接、关系抽取等被引入图谱构建过程,这些方法相较于人工标注方式其正确性难以保证,这使得图谱中的数据具有不确定性。不确定知识图谱通过给三元组附加置信度来表征一个事实为真的概率,从而描述这种不确定性。规则学习与推理方法由于具有较强的可解释性,在许多应用中有着不可替代的作用。然而当前规则学习与推理方法通常针对确定性知识图谱设计,没有考虑噪声和不确定性,导致其在不确定知识图谱中学习到的规则质量较低,不能很好地进行图谱的推理补全。为了解决以上问题,本文提出一种新的不确定知识图谱规则学习与推理方法。该方法以不确定知识图谱表示学习为基础,首先将不确定知识图谱中的结构语义信息、置信度信息、关系逻辑信息嵌入到表示向量中;然后在规则学习过程中利用表示向量辅助规则生成,从而降低不确定性对于规则学习的干扰;在规则推理中,通过学习规则的变量特征向量来描述规则应用范围,从而将规则和实例的匹配程度也加入规则推理的考虑当中。本文的主要贡献如下:(1)提出了一个不确定知识图谱表示学习与规则编码评估方法。通过该方法,实体与关系的表示向量可以同时嵌入不确定知识图谱的结构语义信息、置信度信息以及关系的逻辑性质,用于支持后续规则学习与推理过程。此外,本文还提出一种基于注意力机制的规则编码及评估方法,通过注意力权重和关系表示向量编码规则语义,并实现对规则质量的评分从而指导规则学习。(2)提出了一种迭代式的不确定知识图谱规则学习与推理方法。方法主要由三个模块构成:首先,规则生成器基于不确定知识图谱表示向量,生成候选逻辑规则;接着,规则变量学习器通过采样和归纳的方式学习规则的变量特征向量,用于描述规则的适用范围;最后,规则推理器利用规则及规则的变量特征向量进行图谱的推理补全,并在推理补全中筛选高质量的规则用于规则生成器的迭代训练。(3)实验验证:本文围绕所研究的不确定知识图谱补全任务,对提出的方法进行了实现,并在四个不确定知识图谱数据集上进行了实验验证。实验包含了总体对比实验以及具体消融分析等内容,实验结果表明,本文提出的方法在四个数据集上均优于现有相关方法。从实践层面,本研究可以有效支持许多对可解释性、精确性要求较高的应用,如军事决策、医药研发等。从理论层面,本研究也是对符号-神经联合推理方法的有益探索。
基于不确定知识图谱的规则学习与推理技术研究
这是一篇关于知识图谱,不确定性,表示学习,规则学习,规则推理的论文, 主要内容为近年来,知识图谱在许多知识驱动的人工智能应用中起到越来越重要的作用。然而随着知识图谱的规模不断增大,人工构造图谱的方式已经难以满足需求,许多自动化的图谱构建步骤如实体链接、关系抽取等被引入图谱构建过程,这些方法相较于人工标注方式其正确性难以保证,这使得图谱中的数据具有不确定性。不确定知识图谱通过给三元组附加置信度来表征一个事实为真的概率,从而描述这种不确定性。规则学习与推理方法由于具有较强的可解释性,在许多应用中有着不可替代的作用。然而当前规则学习与推理方法通常针对确定性知识图谱设计,没有考虑噪声和不确定性,导致其在不确定知识图谱中学习到的规则质量较低,不能很好地进行图谱的推理补全。为了解决以上问题,本文提出一种新的不确定知识图谱规则学习与推理方法。该方法以不确定知识图谱表示学习为基础,首先将不确定知识图谱中的结构语义信息、置信度信息、关系逻辑信息嵌入到表示向量中;然后在规则学习过程中利用表示向量辅助规则生成,从而降低不确定性对于规则学习的干扰;在规则推理中,通过学习规则的变量特征向量来描述规则应用范围,从而将规则和实例的匹配程度也加入规则推理的考虑当中。本文的主要贡献如下:(1)提出了一个不确定知识图谱表示学习与规则编码评估方法。通过该方法,实体与关系的表示向量可以同时嵌入不确定知识图谱的结构语义信息、置信度信息以及关系的逻辑性质,用于支持后续规则学习与推理过程。此外,本文还提出一种基于注意力机制的规则编码及评估方法,通过注意力权重和关系表示向量编码规则语义,并实现对规则质量的评分从而指导规则学习。(2)提出了一种迭代式的不确定知识图谱规则学习与推理方法。方法主要由三个模块构成:首先,规则生成器基于不确定知识图谱表示向量,生成候选逻辑规则;接着,规则变量学习器通过采样和归纳的方式学习规则的变量特征向量,用于描述规则的适用范围;最后,规则推理器利用规则及规则的变量特征向量进行图谱的推理补全,并在推理补全中筛选高质量的规则用于规则生成器的迭代训练。(3)实验验证:本文围绕所研究的不确定知识图谱补全任务,对提出的方法进行了实现,并在四个不确定知识图谱数据集上进行了实验验证。实验包含了总体对比实验以及具体消融分析等内容,实验结果表明,本文提出的方法在四个数据集上均优于现有相关方法。从实践层面,本研究可以有效支持许多对可解释性、精确性要求较高的应用,如军事决策、医药研发等。从理论层面,本研究也是对符号-神经联合推理方法的有益探索。
一种基于规则引导式图神经网络的推荐方法
这是一篇关于推荐系统,图神经网络,规则学习的论文, 主要内容为经典的协同过滤算法在推荐系统中取得了出色的成果。然而,由于协同过滤算法仅专注于探索用户与物品的交互历史,因此在用户与物品的交互很稀疏时很难发挥出色的作用,即协同过滤算法无法有效地处理冷启动问题。为了缓解该问题,越来越多的推荐算法开始使用外部知识,如用户自身的属性,来为算法提供信息支持。知识图谱作为一种高质量的结构化数据,正在被越来越多的推荐系统所使用。现有的利用知识图谱的推荐算法大致可分为三类:基于嵌入的推荐算法、基于路径(规则)的推荐算法和基于聚合的推荐算法。这三类算法都在实践中取得了一定的成果,同时也存在着一些缺陷。基于嵌入的推荐算法通常利用成熟的知识图谱嵌入模型来获得知识图谱的嵌入,它们往往只考虑用户与实体之间的直接联系,忽视了用户与实体之间的长程语义依赖。基于路径(规则)的推荐算法能够使用路径来捕捉长程语义,然而规则所引导的线性建模方式无法充分考虑不同实体之间的多样化联系。基于聚合的方法通过设计独特的聚合机制或利用图神经网络,充分考虑了实体间的多样化联系,却依然在捕捉明确的长程语义依赖上存在问题。针对现有方法存在的不足,本文提出了一种结合规则和图神经网络的推荐算法RGRec(Rule-Guided Graph Neural Networks for Recommender System),它能够在捕捉用户与实体间的长程依赖的同时充分的考虑不同实体之间的多样化联系。在规则部分,为了获得高质量规则,本文设计了自动的规则挖掘和快速规则筛选方法,并以规则来捕捉用户与实体之间的长程语义依赖。关于图神经网络,针对随机选点所带来的信息损失及噪音引入问题,本文使用规则进行选点的引导,并建立起中心节点与远距离节点之间的明确语义联系,获得多条规则引导下的多维度特征,并通过对多维度特征的加权整合,将中心节点周围的信息进行合理的汇聚,以此充分考虑不同实体之间的联系,防止实体被孤立处理。本文设计了对比试验,在点击率预测和top-K推荐这两个场景下,使用三个真实世界数据集Last.FM、Movie Lens-1M和Dianping-Food,将RGRec与多个有代表性的算法进行对比,证明了RGRec的优越性,同时也证明了本文对规则和图神经网络的结合是有效的。
基于不确定知识图谱的规则学习与推理技术研究
这是一篇关于知识图谱,不确定性,表示学习,规则学习,规则推理的论文, 主要内容为近年来,知识图谱在许多知识驱动的人工智能应用中起到越来越重要的作用。然而随着知识图谱的规模不断增大,人工构造图谱的方式已经难以满足需求,许多自动化的图谱构建步骤如实体链接、关系抽取等被引入图谱构建过程,这些方法相较于人工标注方式其正确性难以保证,这使得图谱中的数据具有不确定性。不确定知识图谱通过给三元组附加置信度来表征一个事实为真的概率,从而描述这种不确定性。规则学习与推理方法由于具有较强的可解释性,在许多应用中有着不可替代的作用。然而当前规则学习与推理方法通常针对确定性知识图谱设计,没有考虑噪声和不确定性,导致其在不确定知识图谱中学习到的规则质量较低,不能很好地进行图谱的推理补全。为了解决以上问题,本文提出一种新的不确定知识图谱规则学习与推理方法。该方法以不确定知识图谱表示学习为基础,首先将不确定知识图谱中的结构语义信息、置信度信息、关系逻辑信息嵌入到表示向量中;然后在规则学习过程中利用表示向量辅助规则生成,从而降低不确定性对于规则学习的干扰;在规则推理中,通过学习规则的变量特征向量来描述规则应用范围,从而将规则和实例的匹配程度也加入规则推理的考虑当中。本文的主要贡献如下:(1)提出了一个不确定知识图谱表示学习与规则编码评估方法。通过该方法,实体与关系的表示向量可以同时嵌入不确定知识图谱的结构语义信息、置信度信息以及关系的逻辑性质,用于支持后续规则学习与推理过程。此外,本文还提出一种基于注意力机制的规则编码及评估方法,通过注意力权重和关系表示向量编码规则语义,并实现对规则质量的评分从而指导规则学习。(2)提出了一种迭代式的不确定知识图谱规则学习与推理方法。方法主要由三个模块构成:首先,规则生成器基于不确定知识图谱表示向量,生成候选逻辑规则;接着,规则变量学习器通过采样和归纳的方式学习规则的变量特征向量,用于描述规则的适用范围;最后,规则推理器利用规则及规则的变量特征向量进行图谱的推理补全,并在推理补全中筛选高质量的规则用于规则生成器的迭代训练。(3)实验验证:本文围绕所研究的不确定知识图谱补全任务,对提出的方法进行了实现,并在四个不确定知识图谱数据集上进行了实验验证。实验包含了总体对比实验以及具体消融分析等内容,实验结果表明,本文提出的方法在四个数据集上均优于现有相关方法。从实践层面,本研究可以有效支持许多对可解释性、精确性要求较高的应用,如军事决策、医药研发等。从理论层面,本研究也是对符号-神经联合推理方法的有益探索。
基于规则学习和推演的知识图谱补全
这是一篇关于知识图谱,知识图谱补全,规则学习,逻辑规则推演的论文, 主要内容为随着知识图谱(Knowledge Graph,KG)在许多任务和领域的广泛应用,大多数KG还在快速发展并且亟需充分发掘实体之间的关系。近年来,科研人员将KG嵌入到不同的向量空间中,通过向量计算发掘潜在的关系,或利用神经网络对KG中缺失的关系或实体进行预测。传统的方法需要前期使用大量的训练数据进行模型训练以保证表示和补全精度,然而现实世界中,KG能提供的知识或数据在规模上并不统一。如何在仅有少量训练数据的情形下对KG中缺失的关系或实体进行补全,提高KG补全的准确性和可靠性成为当前研究的热点。KG基于语义网发展而来,利用KG本体规则可以直接、有效的表示出KG中所蕴含的知识。在学习本体规则的过程中需要学习规则的结构和内容,结构学习复杂而且耗时间,内容学习过程通常采用完全遍历的方法以保证规则学习的覆盖率,然而大大增加了学习时间。在获得与KG有关的规则后,需要有效的策略从规则中挖掘新知识为KG补全提供帮助。本文的研究内容概括如下:(1)通过扩展Horn规则和逻辑规则推导,定义了适用于KG的本体规则作为基本规则,并提出基于规则学习和推演进行KG补全的框架RuleB。(2)针对遍历KG学习规则需要消耗大量时间的问题,提出了一种随机游走和范围遍历相结合的规则学习算法(Random Walk K-sized,RWK)。为了进一步解决RWK不能保证规则覆盖率的问题,基于Bloom Filter提出一种能在降低学习时间的同时保证规则学习覆盖率的方法。(3)利用从KG中学习到的规则,提出了一种通过推演产生新规则并利用新规则获取新知识的策略,最终将获取的新知识用于KG补全。(4)基于真实数据集测试了利用RuleB的规则学习方法的效率,以及KG补全的精度、召回率和F1值,实验结果表明,本文提出的方法在仅有少量数据情形下能有效地提升KG补全精度。
大规模知识图谱的规则学习研究
这是一篇关于知识图谱,规则学习,链接预测的论文, 主要内容为随着人工智能技术取得了前所未有的发展,以知识图谱为代表的知识工程以及深度学习等相关领域得到了广泛的关注。知识图谱的概念最早是由谷歌于2012年正式提出的,它是新一代知识库,主要用来描述真实世界中存在的各种实体和概念,以及他们之间的关系。知识图谱能够弥补机器学习、深度学习算法的描述能力,规则等表示形式与神经网络相比是显性的知识,因此可基于此对学习的结果,例如链接预测,提供人类可理解的解释。本文针对规则学习,提出了一种针对大型知识图谱的、基于规则学习的链接预测的有效方法,提高链接预测任务的精度,进一步将知识图谱进行补全;除此之外,将学习到的规则从语义相似性和语义相关性的角度进行进一步拓展,增加学习到的规则数量。本文提出了大型知识图谱规则学习系统R-Linker,并基于规则进行链接预测和规则扩展,其具体研究内容与创新点在于以下几个方面:首先,针对规则学习部分,本文提出分层采样算法,并将采样过程与规则搜索过程有机结合,大大降低了系统在计算上的消耗,提高了系统的运行效率;利用向量嵌入优化得分函数,使得在保持向量嵌入信息量的同时减少中间计算量;将规则评估过程的计算过程与质量评估置信度结合,提出针对规则头部评估的优化措施。其次,基于规则学习的结果,提出基于规则推理的链接预测方法,并且将规则进一步进行语义扩展,创新性的结合基于嵌入的方法和传统的归纳逻辑编程的思想,挖掘语义相似性和相关性高的关系进行规则原子的替换,从而生成更多的高质量规则。由实验结果验证可知,R-Linker相较当前最先进的规则学习系统,在系统的运行效率、规则的数量以及链接预测任务的准确率上体现出了较明显的优势。
基于知识图谱的规则学习研究及链接预测应用
这是一篇关于知识图谱,规则学习,链接预测的论文, 主要内容为近年来,日益增多的数据依托互联网平台加速产生,支撑了人工智能的快速发展。然而要想取得长足发展,则需对大量数据中蕴含的丰富信息进行深度提取以及有效运用。人工创建或自动生成的大型知识图谱存储了数以千万计的世界上的事实,基于知识图谱的各种研究方向对AI的发展与应用起到了至关重要的作用,尤其是在大型知识图谱上的规则学习,可以以规则的形式对自动预测的事实或知识为人类提供合理的解释。本文重点研究从知识图谱的基事实中学习一系列封闭路径规则,首先提出了一个谓词采样方法和规则学习系统ARL,采样阶段将知识嵌入模型与注意力机制结合,为目标谓词采集一个最适合的谓词集,进而获得最有效的子图,大大减少了子图中的谓词数和事实数,间接缩小了规则空间的搜索范围,规则搜索阶段选择基于向量嵌入的得分函数,减轻衡量候选规则合理性时的计算量。然后结合先进的规则学习系统AMIE+,对其进行扩展的同时对本文提出的采样方法进行有效评估,使AMIE+在短时间内学出更长且有意义的规则。最后利用ARL以及与AMIE+结合学到的规则分别执行了链接预测实验。本文针对规则学习及链接预测任务分别设计了一系列实验,从实验结果中可以看出,ARL在系统的运行效率与性能之间取得了一个很好的平衡,并在文献中常用的三个大型基准数据集上优于最先进的规则学习系统,同时与几个主要的基准模型相比,在最具挑战性的FB15K-237数据集上获得了最佳预测精度。
基于知识图谱的规则学习研究及链接预测应用
这是一篇关于知识图谱,规则学习,链接预测的论文, 主要内容为近年来,日益增多的数据依托互联网平台加速产生,支撑了人工智能的快速发展。然而要想取得长足发展,则需对大量数据中蕴含的丰富信息进行深度提取以及有效运用。人工创建或自动生成的大型知识图谱存储了数以千万计的世界上的事实,基于知识图谱的各种研究方向对AI的发展与应用起到了至关重要的作用,尤其是在大型知识图谱上的规则学习,可以以规则的形式对自动预测的事实或知识为人类提供合理的解释。本文重点研究从知识图谱的基事实中学习一系列封闭路径规则,首先提出了一个谓词采样方法和规则学习系统ARL,采样阶段将知识嵌入模型与注意力机制结合,为目标谓词采集一个最适合的谓词集,进而获得最有效的子图,大大减少了子图中的谓词数和事实数,间接缩小了规则空间的搜索范围,规则搜索阶段选择基于向量嵌入的得分函数,减轻衡量候选规则合理性时的计算量。然后结合先进的规则学习系统AMIE+,对其进行扩展的同时对本文提出的采样方法进行有效评估,使AMIE+在短时间内学出更长且有意义的规则。最后利用ARL以及与AMIE+结合学到的规则分别执行了链接预测实验。本文针对规则学习及链接预测任务分别设计了一系列实验,从实验结果中可以看出,ARL在系统的运行效率与性能之间取得了一个很好的平衡,并在文献中常用的三个大型基准数据集上优于最先进的规则学习系统,同时与几个主要的基准模型相比,在最具挑战性的FB15K-237数据集上获得了最佳预测精度。
基于过滤的规则进行数据增强的知识图谱嵌入
这是一篇关于知识图谱,知识图谱嵌入,翻译模型,规则学习的论文, 主要内容为知识图谱如今已被广泛应用于个性化推荐系统、智能问答系统等领域,由于知识图谱的完整性极大地影响了我们后续对知识图谱的使用,而且知识图谱中的事实信息往往是不完整的,实体之间的一些显而易见的关系在原有的知识图谱中并不存在,因此我们需要对知识图谱进行补全。在进行知识图谱补全的方法中,表示学习方法占据了主流的地位,而在表示学习方法中,翻译模型是其中的代表模型,基于翻译模型的表示学习方法具有很高的可扩展性,且可以有效地评测实体之间复杂的语义信息和关系。数据的丰富程度对于表示学习模型来说至关重要,但已有知识图谱中往往存在了大量的稀疏实体,实体间的联系并不紧密,这就导致了表示学习模型无法准确地补全带有稀疏实体的三元组。传统的方法通过将规则学习的方法与表示学习的方法进行结合来缓解这一问题,但要求表示学习的模型需要满足线性映射假设,而翻译模型并不满足这一假设。为了解决这一问题,我们提出使用一种自底向上的规则学习算法来与翻译模型进行结合以增强翻译模型的表达能力的方法,即通过使用规则学习算法来生成增强数据以增强翻译模型。使用这种自底向上的规则学习算法时,其产生的规则置信度的定义也随之不同,当我们在进行三元组推断时,高置信度的规则产生的三元组大部分已经存在于原知识图谱中了,仅有少部分新三元组为有效三元组,而进行数据增强时,我们需要保证增强数据的数量。这一问题的存在使得我们不能简单地指定一个规则置信度的阈值来筛选规则和产生新三元组,为了解决这一问题,我们提出了一种基于规则置信度的规则筛选方法。同时,由于知识图谱中存在的稀疏实体与稀疏关系导致了表示学习模型对包含稀疏实体或稀疏关系的三元组的学习效果不足够好,我们又提出了着重增强包含稀疏实体或稀疏关系的三元组的方法。本文的主要贡献如下:(1)为了增强翻译模型链接预测的准确性,提出了使用自底向上的规则学习算法来产生高质量的规则,并使用中间模块来推断生成可靠的三元组,以增强翻译模型的表达能力。(2)鉴于自底向上的规则学习算法中对于规则置信度的定义和数据增强对于数据数量的要求,为了在产生新三元组的质量与数量之间达到一个平衡,我们对传统方法进行了改进,不像传统方法那样简单地规定一个置信度阈值来筛选规则,而是根据规则置信度降序遍历规则。(3)知识图谱中也存在稀疏关系,稀疏关系的存在使得传统模型对稀疏关系的链接预测效果不够理想,我们在已有方法着重增强包含稀疏实体三元组的基础上,同时增强包含稀疏关系的三元组。本文分别在WN18、FB15k、WN18RR、FB15k-237数据集上和多个模型上应用了本文提出的两种改进方法,并与不使用这两种方法的多个模型进行了对比。结果表明,这两种方法在三种类型的链接预测评价指标下整体优于原模型,一定程度上增强了翻译模型的表达效果。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码工厂 ,原文地址:https://bishedaima.com/lunwen/49243.html