基于贝叶斯网的开放世界知识图谱补全
这是一篇关于开放世界知识图谱补全,关系之间的依赖性,贝叶斯网,概率推理,关系预测的论文, 主要内容为知识图谱作为海量数据的支撑技术,为搜索引擎、问答系统和推荐系统等应用提供知识服务,由实体以及实体之间关系构成的三元组是知识图谱的基础结构。为了丰富知识,传统的知识图谱补全方法以表示学习为基础,将实体和关系投射到向量空间,并通过向量之间的距离计算来构造更多的三元组。然而,现实世界中的知识在不断更新变化,这要求知识图谱能够及时增补有用的新知识。同时,数据中蕴含的知识也可以作为新知识的来源,对知识图谱补全具有重要意义。研究人员将所有不包含于知识图谱的数据称为开放世界数据,提出开放世界知识图谱补全方法,从数据中获取知识图谱中不存在的新实体,利用新实体构造三元组。然而,对于任意一个新实体,现有的开放世界补全方法每次只能构造一个三元组,在一定程度上限制了新知识的丰富程度。事实上,知识图谱中实体共同涉及的关系之间通常具有相互依赖的性质,基于这种依赖性可利用数据中的新实体来构造更多的三元组。贝叶斯网被广泛用于变量之间相互依赖关系和不确定性知识的表示和推理,为了给知识图谱补充更多的新知识,本文研究基于贝叶斯网的开放世界知识图谱补全方法。利用贝叶斯网表示关系之间的依赖性,针对从开放世界数据中提取的新实体,基于贝叶斯网概率推理来获取与新实体相关的其他关系,进而构造更多的包含新实体的三元组来完善知识图谱。本文的主要研究内容概括如下:(1)基于知识图谱构建贝叶斯网,有效表示关系之间的依赖性,作为开放世界知识图谱补全的基础。(2)提出基于贝叶斯网概率推理的三元组构造方法,从开放世界数据中获取包含新实体的三元组,并将这些三元组作为证据,通过贝叶斯网推理构造更多的三元组,从而实现知识图谱的补全。(3)利用三元组类型预测和链路预测任务对本文方法进行了实验测试,验证了模型构建方法的高效性和知识图谱补全方法的有效性。
基于表示学习的知识图谱实体对齐研究与系统实现
这是一篇关于知识图谱,实体对齐,表示学习,概率推理的论文, 主要内容为知识图谱是基于人类知识构建的结构化知识库,随着互联网以及人工智能技术的发展及迫切需求,目前已经有大量的知识图谱诞生,这些知识图谱被广泛应用于智能知识问答、智能推荐等人工智能领域。各种知识图谱数量的快速增长促进了知识图谱融合技术的研究,知识图谱的表示学习及实体对齐方法作为这一任务的关键技术,成为近几年的研究热点之一。受限于标注数据的数量,现有方法更多的是考虑使用辅助信息去提升实体的向量表示能力,例如字符串信息、实体属性信息。但对于跨语言多模态这类符号异质性的知识图谱,辅助信息难以在统一的表示空间下建模,导致上述方法普适性较差。基于这一问题,本文提出了结合表示学习及概率推理的实体对齐方法,构建了弱监督情况下多源异构知识图谱的融合模型,并开发实现了一个在线知识图谱融合系统,本文研究成果如下:(1)通过对知识图谱中的实体与关系进行分析,发现知识图谱中关系类型数量和实体数量存在着巨大的差异。本文基于这种差异,使用表示学习方法获得相似关系,基于实体种子对齐(已标注对齐的实体)及相似关系,设计出概率推理实体对齐方法。结合模型中概率推理模块与表示学习模块的实体映射输出,得到最终的实体对齐结果。最后,通过在多个数据集上进行的对比实验,证明了该实体对齐方法的优越性能。(2)在建模知识图谱间相似关系的基础上,进一步分析了多源异构知识图谱中存在的独有关系,发现这些关系往往是导致知识图谱间结构差异问题的原因之一。基于此,本文使用表示学习筛选出独有关系,将这些关系进行修剪以减轻独有关系造成的结构差异问题。与此同时,针对知识图谱初始标注数据不足的问题,本文使用半监督的方法在多次迭代中不断丰富实体种子对齐与相似关系,进一步的提升模型中各模块性能。最后,在相同的数据集上,所提模型取得了更佳的实体对齐效果。(3)基于以上研究成果,实现了一个在线知识图谱融合系统,允许个人用户上传多源异构知识图谱,供系统在后台对知识图谱进行融合。融合完成后用户可在线查看知识图谱结构,并下载融合后的知识图谱文件。
基于贝叶斯网的知识图谱链接预测
这是一篇关于知识图谱,链接预测,数据结合,贝叶斯网,概率推理,相似性的论文, 主要内容为近年来,信息技术不断完善,语义网技术不断成熟,传统的文本搜索逐步转向语义搜索,知识图谱(KG,Knowledge Graph)也随之发展成为工业界和学术界的研究热点。结合外部数据集(例如,标签数据集),基于概率图模型进行知识图谱的链接预测,即知识图谱中缺失信息的发现和还原,是目前知识图谱领域研究的热点和关键。本文以电子商务应用为背景,基于已经构建好的描述用户兴趣的知识图谱,结合外部数据集,以贝叶斯网这一重要概率图模型作为不同商品之间相似性及其不确定性的表示和推理框架,通过对商品属性进行统计计算,构建反映商品之间相似关系的贝叶斯网,进而利用近似推理方法,判断商品实体节点与用户实体节点之间存在链接的真实性,得到更为完整和真实的知识图谱,为个性化推荐和关联查询提供依据。具体而言,本文的主要工作如下:(1)现有KG中属性节点信息单一,描述实体属性的数据不够充分,而现实世界中含有大量与用户KG相关联的外部知识——标签数据集。本文以电子商务应用为背景,针对已经构建好的描述用户兴趣的KG,KG中的实体对应为商品实体,将KG中信息和外部数据集相结合,基于商品之间相似性构建了用于KG链接预测的LBN(LBN,Link Bayesian Network),提高链接预测的准确性。(2)针对LBN模型构建问题,对于结构学习,本文基于商品实体之间的相似性来构建包含商品节点的模型结构;对于参数学习,我们选择常用的极大似然估计算法来计算条件概率表。(3)为了实现高效发现LBN中具有相似关系的商品节点,同时便于扩展到大规模KG,我们利用贝叶斯网的概率推理机制,给出基于Gibbs采样算法的LBN概率推理,量化了未知链接真实存在的可能性,基于此实现了 KG链接预测。(4)基于MovieLens站点数据,本文实现并测试了LBN的构建、近似推理方法,同时验证了链接预测的有效性。为了完善我们的研究内容,我们根据本文提出的方法,基于Web服务设计了“基于贝叶斯网的知识图谱链接预测”原型系统。
基于贝叶斯网的开放世界知识图谱补全
这是一篇关于开放世界知识图谱补全,关系之间的依赖性,贝叶斯网,概率推理,关系预测的论文, 主要内容为知识图谱作为海量数据的支撑技术,为搜索引擎、问答系统和推荐系统等应用提供知识服务,由实体以及实体之间关系构成的三元组是知识图谱的基础结构。为了丰富知识,传统的知识图谱补全方法以表示学习为基础,将实体和关系投射到向量空间,并通过向量之间的距离计算来构造更多的三元组。然而,现实世界中的知识在不断更新变化,这要求知识图谱能够及时增补有用的新知识。同时,数据中蕴含的知识也可以作为新知识的来源,对知识图谱补全具有重要意义。研究人员将所有不包含于知识图谱的数据称为开放世界数据,提出开放世界知识图谱补全方法,从数据中获取知识图谱中不存在的新实体,利用新实体构造三元组。然而,对于任意一个新实体,现有的开放世界补全方法每次只能构造一个三元组,在一定程度上限制了新知识的丰富程度。事实上,知识图谱中实体共同涉及的关系之间通常具有相互依赖的性质,基于这种依赖性可利用数据中的新实体来构造更多的三元组。贝叶斯网被广泛用于变量之间相互依赖关系和不确定性知识的表示和推理,为了给知识图谱补充更多的新知识,本文研究基于贝叶斯网的开放世界知识图谱补全方法。利用贝叶斯网表示关系之间的依赖性,针对从开放世界数据中提取的新实体,基于贝叶斯网概率推理来获取与新实体相关的其他关系,进而构造更多的包含新实体的三元组来完善知识图谱。本文的主要研究内容概括如下:(1)基于知识图谱构建贝叶斯网,有效表示关系之间的依赖性,作为开放世界知识图谱补全的基础。(2)提出基于贝叶斯网概率推理的三元组构造方法,从开放世界数据中获取包含新实体的三元组,并将这些三元组作为证据,通过贝叶斯网推理构造更多的三元组,从而实现知识图谱的补全。(3)利用三元组类型预测和链路预测任务对本文方法进行了实验测试,验证了模型构建方法的高效性和知识图谱补全方法的有效性。
基于表示学习的知识图谱实体对齐研究与系统实现
这是一篇关于知识图谱,实体对齐,表示学习,概率推理的论文, 主要内容为知识图谱是基于人类知识构建的结构化知识库,随着互联网以及人工智能技术的发展及迫切需求,目前已经有大量的知识图谱诞生,这些知识图谱被广泛应用于智能知识问答、智能推荐等人工智能领域。各种知识图谱数量的快速增长促进了知识图谱融合技术的研究,知识图谱的表示学习及实体对齐方法作为这一任务的关键技术,成为近几年的研究热点之一。受限于标注数据的数量,现有方法更多的是考虑使用辅助信息去提升实体的向量表示能力,例如字符串信息、实体属性信息。但对于跨语言多模态这类符号异质性的知识图谱,辅助信息难以在统一的表示空间下建模,导致上述方法普适性较差。基于这一问题,本文提出了结合表示学习及概率推理的实体对齐方法,构建了弱监督情况下多源异构知识图谱的融合模型,并开发实现了一个在线知识图谱融合系统,本文研究成果如下:(1)通过对知识图谱中的实体与关系进行分析,发现知识图谱中关系类型数量和实体数量存在着巨大的差异。本文基于这种差异,使用表示学习方法获得相似关系,基于实体种子对齐(已标注对齐的实体)及相似关系,设计出概率推理实体对齐方法。结合模型中概率推理模块与表示学习模块的实体映射输出,得到最终的实体对齐结果。最后,通过在多个数据集上进行的对比实验,证明了该实体对齐方法的优越性能。(2)在建模知识图谱间相似关系的基础上,进一步分析了多源异构知识图谱中存在的独有关系,发现这些关系往往是导致知识图谱间结构差异问题的原因之一。基于此,本文使用表示学习筛选出独有关系,将这些关系进行修剪以减轻独有关系造成的结构差异问题。与此同时,针对知识图谱初始标注数据不足的问题,本文使用半监督的方法在多次迭代中不断丰富实体种子对齐与相似关系,进一步的提升模型中各模块性能。最后,在相同的数据集上,所提模型取得了更佳的实体对齐效果。(3)基于以上研究成果,实现了一个在线知识图谱融合系统,允许个人用户上传多源异构知识图谱,供系统在后台对知识图谱进行融合。融合完成后用户可在线查看知识图谱结构,并下载融合后的知识图谱文件。
基于表示学习的知识图谱实体对齐研究与系统实现
这是一篇关于知识图谱,实体对齐,表示学习,概率推理的论文, 主要内容为知识图谱是基于人类知识构建的结构化知识库,随着互联网以及人工智能技术的发展及迫切需求,目前已经有大量的知识图谱诞生,这些知识图谱被广泛应用于智能知识问答、智能推荐等人工智能领域。各种知识图谱数量的快速增长促进了知识图谱融合技术的研究,知识图谱的表示学习及实体对齐方法作为这一任务的关键技术,成为近几年的研究热点之一。受限于标注数据的数量,现有方法更多的是考虑使用辅助信息去提升实体的向量表示能力,例如字符串信息、实体属性信息。但对于跨语言多模态这类符号异质性的知识图谱,辅助信息难以在统一的表示空间下建模,导致上述方法普适性较差。基于这一问题,本文提出了结合表示学习及概率推理的实体对齐方法,构建了弱监督情况下多源异构知识图谱的融合模型,并开发实现了一个在线知识图谱融合系统,本文研究成果如下:(1)通过对知识图谱中的实体与关系进行分析,发现知识图谱中关系类型数量和实体数量存在着巨大的差异。本文基于这种差异,使用表示学习方法获得相似关系,基于实体种子对齐(已标注对齐的实体)及相似关系,设计出概率推理实体对齐方法。结合模型中概率推理模块与表示学习模块的实体映射输出,得到最终的实体对齐结果。最后,通过在多个数据集上进行的对比实验,证明了该实体对齐方法的优越性能。(2)在建模知识图谱间相似关系的基础上,进一步分析了多源异构知识图谱中存在的独有关系,发现这些关系往往是导致知识图谱间结构差异问题的原因之一。基于此,本文使用表示学习筛选出独有关系,将这些关系进行修剪以减轻独有关系造成的结构差异问题。与此同时,针对知识图谱初始标注数据不足的问题,本文使用半监督的方法在多次迭代中不断丰富实体种子对齐与相似关系,进一步的提升模型中各模块性能。最后,在相同的数据集上,所提模型取得了更佳的实体对齐效果。(3)基于以上研究成果,实现了一个在线知识图谱融合系统,允许个人用户上传多源异构知识图谱,供系统在后台对知识图谱进行融合。融合完成后用户可在线查看知识图谱结构,并下载融合后的知识图谱文件。
基于概率推理的知识图谱链接预测
这是一篇关于知识图谱,链接预测,贝叶斯网,Horn子句,概率推理的论文, 主要内容为知识图谱(Knowledge Graph,KG)以强大的语义处理能力与开放互联能力成为人工智能领域研究的热点。然而,KG中的知识并不完善,部分实体之间缺少链接,导致KG的使用受到极大的限制。KG的链接预测任务旨在为实体间缺失的链接进行预测,其中,根据KG中的知识计算实体间存在链接的可能性,预测缺失的实体链接,是KG链接预测的核心任务之一,也是本文研究的链接预测问题。KG中的实体之间存在着相互依赖关系,且具有不确定性,如何描述不同实体间的隐含链接关系、并对其存在的可能性进行定量度量,是准确预测实体间存在链接的重要保证。基于规则挖掘发现缺失链接是一种有效的KG链接预测方法,然而,该方法不能有效发现实体间隐含的关联关系并对其进行量化,难以全面准确地实现KG的链接预测任务。为此,本文以描述实体间隐含关联关系并度量链接存在的可能性为目标,基于AMIE算法挖掘KG中的规则,并将其转换为Horn子句。进一步,以贝叶斯网(Bayesian Network,BN)这一概率图模型作为描述KG实体间不确定依赖关系的表示和推理框架,利用Horn子句构建描述实体间相互关联的规则链接贝叶斯网(Rule-Link Bayesian Network,RLBN)。把KG的链接预测任务转换成RLBN的概率推理任务、计算实体间的关联度,作为链接存在的依据从而实现链接预测任务。本文的主要工作概括如下:(1)针对查询实体,利用AMIE算法挖掘KG中描述查询实体与候选实体集依赖关系的逻辑规则,设计加权函数计算规则的权值,并提出了抽取最优规则关联实体集的分支限界算法,获取与查询实体关联的实体集。(2)为了构建RLBN的结构,将查询实体的规则关联实体集表示为Horn子句并等价地转换为有向无环图。此外,提出概率分配函数并利用Horn子句中的逻辑约束来计算各节点的条件概率表。(3)为了高效地完成链接预测任务,本文基于BN推理机制提出RLBN的近似推理算法,计算实体间的关联度,并将其作为预测链接存在性的依据。(4)基于不同规模、类型的数据集上,选择多组对比方法,对RLBN的链接预测方法及模型的构建进行了实验测试,实验验证了模型的有效性和高效性,并且为了更加直观地展示RLBN模型,本文设计并实现了简单的模型原型系统。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码驿站 ,原文地址:https://bishedaima.com/lunwen/49246.html