基于知识图谱增强表示的问答方法研究
这是一篇关于知识表示,知识图谱嵌入,图神经网络,预训练语言模型,问答方法研究的论文, 主要内容为近年来,随着深度学习技术的进步,智能问答越来越受人瞩目,其中,基于知识图谱的问答也广泛应用于自然语言处理领域。随着图神经网络和预训练语言模型的迭代更新,基于知识图谱的问答也取得了一系列的进展,但是还存在一些问题。例如:模型无法处理由于多对一的关系导致不同实体具有相同嵌入表示的问题;图神经网络由于迭代次数过多,削弱了问题对答案的影响;模型不能有效融合问句的知识表示、语义信息和结构信息的问题。为了解决这些问题,本文融合了知识图谱嵌入表示、图神经网络和预训练语言模型技术开展研究,主要研究工作如下:(1)为了解决不同实体嵌入表示相同和远处实体贡献减弱的问题,设计了一种基于知识图谱嵌入表示的问答模型。该模型首先根据问题和选项中的实体从外部知识图谱中构建子图并加入上下文节点;其次通过计算路径置信度为子图中的路径赋予不同的权重,从而将子图中的多跳信息聚合并添加辅助关系;然后利用图注意力网络对子图进行消息传递来更新子图中实体和关系的向量表示,并将子图池化得到其向量表示;最后将子图表示、上下文节点表示和更新后的上下文节点表示进行拼接来预测问题的答案。从实验结果验证了提出模型有更高的答案准确率。(2)针对模型不能有效融合问句的知识表示、语义信息和结构信息的问题,设计了一种基于预训练语言模型与图结构联合表示的问答模型。该模型首先根据问题和选项中的实体从知识图谱中构建子图;其次对子图中的多跳信息进行加权聚合并添加辅助关系来得到知识向量表示;然后将知识向量表示输入预训练语言模型进行编码。同时,利用图注意力网络学习实体与其邻居三元组的相关性来更新实体的表示,并将子图池化得到其向量表示;最后利用注意力机制将子图表示和知识表示进行融合来预测问题的答案。实验结果表明,本文模型有更高的答案准确率。(3)综合运用本文提出的模型,设计并开发了基于知识图谱的中医问答系统。该系统通过对用户输入的自然语言问题进行回答并给出相似问题的答案,还具有结果可视化和为知识图谱添加节点和关系的功能,为科研工作者提供了便利。本文的研究工作进一步丰富了基于知识图谱的问答方法研究,在实际领域中有更好的应用价值,相信在未来可以解决更多的实际问题。
能耗管控物联服务平台的设计与实现
这是一篇关于能耗管控,物联网,知识表示,知识推理,回答集编程的论文, 主要内容为随着社会的不断发展,对能源的消耗日益加大,尤其是建筑能耗增速迅猛。校园能耗占社会总能耗的8%左右,具有较高的节能减排潜力。因此众多高校引进了先进的能耗管控系统,取得了较好的节能效果。在能耗管控系统的开发与不断升级的过程中,新兴的物联网技术以及知识表示与知识推理方法为能耗管控物联服务平台的设计提供了新的思路。本文针对校园电力能耗管控场景,设计出一个能耗管控物联服务平台,并提出了一个具有自主性的能耗管控方法。物联服务平台采用前后端分离的设计模式,由平台客户端、能耗管控云平台以及能耗管控设备三部分构成。客户端包括微信小程序端和Web端,负责用户与平台的交互。能耗管控云平台基于Nginx服务器、Spring Cloud框架以及EMQ X框架进行开发。其中Nginx服务器为平台的安全网关,Spring Cloud框架负责搭建面向用户的后台服务器,EMQ X框架负责搭建面向设备的长连接服务器。能耗管控设备包括传感器设备和管控执行设备。传感器设备主要负责采集环境数据。管控执行设备包括DDS228单相导轨电能表和Protoss-PW11数据传输模块,智能电表负责采集用电设备的能耗数据以及控制设备开关,数据传输模块主要负责设备与云平台之间的信息传递。物联服务平台实现了基础服务、用户服务、设备服务、自主管控服务等功能模块。为了实现校园内设备的统一管理,并使设备能够自主响应相关的节能措施,本文提出了一个能耗自主管控方法。首先利用知识表示理论对设备、上下文以及用户等实体进行建模,然后基于节能规则进行知识推理,最后得出用电设备的调控指令。其自主管控算法基于回答集编程(Answer set Programming,ASP)实现,而实现的具体流程为传感器将采集到的环境数据传输给能耗管控物联服务平台,并通过框架表示法将数据进行结构化处理,依据回答集编程的语法规范将提取的信息表征为回答集语句,添加到自主管控模块中进行求解。求解器根据环境信息以及节能规则实现对环境中各类设备开关状态的自主调节,完成对能耗的管控。最后对能耗管控平台进行上线部署和应用。结果表明,本文设计的能耗管控物联服务平台具有较高的扩展性、可用性以及自主性,做到了精细化自主节能,具有一定的应用价值。
面向公安情报分析的知识图谱推理技术研究与实现
这是一篇关于知识图谱,知识表示,知识推理,问答系统的论文, 主要内容为知识图谱是由谷歌提出的一种结构化的数据库,其用三元组的形式来存储实体之间的关联关系,在数据库中这些实体和关系都是以向量的形式来表示,其目的是以一种简洁的结构化信息来刻画实体之间的语义关系,从而达到进行逻辑推理的目的。然而近年来,随着更加完善的知识抽取技术,知识图谱所包含的数据量也在不断增加,结构以及实体之间的语义信息也更加复杂,所以对于在知识图谱上的知识推理技术来说是一个很大的挑战,而研究如何将知识图谱的结构信息应用于知识推理以及如何将知识图谱和知识推理应用于其他应用(如问答系统)也成为了一个非常重要的挑战和任务。本文从知识推理现阶段所面临的挑战出发,研究了一种通过水波网络包含图谱结构信息的新的知识表示技术(TRNG),并将其应用于问答系统。另外针对公共安全领域数据错综复杂不利于机器学习发挥等问题完成了公共安全领域知识图谱的构建。具体包含以下三部分:1.通过借鉴水波网络的扩散过程,将其应用于发现知识图谱的结构信息。本文不仅给出自定义的扩散函数并且设计出能包含知识图谱实体结构信息的目标函数与损失函数,最终通过实验证明了TRNG知识推理技术的可用性以及优越性。2.针对目前知识图谱推理输入输出的单一性问题,在知识图谱中引入自然语言问答系统。通过在编解码模型的输入和输出端加入两个基于知识子图的注意力机制,一方面提高了模型对于问句中语义的理解,另一方面也增强了输出时答案的质量。最终通过在开放实验数据上训练并与其他模型作对比验证了本文提出的基于知识子图注意力机制的自然语言问答模型(QAG)在语义理解以及对话模型中效果的优异。3.从数据获取到三元组抽取再到知识融合,本论文设计并实现了公共安全领域知识图谱的构建工作。在此之上通过使用TRNG算法完成了本知识图谱的知识表示工作并成功将其应用于关系发现等任务。之后在此中文知识图谱上接入自然语言问答系统,实现了知识图谱的人性化输入输出。
翻译模型的负样生成方法研究
这是一篇关于知识表示,知识图谱,翻译模型,负样本的论文, 主要内容为知识表示学习的目标是将知识图谱中的实体和关系表示成稠密低维的向量。目前翻译模型是知识表示学习的代表性模型。基于翻译规则的模型通过优化成对排序函数使得正样本与负样本尽量分离。优化目标决定了翻译模型的训练过程离不开负样本参与,因此负样本的质量对模型训练起到非常重要的作用。然而已有的工作很少考虑负样本的生成策略,大部分基于翻译规则的模型在训练时采用随机替换事实三元组的头尾实体得到负样本,这种负样本生成方法会得很多到低质量的负样本,导致模型收敛速度变慢;并且现有的负样本生成策略均未考虑知识图谱中潜在的噪音和知识图谱本身所具有的社区结构信息。为解决上述问题,本文主要做了如下工作:(1)提出一种基于置信度的负样本生成策略。在带有噪音的知识图谱中提出了负样本置信度概念,在此基础上,进一步提出了一种考虑置信度的负样本生成方法,然后将这种负样本生成策略用于知识图谱中的噪音检测,在带有不同噪音比率的标准数据集中取得了较高的表示模型精度。(2)提出基于社区结构的负样本生成策略。即针对实体稠密的社区与实体稀疏的社区,分别设计不同的负样本选择策略,实验验证了该策略的有效性。
垂直领域知识图谱构建的关键技术研究
这是一篇关于知识图谱构建,垂直领域,命名实体识别,知识表示的论文, 主要内容为知识图谱(Knowledge Graph)是Google于2012年提出的一种高效的知识表达模型。它使用一系列字符串符号映射于真实世界中存在的各种实体或概念中,然后以这些实体或概念间的关联关系为连接符,将不同类型的信息连接在一起,从而构成一张巨大的语义网络图。与传统的信息管理方式相比,知识图谱能够帮助人们更快速有效地获取所需的知识间的逻辑关系,有利于知识间智能推理的实现。其中,垂直领域知识图谱面向特定的行业领域,能够被应用于搜索引擎、智能问答、知识挖掘和决策支持等业务中。因此,其构建技术的研究具有重要意义。本文在调研和分析现有知识图谱构建方法的基础上,研究基于多种数据源构建中文垂直领域知识图谱,并对一些已有的知识图谱构建关键技术提出改进方案。论文的主要贡献包括:1.对于知识抽取中的中文垂直领域命名实体识别任务,本文在经典的字粒度Bi-LSTM-CRF命名实体识别模型基础上,针对中文垂直领域特点,提出了创新性的改进方案。其中,基于注意力的中文词信息增强模型能够通过注意力机制训练出字所属的每个词对字义的贡献程度比,将词向量信息按其语义贡献比例加入字粒度的命名实体识别模型中。另外,还针对汉字的特点提出了一种字形特征融合方案,以增强未登录字的识别效果。本论文将改进方法与经典模型应用于中文电子病历命名实体识别任务,验证结果表明该方法相比经典的字粒度Bi-LSTM-CRF模型取得了较大的识别准确性提升。2.提出融合知识图谱实体描述文本信息的知识图谱表示学习方法。该方法使用Doc2Vec算法得到实体描述文本向量,并将该向量使用单隐层的神经网络与翻译模型进行融合。然后本论文将所述方法应用于所构建的医疗知识图谱中,通过对比实验验证了算法的有效性。3.设计了垂直领域知识图谱构建的整体架构方案,并以医疗领域知识图谱的构建为例,设计并实现了从知识抽取,知识融合,知识存储到知识可视化的一系列具体方案。方法具有较高的可行性,且对于其它垂直领域有较高的普适性。
基于知识图谱表示学习的推荐技术研究与应用
这是一篇关于个性化推荐,知识图谱,知识表示,深度学习的论文, 主要内容为随着信息技术的飞速发展,人类社会进入了一个大数据时代,深刻地改变了人们的生产与社会生活。Web2.0时代,互联网空间中各类应用层出不穷,引发了数据规模呈指数增长形式加速倍增。人们无法有效地从海量数据中获取有价值的信息,导致信息过载问题。推荐系统作为一种重要的信息过滤手段,是当前解决信息过载问题最有效的方法。然而,传统的推荐技术在面临数据稀疏等问题时,其推荐性能往往会急剧下降。近年来,知识图谱技术在学术界和工业界吸引了大量的研究,已被广泛应用于语义搜索和推荐系统等领域并取得重要突破。由于知识图谱中包含了丰富的实体及实体间的关联信息,可以为推荐系统提供潜在的辅助信息,增强推荐算法的挖掘能力,从而能够有效地缓解推荐系统的数据稀疏性问题。然而,基于知识图谱的推荐系统仍面临着一些问题和挑战。一方面,虽然知识图谱表示学习可以在低维空间高效计算实体和关系的语义联系,但是现有的知识表示学习模型更多地关注知识图谱的三元组结构信息,还有大量诸如实体和关系的描述信息、类别信息等与知识有关的异构信息没有得到有效利用。另一方面,如何将领域知识融入到推荐模型中提升推荐模型的语义表达能力,从而应对面向特定领域的推荐任务,将成为影响推荐性能的关键挑战。针对上述问题和挑战,本文对面向领域的知识图谱构建技术、多源信息融合的知识表示方法、以及知识图谱在个性化推荐中的应用进行研究,主要工作包括:(1)构建了面向电影领域的知识图谱。通过对电影领域的知识进行抽象实现本体库的构建;利用知识抽取技术进行数据层的填充;采用Neo4j完成知识图谱的存储。能够为下游的电影推荐任务提供丰富的语义信息支持。(2)提出了一种融合知识图谱关系描述信息的知识表示方法。通过卷积神经网络获取关系的文本表示,并将知识库三元组表示和关系文本表示进行联合学习。针对电影知识图谱的知识特点,设计融合关系描述和实体描述的知识表示方法,能够充分利用丰富的文本描述信息,提升知识图谱的语义表示,增强推荐算法的挖掘能力。(3)在电影知识图谱构建和知识表示学习的基础上,将知识图谱中的关系以及实体描述信息的语义知识融入到深度知识感知网络(Deep Knowledge-Aware Network,DKN)模型中,并将其应用于电影推荐任务,提升了电影推荐的性能。
营养学知识图谱构建及补全技术研究
这是一篇关于营养学知识图谱构建,知识表示,知识图谱补全,机器学习的论文, 主要内容为近年来,随着国民健康意识的提高,人们越来越重视饮食均衡和维护身体健康状况,饮食作为人们在日常生活中最为关注的事情之一,以科学的营养学知识为依据,为国民提供食物、营养的建议具有重要意义。大数据和人工智能技术的高速发展为营养学的研究提供了新的角度。本课题主要基于专业的营养学书籍和网站中的营养学数据,构建了营养学知识图谱并研究了知识图谱的补全方法。我们开展了以下几项工作:(1)本文首先构建了营养学知识概念及关系体系,给出了营养学知识图谱中实体类型以及实体间关系的定义并给出了相关的样例说明。营养学知识图谱中主要包含八种类型的实体和十二种类型的实体间关系。本文获取了《临床营养学》、《中国居民膳食指南》、《中国食物成分表》和39健康网、美食杰网站中的营养学数据。通过对其进行命名实体识别、实体对齐、知识表示等工作,基于词数据构建了营养学知识图谱。(2)接着,本文对营养学知识图谱的关系构建进行了研究。由于知识图谱的数据总是不完备的,为了解决实体间关系缺失的问题,本文提出了营养学实体关系分类模型。使用R-GCN模型和多头注意力机制提取知识图谱中营养学实体的特征,进行分类预测实体间潜在关系。实验对比了基于传统机器学习方法的关系分类模型,结果表明了本文所提出方法的优势性。(3)最后,本文提出了营养学知识图谱补全方法。为了更加全面地考虑三元组中实体与关系间的联系,提出了基于知识表示的链路预测方法来进一步填充不完整的三元组。我们统计分析了营养学数据的特点,并使用Trans E和Rotat E等模型来对营养学知识图谱中的节点进行表示学习,对链路预测进行了实验。此外,还探讨了不同的负例生成方法对链路预测结果的影响。总的来说,本文围绕营养学领域,深入研究了营养学知识图谱的构建,以及营养学知识图谱的补全问题,为基于营养学知识图谱的饮食推荐研究铺平了道路。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码海岸 ,原文地址:https://bishedaima.com/lunwen/46284.html