基于强化学习的知识图谱推理算法研究与实现
这是一篇关于知识图谱,知识图谱推理,强化学习,课程学习,路径质量判别的论文, 主要内容为知识图谱应用广泛,不仅是许多NLP(Natural Language Processing,自然语言处理)子任务的上游任务,还是推荐系统、问答系统中的重要组成部分。但主要来源于各类百科的结构化图谱存在大量缺失的关系,而经过关系抽取的图谱存在许多错误元组,这些问题影响了图谱应用系统的正确性。为解决以上问题,知识图谱推理(Knowledge Graph Reasoning,KGR)算法可用于对不完整的图谱中的事实进行补全,也可用于对抽取得到的图谱进行质量评估。本文工作与贡献如下:1.针对在使用强化学习的实体关系补全过程中出现的虚假路径难题,即智能体游走得到的训练序列(路径)不完美导致智能体被误导,深入课程学习方向的研究,本文第三章按头实体的度(degree)预处理训练样本,使用基于知识的软奖励方法,将智能体在环境中游走得到的路径映射到LSTM策略网络,再使用实体和关系嵌入作为参数组成的打分函数进行软奖励构造,同时在智能体于路径中多次跳转时采用动作丢弃策略进行出边的随机掩盖。最终实现较为准确的实体预测,该算法通用性高且额外开销几乎可忽略不计。MINERVA的改进模型的指标Hit@1,Hit@10,MRR在数据集WN18RR上分别增长了1.7%,1.5%,1.3%,在数据集NELL-995上分别增长了1.9%,4.8%,3.7%。2.针对基于强化学习的知识图谱推理方法以及第三章提出的算法均存在的样本质量未知问题,本文第四章提出复杂语义环境下的路径质量判断算法,使用额外文本信息,以语义相似度的方式对智能体采样到的路径进行质量评估,再把路径评估模块的输出作为强化学习过程中的奖励部分来激励智能体选择高质量路径。该算法可提升在大型数据集FB15K-237上的指标,但依赖于数据集相关的实体描述信息。在数据集FB15K-237上,改进方法的指标Hits@1,Hits@10,MRR分别增加2.2%,6.8%,4.8%;在数据集NELL-995上,Hits@1,Hits@10,MRR分别增加了0.6%,2.8%,1.7%。3.本文实现知识图谱补全与检验系统,知识图谱可作为许多NLP任务的上游任务,也可作为推荐系统和问答系统中的知识补充。本文设计的知识图谱补全系统用于提高应用中的图谱质量。选择结合第三章提出的算法和目前主流的前后端框架构建系统,提供对输入图谱的补全、置信度评估和查询问答功能。使用UMLS数据集对系统进行测试,证明算法的有效性与通用性。
面向低资源场景的命名实体识别数据增强方法研究
这是一篇关于命名实体识别,数据增强,课程学习,预训练语言模型的论文, 主要内容为命名实体识别作为自然语言处理领域的基础任务,被广泛应用于知识图谱构建、信息抽取和对话理解等下游任务。近年来,随着深度学习的迅速发展,基于神经网络模型的命名实体识别方法取得了长足的发展。然而,深度学习方法往往依赖于大量标注数据,且人工标注费时费力,导致其在低资源场景中的表现受限。在实际应用中,命名实体识别任务在生物医学、材料科学等专业领域存在严重的标注数据匮乏问题。为了解决上述问题,现有的一些研究工作采用迁移学习的方法从富资源领域迁移知识,但富资源领域的命名实体识别语料相对有限,且不同领域之间存在差异,因此很难保证知识迁移的效果。另一部分研究者采用数据增强的方法缓解标注数据稀缺带来的影响,但数据增强的研究工作大多集中于句子级别的任务,受词级别细粒度标签的限制,目前针对低资源命名实体识别任务的研究相对较少。本文提出了一种面向低资源命名实体识别任务的词级别数据增强框架,其包含数据增强和数据去噪两部分。本文的创新点以及主要贡献总结如下:(1)提出了一种基于预训练语言模型的标签感知命名实体识别数据增强方法。本文利用预训练语言模型所蕴含的丰富语言学知识对句子中的实体单词进行替换,用于扩充训练数据。为了提升预测单词和标签的一致性,本文预先使用附加标签信息的标注文本对预训练语言模型进行微调,以获取更加匹配原始标签的预测单词序列。实验结果显示本文提出的方法能够有效地缓解低资源命名实体识别任务标注数据稀缺的问题。(2)提出了一种基于课程学习策略的合成数据去噪方法。为了改善合成数据的质量,本文利用预训练的命名实体识别模型,获取合成数据在真实标签上的预测概率,计算置信度评分,以衡量合成数据的质量和学习难易程度。本文设计了三种置信度评价指标(全句平均、实体平均和句子长度),并制定了依据评分高低进行增量训练的课程学习策略用于剔除噪声数据。实验结果表明了该方法能够有效地提高合成数据质量,并进一步提升模型性能。
基于外部知识的多轮对话系统的研究与实现
这是一篇关于多轮对话生成,知识图谱,预训练对话模型,知识选择,课程学习的论文, 主要内容为随着人工智能技术的快速发展和社会日益智能化,人们对智能系统的性能提出了更高的要求。多轮对话系统作为一种重要的人机交互方式,一直备受国内外学术界和工业界的关注,也是人机智能交互领域的重要技术挑战之一。当前对于多轮对话系统的研究主要基于序列到序列的对话生成模型,然而这些对话生成模型往往容易产生多样性和信息量低的安全回复,导致对话无意义和无聊。尤其是当参与者试图就某一特定领域的主题深入讨论时,这个问题尤为严重。因此越来越多研究者开始关注知识驱动的对话系统,探索通过引入外部知识提升对话系统的信息量与多样性。其中的两个关键问题分别是:(1)如何在庞大的外部知识中选择与对话语境相关的知识(2)如何合理地融入选择的知识生成上下文相关且丰富多样的回复。因此,本文以多轮对话中的知识选择和融合知识的多轮对话生成为研究切入点,探索了如何将外部知识图谱应用到对话系统提升系统整体性能。本论文的主要贡献如下:1.提出了一个基于预训练编码器的上下文感知知识选择模型。使用注意力机制获取对话语境感知的对话历史表示。并在知识匹配阶段,通过判断是否需要外部知识和以回复作为后验监督信号的两阶段辅助任务提升了知识选择精准度。与对比模型的实验结果表明,该模型能够根据当前对话语境,更精确地选择与对话相关的知识,从而提升整体回复生成质量。2.提出了一个基于预训练对话模型的融合知识多轮对话生成模型。通过调整预训练模型的输入编码,使其更适用于融合知识的对话生成任务,赋予对话生成模型丰富的知识和良好的泛化能力。此外本文采用非似然损失作为额外的辅助任务,进一步提升了回复生成的多样性。并通过课程学习的联合训练方式,缓解了训练阶段的误差累积现象,提升了生成回复的外部知识一致性和模型鲁棒性。在中文多领域对话数据集KdConV上展开实验,实验结果表明,相较基线模型本文提出的模型在电影、音乐、旅游三个领域F1指标平均提升6%,BLEU-2 提升 8%,Distinct-2 提升%5。3.基于本文所提出的知识驱动多轮对话生成模型,设计和实现了一个多轮对话系统,并引入旅游领域知识,通过多轮交互方式提供实时、准确的旅游资讯,满足用户需求。
基于数据调试和课程对抗训练的推荐技术研究
这是一篇关于推荐系统,数据调试,对抗训练,课程学习的论文, 主要内容为推荐系统在人们的生活中越来越普及,已经成为了研究的热点。为了准确地建模用户的偏好,大量的已有研究工作主要关注于构建更复杂的推荐模型或者引入用户社交关系、物品属性等辅助信息。相比之下,从数据本身的质量与模型训练的控制角度出发的研究则相对较少,而这些因素对于推荐效果也有着重要影响,主要体现在以下两个方面。第一,推荐系统的训练数据由系统中的用户提交,难免存在较多的噪声,相比于那些精准的标注训练数据,数据质量问题可能会影响推荐模型的效果。第二,已有研究工作表明经过常规训练过程得到的推荐模型其用户/物品隐向量质量不高,容易导致模型泛化能力不足。针对数据质量问题,现有工作主要使用一些异常检测方法来帮助过滤噪声数据,这类工作没有显式地考虑检测出来的噪声数据对推荐效果的影响。针对模型训练问题,现有工作表明将对抗训练技术应用到一些推荐模型的训练过程中能够提升模型的泛化效果,然而,现有工作使用对抗训练采用固定的扰动强度,学习曲线不够平滑。因此,对于数据质量问题本文显式地考虑训练数据对模型推荐效果的影响,而对于模型训练问题本文借助课程学习思想考虑使用多种对抗扰动强度进行对抗训练。具体而言,本文的主要内容如下:●基于数据调试的推荐。本文提出了一种针对推荐系统的数据调试方法,能够定位出训练数据中影响整体推荐效果的数据,进而编辑这些数据提高训练得到的模型的推荐效果。实验结果说明,在两个评分数据集上,本文提出的方法都可以通过编辑原始训练数据的方式显著提升推荐效果。●基于课程对抗训练的推荐。本文提出一种基于课程对抗训练的推荐方法,让模型依次在不同扰动强度下进行对抗训练,能够充分发挥对抗训练的作用,从而提高模型的推荐效果。实验结果说明,在两个隐式反馈数据集上,本文提出的方法相比只在一种对抗扰动强度上进行对抗训练,能够取得更好的推荐效果。●面向电影推荐的原型推荐系统。为了验证以上技术的合理性和可行性,本文还针对电影推荐场景,应用以上提出的技术设计与实现了一个原型推荐系统。
从文本到SQL的自动语义解析算法研究
这是一篇关于语义解析,知识增强,实体链接,课程学习的论文, 主要内容为关系型数据库中存储了大量数据,是信息系统的基础和核心。用户可以使用SQL语句来检索数据库中的数据,但这通常对用户的SQL掌握水平有一定要求。为降低用户的学习成本,提高其使用效率和体验,面向关系型数据库的自然语言查询技术应运而生。它允许用户通过自然语言的方式直接与数据库交互从而获取到所需数据,其核心是将自然语言解析成SQL语句(NL2SQL)。然而,目前的NL2SQL模型仍存在如下两点挑战,包括1)问句中存在语义不足的问题;2)数据集信息未被充分利用。本文针对上述挑战展开了以下研究:(1)针对问句中存在语义不足的问题,本文提出了基于知识增强的NL2SQL方法,通过知识图谱来补充自然语言问句中命名实体的背景知识。具体来说,该模型首先使用实体链接技术将问句中的命名实体链接到外部知识图谱上,然后通过引入问句中命名实体在外部知识图谱的四类知识(摘要、类型、标签和语义关系),来增强NL2SQL模型对于问句的理解能力,进而提高解析效果。本文提出了一种基于符号化和两种基于向量化(文本向量化和图谱向量化)的知识增强方案,并系统地论证了引入不同知识的效果及不同增强方式的优劣。(2)针对数据集信息未被充分利用的问题,本文提出基于两阶段课程学习(预习+上课)的NL2SQL方法来使用数据中的信息来指导模型训练。具体来说,预习阶段的目标是训练NL2SQL模型的编码器,为了使其能学习到问句和表格的一致性编码,额外考虑了数据集中问句和表格的对应关系,设计了一个意图(表格)识别的新任务。上课阶段的目标是训练NL2SQL模型,为使其能找到更好的局部最优点,额外考虑了数据集中数据的难度差异,设计了一个模型无关的从简单到困难的课程框架。(3)在Wiki SQL数据集上进行实验。对于基于知识增强的NL2SQL方法,本文分别比较了知识图谱中四类不同的知识在一种符号化和两种向量化的知识增强方法上的效果。实验结果表明使用这四类知识进行符号化和向量化的增强均可以提升模型表现,其中使用类型和语义关系知识进行文本向量化增强的效果最好。对于基于两阶段课程学习的NL2SQL方法,本文分别比较了使用两个阶段以及联合来训练NL2SQL模型的效果。实验结果表明两个阶段都必不可少,预习阶段为NL2SQL模型提供了学到问句和表格一致性表示的编码器,上课阶段为NL2SQL模型提供了更好的训练框架。
大学生IT技术在线学习平台的设计与实现
这是一篇关于在线学习,在线考试,课程学习的论文, 主要内容为目前,我国信息产业及互联网产业发展迅猛,这同时带动促进了各类IT技术的发展,各种前端、后台、数据分析开发框架与技术的更新迭代十分迅速,使得处于该行业的从业人员为了获得好的职业发展及开发出高质量、成熟的产品,必须积极地拓宽自己的视野,加强自我学习和驱动的步伐。同时当代在线教育的兴起突破空间了时间的限制,使得人们可以低成本高效的进行学习,为当前教育形式带来了翻天覆地的变化。而这些信息技术行业从业人员的后备军就是相关专业的大学生,他们的IT技术水平对将来自我职业发展以及未来行业的发展有着重大影响。为此本文着眼于大学生群体,针对目前信息产业大发展、各种IT技术全方位的兴起的情况,分析和设计了大学生IT技术在线学习平台,借助该平台,大学生群体能够更加便捷的获取和学习自己感兴趣的IT技术内容。平台主要包含在线视频课程学习,在线考试等模块,帮助学生群体利用零碎时间,随时随地地进行学习,激发学生的学习兴趣。在系统的构建过程中,严格遵循软件工程的理论方法,整篇文章将分为系统需求分析,系统设计(概要设计与详细设计),系统实现及系统测试几个部分来阐述。平台以B/S的服务模式为用户提供服务,使用Java语言作为开发语言,Eclipse作为开发环境,按照Java开发企业级应用的标准,使用JSP、Servlet等技术,使用mySql数据库,完成了整个项目的开发与部署。实现过程中使用了文件上传脚本、JDBC等关键技术,帮助系统快速高效地开发实现。经过系统测试,结果表明系统功能符合需求,运行稳定、操作便捷、结果正确,基本满足系统设计的最初要求。
基于外部知识的多轮对话系统的研究与实现
这是一篇关于多轮对话生成,知识图谱,预训练对话模型,知识选择,课程学习的论文, 主要内容为随着人工智能技术的快速发展和社会日益智能化,人们对智能系统的性能提出了更高的要求。多轮对话系统作为一种重要的人机交互方式,一直备受国内外学术界和工业界的关注,也是人机智能交互领域的重要技术挑战之一。当前对于多轮对话系统的研究主要基于序列到序列的对话生成模型,然而这些对话生成模型往往容易产生多样性和信息量低的安全回复,导致对话无意义和无聊。尤其是当参与者试图就某一特定领域的主题深入讨论时,这个问题尤为严重。因此越来越多研究者开始关注知识驱动的对话系统,探索通过引入外部知识提升对话系统的信息量与多样性。其中的两个关键问题分别是:(1)如何在庞大的外部知识中选择与对话语境相关的知识(2)如何合理地融入选择的知识生成上下文相关且丰富多样的回复。因此,本文以多轮对话中的知识选择和融合知识的多轮对话生成为研究切入点,探索了如何将外部知识图谱应用到对话系统提升系统整体性能。本论文的主要贡献如下:1.提出了一个基于预训练编码器的上下文感知知识选择模型。使用注意力机制获取对话语境感知的对话历史表示。并在知识匹配阶段,通过判断是否需要外部知识和以回复作为后验监督信号的两阶段辅助任务提升了知识选择精准度。与对比模型的实验结果表明,该模型能够根据当前对话语境,更精确地选择与对话相关的知识,从而提升整体回复生成质量。2.提出了一个基于预训练对话模型的融合知识多轮对话生成模型。通过调整预训练模型的输入编码,使其更适用于融合知识的对话生成任务,赋予对话生成模型丰富的知识和良好的泛化能力。此外本文采用非似然损失作为额外的辅助任务,进一步提升了回复生成的多样性。并通过课程学习的联合训练方式,缓解了训练阶段的误差累积现象,提升了生成回复的外部知识一致性和模型鲁棒性。在中文多领域对话数据集KdConV上展开实验,实验结果表明,相较基线模型本文提出的模型在电影、音乐、旅游三个领域F1指标平均提升6%,BLEU-2 提升 8%,Distinct-2 提升%5。3.基于本文所提出的知识驱动多轮对话生成模型,设计和实现了一个多轮对话系统,并引入旅游领域知识,通过多轮交互方式提供实时、准确的旅游资讯,满足用户需求。
基于外部知识的多轮对话系统的研究与实现
这是一篇关于多轮对话生成,知识图谱,预训练对话模型,知识选择,课程学习的论文, 主要内容为随着人工智能技术的快速发展和社会日益智能化,人们对智能系统的性能提出了更高的要求。多轮对话系统作为一种重要的人机交互方式,一直备受国内外学术界和工业界的关注,也是人机智能交互领域的重要技术挑战之一。当前对于多轮对话系统的研究主要基于序列到序列的对话生成模型,然而这些对话生成模型往往容易产生多样性和信息量低的安全回复,导致对话无意义和无聊。尤其是当参与者试图就某一特定领域的主题深入讨论时,这个问题尤为严重。因此越来越多研究者开始关注知识驱动的对话系统,探索通过引入外部知识提升对话系统的信息量与多样性。其中的两个关键问题分别是:(1)如何在庞大的外部知识中选择与对话语境相关的知识(2)如何合理地融入选择的知识生成上下文相关且丰富多样的回复。因此,本文以多轮对话中的知识选择和融合知识的多轮对话生成为研究切入点,探索了如何将外部知识图谱应用到对话系统提升系统整体性能。本论文的主要贡献如下:1.提出了一个基于预训练编码器的上下文感知知识选择模型。使用注意力机制获取对话语境感知的对话历史表示。并在知识匹配阶段,通过判断是否需要外部知识和以回复作为后验监督信号的两阶段辅助任务提升了知识选择精准度。与对比模型的实验结果表明,该模型能够根据当前对话语境,更精确地选择与对话相关的知识,从而提升整体回复生成质量。2.提出了一个基于预训练对话模型的融合知识多轮对话生成模型。通过调整预训练模型的输入编码,使其更适用于融合知识的对话生成任务,赋予对话生成模型丰富的知识和良好的泛化能力。此外本文采用非似然损失作为额外的辅助任务,进一步提升了回复生成的多样性。并通过课程学习的联合训练方式,缓解了训练阶段的误差累积现象,提升了生成回复的外部知识一致性和模型鲁棒性。在中文多领域对话数据集KdConV上展开实验,实验结果表明,相较基线模型本文提出的模型在电影、音乐、旅游三个领域F1指标平均提升6%,BLEU-2 提升 8%,Distinct-2 提升%5。3.基于本文所提出的知识驱动多轮对话生成模型,设计和实现了一个多轮对话系统,并引入旅游领域知识,通过多轮交互方式提供实时、准确的旅游资讯,满足用户需求。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码港湾 ,原文地址:https://bishedaima.com/lunwen/48391.html