面向领域知识图谱构建的关键技术研究
这是一篇关于知识图谱,命名实体识别,实体关系抽取,多任务学习,指针网络,多头选择机制的论文, 主要内容为知识是人类文明发展的基石,随着科技的进步,知识图谱提供了一个全新的手段,使得人们能够更好地管理和运用知识。近年来,伴随着深度学习技术的迅猛发展,为自然语言处理任务提供了强有力的支撑,使得知识图谱的研究与应用上也取得了巨大的成就。通过知识抽取,可以将复杂的信息转换为有序的、可操作的、可视化的知识三元组,进而运用知识融合手段构建领域知识图谱。基于当前技术和算法,本文综合分析了海量的金融文本数据,构建出一个能够为金融行业提供全面支持的知识图谱。论文的主要工作如下:(1)本文提出了一种基于多任务学习和指针网络的命名实体识别方法,通过采用多任务学习方法有效地减少任务之间的累计误差,并且引入指针网络模型,结合How Net知识库设计针对嵌套实体的多层标注方法,最终实现了面向特定领域的命名实体识别。最后在公开数据集和领域数据集都进行了充分实验,结果表明本文模型具有一定的先进性。(2)本文提出了一种基于实体相对位置表示的多头选择关系抽取方法,模型引入多头选择框架结合实体相对位置表示可以有效地判断领域实体关系,并将其分类,从而挖掘出潜在的信息,减少错误标签带来的影响,进而提高模型对领域文本抽取的准确性。同样,在公开数据集和领域数据集上都进行了实验,以表明模型的有效性。(3)为了建立领域知识图谱,本文首先从特定领域收集数据,然后抽取领域实体,补充领域词典,构建关系集,完善关系类别,之后利用模型进行关系抽取,从而得到一个完整的知识集合,最终,通过知识融合,可以建立、存储和可视化金融领域的知识图谱。经过严格的系统测试,表明本文提出的金融知识图谱在针对特定领域应用方面表现出色。
基于联合学习的生物医学实体关系抽取方法研究
这是一篇关于实体关系抽取,联合学习,序列标注,指针网络,深度学习的论文, 主要内容为生物医学实体关系抽取作为信息抽取的一项基础任务,对于构建生物医学问答系统以及知识图谱等提供重要的理论基础和应用价值。目前业界实体关系抽取通常采用流水线方法,将命名实体识别和关系抽取作为两个独立子任务进行,这种方法将会造成误差传播、实体冗余、交互缺失等问题,而且在实际生物医学信息抽取过程中,由于命名实体识别作为关系抽取的基础,两者关系密切,命名实体识别的结果将极大影响关系抽取的结果。因此本文采用联合学习方法进行生物医学实体关系抽取,针对以上问题,进行了相关研究和改进,主要研究内容如下:一、为解决生物医学文本中实体间的重叠关系问题,采用一种标注策略和提取规则将实体关系抽取抽象为序列标注任务。鉴于目前序列标注模型提取特征单一问题,采用多维特征嵌入,扩展模型提取特征的维度。为了提高模型语义表征能力,提出Bi ONLSTM-GDCNN集成模型,将LSTM与有序神经元整合,提取文本时序特征基础上学习句子层级结构信息,引入与空洞卷积相结合的门控关系层自适应选择依赖词建模单词间关系,从而进一步提高获得局部空间特征的能力。引入注意力集成方式将两模块信息整合,丰富语义信息的同时避免出现信息相互抵消以及信息冗余问题。二、为解决实体间重叠关系的同时,避免标注策略较为复杂时可能影响模型性能。将实体间关系建模为头实体映射到尾实体的函数,首先抽取句中头实体,然后对每个头实体在各关系类型抽取尾实体,通过级联指针网络将每个关系类型视为互不影响的子空间而不是共享概率空间,从而解决实体间重叠关系问题。考虑到头实体特征对后续尾实体和实体间关系预测的重要程度,对注意力机制进行改进,引入相对位置信息提高头实体与其他元素间的联系。为解决文本中目标词比例较小造成样本不均衡问题,引入Focal Loss损失函数进行模型训练。最后,对抗训练在提高模型鲁棒性的同时可以使模型性能进一步提高。
基于指针网络的5G核心网资源分配研究
这是一篇关于网络切片,网络功能虚拟化,服务功能链,指针网络的论文, 主要内容为第五代移动网络技术中,软件定义网络(Software Defined Network,SDN)和网络功能虚拟化(Net Functions Virtualization,NFV)打破传统的网络业务模式,实现物理基础设施与网络服务的解耦,让网络切片成为可能。网络切片作为5G的关键技术之一,允许在公共物理基础设施之上创建可独立配置、满足特定需求的虚拟网络。基于SDN和NFV的设施架构,将网络切片看作是一组满足用户服务请求的网络功能块按一定次序组合成的服务功能链。网络切片的资源分配问题则与服务功能链合理部署与调度密切相关。综上,论文将对虚拟化技术背景的网络切片技术进行相关研究,并针对5G三大应用场景之一的低时延高可靠场景,结合核心网子切片的特性对资源分配问题建模,并作出以下两项优化工作。首先,将服务功能链的部署阶段建模成底层物理网络与虚拟服务网络的映射问题,提出一种基于动态网络的节点链路两阶段映射算法MPNP。将指针网络模型融合多头注意力机制、Glimpse机制与相对位置编码进行改进,实现节点映射策略。再使用K最短路径算法寻找出传输时延最低的链路资源映射方案。最后结合主动搜索的策略梯度方法指引模型朝服务时延降低的方向优化。通过仿真实验,将MPNP方案与未改进指针网络方案、资源延迟均衡的启发式方案比较,验证了其对平均服务时延的有效降低和部署成功率的有效提高,同时保证不错的资源利用水平。其次,在整体网络切片部署的过程中,持续性到来的服务请求可能造成响应的网络切片排队,调度顺序将影响整体网络服务性能。因此,在上述资源分配算法上进一步实现联合优化,提出一种多级多目标的服务功能链调度队列模型。根据切片映射失败情况实现2级调度队列,并基于融合多头注意力的指针网络对当前时刻等候队列中的服务功能链进行调度。最后结合服务功能链的部署阶段实现一种联合资源部署算法MMS,采用PPO算法进行模型训练。MMS算法将以网络切片的总体时延与等候队列中切片的剩余存活时间进行多目标优化,在满足低时延的需求下提高一定可靠性与公平性。最后完成两组对比试验,一组是基于线性加权和对多目标间不同权重的MMS算法进行测验,根据平均总时延、平均剩余存活时间、平均部署成功率及平均资源利用率综合选择出性能最贴切场景需求的权重比作为最终提出的MMS算法。另一组实验以平均总目标值、平均资源利用率和平均等候时延作为评估指标,将本文提出的MMS调度部署联合算法与先来先服务调度、基于特征重要度优先级调度的部署联合算法进行比较。实验结果证明在低时延的需求场景下,MMS算法具有更低的平均等候时延,在降低平均总时延与提高总资源利用率的表现上都更加出色。最后,论文就全文的研究工作进行总结,对其中遇到的问题开展讨论与思考,并展望未来研究工作的方向内容。
面向城市公共安全多源异构数据的知识融合技术研究
这是一篇关于知识融合,关系抽取,实体对齐,指针网络,图卷积网络的论文, 主要内容为近年来知识图谱成为管理杂乱数据的有效方法,各领域都在引入知识图谱作决策支持。在城市公共安全方面,可以将与意外事故有关的相关信息转换成知识聚集在一起,从而形成一张完整的知识图谱,用于辅助工作人员更准确预测危险的发生。知识融合是构建知识图谱的核心工作,然而复杂的数据形式和语义关系容易导致知识抽取过程中的信息丢失和实体匹配产生的精确度较低的问题。为此,本文对构建过程中关系抽取和实体对齐两个重要子任务进行研究。主要工作包括以下几个方面:(1)提出基于指针网络联合解码的实体关系抽取模型。传统关系抽取方法忽略了实体与关系之间的交互,并且不能充分抽取重叠三元组。针对此问题,本文采用端到端模型,以双向GRU作为编码器提取句子上下文特征,指针网络作为解码器解码关系三元组。另外加入关系层注意力机制增强实体与关系之间的交互。通过在每个关系下解码头尾实体,可以减少模型对不相关实体的关注。实验结果表明本文模型能够在一定程度上提升关系抽取的能力,具有较好的抽取效果。(2)提出联合结构和属性的实体对齐模型。基于图卷积网络的实体对齐通常作用于单一关系类型的无向图,容易导致对应实体学习的嵌入结果不一致。本文通过拆分非对称邻接权重矩阵构建双向图卷积网络方法,学习实体前后向隐藏特征,实现实体的完整表示;同时通过变异系数法为属性加权,选择最有代表性的实体局部语义信息,有效提高实体对齐精确度。实验结果表明,该方法与现有基于嵌入的实体对齐方法相比精确度有所提高,同时保持较高的平均倒数秩。(3)基于上述两个子模型构建知识融合系统的基础框架。网络数据的碎片化和异构性对知识融合带来了挑战,根据不同场景融合所需数据已成为当前研究的重点。本文结合数据获取与处理、实体关系抽取以及实体对齐等子模块,构建知识融合系统框架,并使用获取的基于科技冬奥的公共安全数据验证框架的有效性。该框架对智能化服务提供了有力的技术支持。
基于联合学习的生物医学实体关系抽取方法研究
这是一篇关于实体关系抽取,联合学习,序列标注,指针网络,深度学习的论文, 主要内容为生物医学实体关系抽取作为信息抽取的一项基础任务,对于构建生物医学问答系统以及知识图谱等提供重要的理论基础和应用价值。目前业界实体关系抽取通常采用流水线方法,将命名实体识别和关系抽取作为两个独立子任务进行,这种方法将会造成误差传播、实体冗余、交互缺失等问题,而且在实际生物医学信息抽取过程中,由于命名实体识别作为关系抽取的基础,两者关系密切,命名实体识别的结果将极大影响关系抽取的结果。因此本文采用联合学习方法进行生物医学实体关系抽取,针对以上问题,进行了相关研究和改进,主要研究内容如下:一、为解决生物医学文本中实体间的重叠关系问题,采用一种标注策略和提取规则将实体关系抽取抽象为序列标注任务。鉴于目前序列标注模型提取特征单一问题,采用多维特征嵌入,扩展模型提取特征的维度。为了提高模型语义表征能力,提出Bi ONLSTM-GDCNN集成模型,将LSTM与有序神经元整合,提取文本时序特征基础上学习句子层级结构信息,引入与空洞卷积相结合的门控关系层自适应选择依赖词建模单词间关系,从而进一步提高获得局部空间特征的能力。引入注意力集成方式将两模块信息整合,丰富语义信息的同时避免出现信息相互抵消以及信息冗余问题。二、为解决实体间重叠关系的同时,避免标注策略较为复杂时可能影响模型性能。将实体间关系建模为头实体映射到尾实体的函数,首先抽取句中头实体,然后对每个头实体在各关系类型抽取尾实体,通过级联指针网络将每个关系类型视为互不影响的子空间而不是共享概率空间,从而解决实体间重叠关系问题。考虑到头实体特征对后续尾实体和实体间关系预测的重要程度,对注意力机制进行改进,引入相对位置信息提高头实体与其他元素间的联系。为解决文本中目标词比例较小造成样本不均衡问题,引入Focal Loss损失函数进行模型训练。最后,对抗训练在提高模型鲁棒性的同时可以使模型性能进一步提高。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕业设计货栈 ,原文地址:https://bishedaima.com/lunwen/54708.html