基于句法分析的关系分类和关系抽取方法研究
这是一篇关于关系分类,关系抽取,句法结构,句法依赖,知识图谱的论文, 主要内容为随着信息技术的发展,人类社会进入大数据时代。知识图谱能连接相关数据并建立关系网络,为影视、医疗等行业提供有力支持。关系分类与关系抽取是构建知识图谱的关键技术,深入研究具有重要意义。关系分类旨在实体已知的情况下,预测实体之间的关系类别。关系抽取旨在实体未知的情况下,抽取文本中的关系三元组。句法分析捕获词汇间的依存关系,包含句法结构与句法依赖。使用句法分析技术能显著提升关系分类与关系抽取任务的效果。本文从句法分析的角度出发,对上述任务展开研究,主要研究内容如下:(1)在关系分类任务中,主流方法学习句法分析树的拓扑结构,丰富节点的语义信息。但是忽略了实体对、最近公共祖先节点所在子树的句法结构,导致未充分使用句法信息。此外,现有方法仅使用实体词汇进行关系分类,忽略了其他词汇的贡献,导致语义信息提取不完整。因此,本文提出了基于句法结构和关系指示词嵌入的关系分类模型。首先,通过预处理文本,获得分词结果以及句法分析树,利用统计方法获得关系指示词,增加其他词汇的贡献。然后,利用图同构网络提取句法分析树的句法结构特征,充分利用句法结构信息。其次,结合句法结构特征和关系指示词进行关系分类。最后,在DuIE数据集与SanWen数据集上进行实验,较基线模型F1分数分别提升3.72%与2.08%,验证了句法结构与关系指示词对于关系分类任务的有效性。(2)在关系抽取任务中,大多数方法仅对句法分析树编码,忽略了词汇间的主谓、动宾等句法依赖,导致句法信息丢失。此外,句法分析树中存在噪声信息,会对关系抽取造成负面影响。因此,本文提出了基于BERT预训练模型和句法依赖的关系抽取模型。首先,使用BERT预训练模型获得词嵌入,丰富词汇的语义信息。然后,在不同语境下,利用键值记忆网络学习句法依赖,提取更加丰富的句法信息,增强词嵌入的表达能力;同时,识别句法分析树中的噪声,降低噪声的影响。其次,使用LSTM对特征进行编码、解码,抽取关系三元组。最后,在WebNLG数据集与DuIE数据集上进行实验,较基线模型F1分数分别提升2.3%与4.4%,显示了该模型在关系抽取任务中的优越性。(3)自动化知识图谱构建系统能够对不同领域的知识图谱构建提供支持,降低人工成本。本文结合相关技术,设计了一个自动化知识图谱构建系统,并将提出的关系分类、关系抽取算法应用于知识图谱自顶向下构建过程。
引入外部知识的评论文本情感分析
这是一篇关于方面级情感分析,句法依赖,知识图谱,知识增强的论文, 主要内容为近年来,伴随着人工智能的兴起,自然语言处理技术的发展受到了业界的高度关注,情感分析是其重要研究方向之一。众多社交媒体平台和电商业务的蓬勃发展,为用户提供了很多发表评论和观点的渠道。例如,用户可以随时随地在微博、小红书等社交媒体平台发布自己对当下热点社会性事件的观点和看法;顾客可以在京东、美团等电商平台发表自己对商品、服务等的评价和体验。这些评论文本中包含了民众的情感倾向,具有极大的研究意义。顾客能够根据其他消费者的评论决定商品是否值得购买;企业可以根据顾客评论意见对商品或服务的营销做出完善;政府可以根据大众的言论意见掌握舆论导向,及时做出相应的政策调整。因此基于社交媒体评论的方面级情感分析具有重要的研究价值。目前,基于深度学习的方面级情感分析已经取得了显著的效果,但是仍然存在一些问题,比如:评论文本往往针对性较强,篇幅短且表达形式复杂多样,机器依然较难识别复杂语境下针对评论文本中特定方面的情感倾向;数据人工标注成本高昂,训练样本的不足会限制模型的性能。因此,本文以外部知识作为补充信息,结合句法知识和图卷积网络对模型进行改进,提升方面级情感分析任务性能。本文主要工作如下:评论文本中常常会出现一些新的评价对象和表达形式,为了精确识别方面词的语义信息,本文提出一种基于双注意力融合知识的情感分析模型。首先从外部知识库中检索和方面词相关的概念集合;然后利用两种注意力机制加权概念集中和上下文语义相关程度较高的知识特征;最后结合上下文和基于方面词的外部知识两部分信息作为最终的分类特征表示。模型对文本的理解不仅取决于对词汇语义的理解,还取决于句法知识的辅助,本文提出了一种基于句法、语义、外部知识协同融合的方面级情感分析模型。首先,分别使用双向长短时记忆网络和图卷积网络编码评论文本的语义特征和句法特征,设计语义和句法两个视角的多交互注意力机制获取更好的上下文表示;其次,利用外部知识源Word Net中词汇的语义关系增强上下文的表示,同时借助基于方面词的注意力机制重点加权和方面词相关的知识特征;最后利用一种从局部到全局的多种特征协同融合机制,将融合了句法知识和外部知识的上下文特征表示用于情感分析。实验结果表明句法和外部知识的加入,可以有效提升模型的分类性能。
面向特定领域评论文本的情感分析
这是一篇关于方面级情感分析,句法依赖,领域特征,知识图谱,知识增强的论文, 主要内容为随着电商行业以及各类社交媒体的蓬勃发展,大量用户在互联网平台上发表了产品评论。社交媒体平台的兴起为情感分析任务提供了广泛的数据基础。使用自然语言处理技术对网络上的评论数据进行合理处理具有巨大的商业价值和社会价值。基于此,本文以特定领域的评论文本作为研究对象,对该任务进行重点研究。由于网络中的情感表达或含蓄或奔放、或笼统或具体,各具特点,故而情感分析任务成为自然语言处理中一项较为复杂的问题。现阶段的情感分析系统大多通过标签数据训练神经网络模型,忽略了情感分析任务本身的特性,导致了以下几个问题:第一,用户的情感表达在面向不同领域时通常具有不同的特点,而领域特征却常常被忽视,没有得到充分的利用;第二,人类的语言表达通常既简洁又丰富,许多隐藏在句子中的信息人类不言而喻,然而网络中的评论语句却不会对这类知识进行补充说明,因此很难实现机器对人类语言的充分理解;第三,传统的情感分类框架仅仅编码了评论语句的文本语义信息,忽视了句法结构信息,但句法特征也能够为情感分类模型提供参考。针对以上不足,本文分别从领域特征的利用、先验知识的引入两个角度进行深入探究,以实现现阶段情感分类研究的知识增强。同时,本文在两种研究方案中都引入了句法依赖信息以及评价对象与上下文之间的交互关系,使得情感分类模型的整体性能得到了有效提升。具体来讲,本文的主要工作如下:(1)本文在解决细粒度情感分类问题时,首先针对现有的词向量模型没有对特定的领域进行优化的问题,提出了通过卷积神经网络将评论文本的通用表示与其领域特征进行融合的策略,实现了通用表示与领域特征的双嵌入。其次为了解决通用的文本表示方法无法获取与词语相关的概念知识与背景知识的缺陷,本文通过引入Microsoft Concept Graph中的实体概念知识,改进了词向量的特征表达能力,提高了特征的多样性。实验结果表明,领域特征和实体概念等先验知识可以有效提升模型的分类结果。(2)在编码过程中考虑词性信息与评论语句的句法结构是增强知识的另一种渠道。本文通过依存句法分析获取了文本中的词性信息以及词与词之间的句法关系,将单词作为节点、词与词之间的关系作为连边,构建了依存句法图。在词表示阶段后的特征抽取框架中,本文通过图卷积网络充分提取了文本的词性和句法信息,同时也考虑了评价对象与上下文的交互作用对该任务的重要影响。相关实验结果证明句法依存关系对细粒度情感分类任务有着积极的影响。
面向特定领域评论文本的情感分析
这是一篇关于方面级情感分析,句法依赖,领域特征,知识图谱,知识增强的论文, 主要内容为随着电商行业以及各类社交媒体的蓬勃发展,大量用户在互联网平台上发表了产品评论。社交媒体平台的兴起为情感分析任务提供了广泛的数据基础。使用自然语言处理技术对网络上的评论数据进行合理处理具有巨大的商业价值和社会价值。基于此,本文以特定领域的评论文本作为研究对象,对该任务进行重点研究。由于网络中的情感表达或含蓄或奔放、或笼统或具体,各具特点,故而情感分析任务成为自然语言处理中一项较为复杂的问题。现阶段的情感分析系统大多通过标签数据训练神经网络模型,忽略了情感分析任务本身的特性,导致了以下几个问题:第一,用户的情感表达在面向不同领域时通常具有不同的特点,而领域特征却常常被忽视,没有得到充分的利用;第二,人类的语言表达通常既简洁又丰富,许多隐藏在句子中的信息人类不言而喻,然而网络中的评论语句却不会对这类知识进行补充说明,因此很难实现机器对人类语言的充分理解;第三,传统的情感分类框架仅仅编码了评论语句的文本语义信息,忽视了句法结构信息,但句法特征也能够为情感分类模型提供参考。针对以上不足,本文分别从领域特征的利用、先验知识的引入两个角度进行深入探究,以实现现阶段情感分类研究的知识增强。同时,本文在两种研究方案中都引入了句法依赖信息以及评价对象与上下文之间的交互关系,使得情感分类模型的整体性能得到了有效提升。具体来讲,本文的主要工作如下:(1)本文在解决细粒度情感分类问题时,首先针对现有的词向量模型没有对特定的领域进行优化的问题,提出了通过卷积神经网络将评论文本的通用表示与其领域特征进行融合的策略,实现了通用表示与领域特征的双嵌入。其次为了解决通用的文本表示方法无法获取与词语相关的概念知识与背景知识的缺陷,本文通过引入Microsoft Concept Graph中的实体概念知识,改进了词向量的特征表达能力,提高了特征的多样性。实验结果表明,领域特征和实体概念等先验知识可以有效提升模型的分类结果。(2)在编码过程中考虑词性信息与评论语句的句法结构是增强知识的另一种渠道。本文通过依存句法分析获取了文本中的词性信息以及词与词之间的句法关系,将单词作为节点、词与词之间的关系作为连边,构建了依存句法图。在词表示阶段后的特征抽取框架中,本文通过图卷积网络充分提取了文本的词性和句法信息,同时也考虑了评价对象与上下文的交互作用对该任务的重要影响。相关实验结果证明句法依存关系对细粒度情感分类任务有着积极的影响。
基于句法分析的关系分类和关系抽取方法研究
这是一篇关于关系分类,关系抽取,句法结构,句法依赖,知识图谱的论文, 主要内容为随着信息技术的发展,人类社会进入大数据时代。知识图谱能连接相关数据并建立关系网络,为影视、医疗等行业提供有力支持。关系分类与关系抽取是构建知识图谱的关键技术,深入研究具有重要意义。关系分类旨在实体已知的情况下,预测实体之间的关系类别。关系抽取旨在实体未知的情况下,抽取文本中的关系三元组。句法分析捕获词汇间的依存关系,包含句法结构与句法依赖。使用句法分析技术能显著提升关系分类与关系抽取任务的效果。本文从句法分析的角度出发,对上述任务展开研究,主要研究内容如下:(1)在关系分类任务中,主流方法学习句法分析树的拓扑结构,丰富节点的语义信息。但是忽略了实体对、最近公共祖先节点所在子树的句法结构,导致未充分使用句法信息。此外,现有方法仅使用实体词汇进行关系分类,忽略了其他词汇的贡献,导致语义信息提取不完整。因此,本文提出了基于句法结构和关系指示词嵌入的关系分类模型。首先,通过预处理文本,获得分词结果以及句法分析树,利用统计方法获得关系指示词,增加其他词汇的贡献。然后,利用图同构网络提取句法分析树的句法结构特征,充分利用句法结构信息。其次,结合句法结构特征和关系指示词进行关系分类。最后,在DuIE数据集与SanWen数据集上进行实验,较基线模型F1分数分别提升3.72%与2.08%,验证了句法结构与关系指示词对于关系分类任务的有效性。(2)在关系抽取任务中,大多数方法仅对句法分析树编码,忽略了词汇间的主谓、动宾等句法依赖,导致句法信息丢失。此外,句法分析树中存在噪声信息,会对关系抽取造成负面影响。因此,本文提出了基于BERT预训练模型和句法依赖的关系抽取模型。首先,使用BERT预训练模型获得词嵌入,丰富词汇的语义信息。然后,在不同语境下,利用键值记忆网络学习句法依赖,提取更加丰富的句法信息,增强词嵌入的表达能力;同时,识别句法分析树中的噪声,降低噪声的影响。其次,使用LSTM对特征进行编码、解码,抽取关系三元组。最后,在WebNLG数据集与DuIE数据集上进行实验,较基线模型F1分数分别提升2.3%与4.4%,显示了该模型在关系抽取任务中的优越性。(3)自动化知识图谱构建系统能够对不同领域的知识图谱构建提供支持,降低人工成本。本文结合相关技术,设计了一个自动化知识图谱构建系统,并将提出的关系分类、关系抽取算法应用于知识图谱自顶向下构建过程。
面向特定领域评论文本的情感分析
这是一篇关于方面级情感分析,句法依赖,领域特征,知识图谱,知识增强的论文, 主要内容为随着电商行业以及各类社交媒体的蓬勃发展,大量用户在互联网平台上发表了产品评论。社交媒体平台的兴起为情感分析任务提供了广泛的数据基础。使用自然语言处理技术对网络上的评论数据进行合理处理具有巨大的商业价值和社会价值。基于此,本文以特定领域的评论文本作为研究对象,对该任务进行重点研究。由于网络中的情感表达或含蓄或奔放、或笼统或具体,各具特点,故而情感分析任务成为自然语言处理中一项较为复杂的问题。现阶段的情感分析系统大多通过标签数据训练神经网络模型,忽略了情感分析任务本身的特性,导致了以下几个问题:第一,用户的情感表达在面向不同领域时通常具有不同的特点,而领域特征却常常被忽视,没有得到充分的利用;第二,人类的语言表达通常既简洁又丰富,许多隐藏在句子中的信息人类不言而喻,然而网络中的评论语句却不会对这类知识进行补充说明,因此很难实现机器对人类语言的充分理解;第三,传统的情感分类框架仅仅编码了评论语句的文本语义信息,忽视了句法结构信息,但句法特征也能够为情感分类模型提供参考。针对以上不足,本文分别从领域特征的利用、先验知识的引入两个角度进行深入探究,以实现现阶段情感分类研究的知识增强。同时,本文在两种研究方案中都引入了句法依赖信息以及评价对象与上下文之间的交互关系,使得情感分类模型的整体性能得到了有效提升。具体来讲,本文的主要工作如下:(1)本文在解决细粒度情感分类问题时,首先针对现有的词向量模型没有对特定的领域进行优化的问题,提出了通过卷积神经网络将评论文本的通用表示与其领域特征进行融合的策略,实现了通用表示与领域特征的双嵌入。其次为了解决通用的文本表示方法无法获取与词语相关的概念知识与背景知识的缺陷,本文通过引入Microsoft Concept Graph中的实体概念知识,改进了词向量的特征表达能力,提高了特征的多样性。实验结果表明,领域特征和实体概念等先验知识可以有效提升模型的分类结果。(2)在编码过程中考虑词性信息与评论语句的句法结构是增强知识的另一种渠道。本文通过依存句法分析获取了文本中的词性信息以及词与词之间的句法关系,将单词作为节点、词与词之间的关系作为连边,构建了依存句法图。在词表示阶段后的特征抽取框架中,本文通过图卷积网络充分提取了文本的词性和句法信息,同时也考虑了评价对象与上下文的交互作用对该任务的重要影响。相关实验结果证明句法依存关系对细粒度情感分类任务有着积极的影响。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码小屋 ,原文地址:https://bishedaima.com/lunwen/52543.html