一种语法依赖的方面级情感模型及其开源评论分析应用
这是一篇关于方面级情感分析,情感知识,开源研究,依赖语法的论文, 主要内容为情感分析和观点挖掘作为自然语言处理领域的重要方向,可以获取关键的情感信息。随着社交网站的兴起,越来越多的人在网络上发表观点,每天会产生海量带有主观情感的评论文本。针对评论文本的情感分析对于舆情管控、商业营销、社会治理等有极为重要的意义。方面级情感分类是一项实体级别的情感分类任务,可以判断一段文本中多个特定方面的情感极性,相对于句子级可以获取到更多有价值的信息。近年来,针对方面级情感分类任务的大多数研究将情感知识引入预训练模型中,该类方法忽略了文本中方面词与情感词之间的依赖关系。如何更为精准的捕获文本中的情感信息是一个亟待解决的问题。现存的一些情感分类模型主要应用于餐厅电商领域,而针对开源领域评论文本的方面级情感分析研究较少。针对上述问题,本文提出一种基于语法依赖的方面级情感分类预训练模型(Aspect Sentiment Knowledge-Ro BERTa,ASK-Ro BERTa)。本文主要工作如下:(1)通过整合How Net和Sentic Net,并采用情感倾向点互信息算法对评论情感词典进行扩充,构建了领域情感词典。本文基于词性标注和依存语法提出了一套方面词挖掘规则,其中包含了主规则、并列规则和复合规则。主规则挖掘单个词构成的方面词,并列规则可以获取到单个情感词修饰的多个方面词。较多方面词由多个名词构成,复合规则可以将多个名词进行组合构成完整的方面词。(2)本文对预训练模型的掩码机制进行优化,修改预训练模型的掩码规则,定义“方面-情感”词对预测和单词极性预测目标函数,使得模型可以挖掘句子中方面词和情感词之间的依赖关系。(3)基于4个Sem Eval标准数据集,采用ACC和Macro-F1作为评价指标,与多种主流基线模型展开大量实验,结果证明本文模型能有效提高模型预测的准确率。最后将模型应用于开源评论文本中,挖掘开源领域的方面词并进行情感分析得出结论。
方面级情感分析及其在电商平台上的应用研究
这是一篇关于方面级情感分析,编码网络,注意力机制,图卷积网络,词嵌入模型的论文, 主要内容为随着电子商务平台的发展,用户习惯于通过浏览商品评论了解商品的细节和质量。商品评论包含消费者对商品各方面的评价。因此,能够有效地分析出评论中商品各方面的情感极性不仅可以帮助用户全面的了解商品的信息还可以为生产商提供改进产品质量的依据。传统的情感分析任务可以通过分析文本的内容来判断文本整体的情感极性,但是不能给出文本中某部分的情感倾向。作为情感分析任务的一项细粒度任务,方面级情感分析是通过分析句子文本,从而给出不同方面对应的情感极性。因此,方面级情感分析对于分析电商平台的商品评论有直接的应用意义。本文以方面级情感分析任务所出现的问题作为研究重点,并致力于寻找解决方法,提出具有更好分类效果的模型。本文所做工作如下:(1)针对现有结合单词词性信息的方面级情感分析方法仅提取到浅层的词性特征而忽略了单词与词性之间的联系这一问题,本文提出了一种深度词嵌入模型的混合注意力网络(ELMo based Hybrid Attention Network,EHAN)。与现有网络不同,该模型不仅将深度词嵌入模型与并行编码网络相结合来捕获文本信息的情感特征,还以注意力机制的形式将单词词性的语义信息和词性信息进行融合,加强对词性的特征提取,使模型能够学习到更丰富的情感特征,以用于最终的情感极性分类。实验结果表明,与现有的基于语义信息来建模的模型相比,EHAN模型的分类效果更好,验证了所提方法可以有效地改善现有方面级情感分析方法的性能。(2)针对现有基于图卷积网络来获取句子的语法信息时不能有效利用依赖关系树的边缘信息,忽略了具体的依赖关系类型这一问题,本文提出了一种基于图卷积网络的多注意力机制的模型(Multi-Attention Mechanism based on Graph Convolutional Networks,MAMGCN)。该模型将依赖关系类型加入到语法图中,以帮助图卷积网络获取更准确的语法信息;其次,为了能够充分获取句子中的关键情感信息,模型引入语法注意力机制和多头注意力机制。在捕获语义方面的情感特征信息的同时也能学习到语法方面的有效特征信息,从而提高模型的分类准确率。在四个公开数据集上的实验结果表明,本文所提模型较基准模型在分类效果上有显著提升,验证了模型的有效性。(3)为了能够将方面级情感分析进行应用,设计了基于电商平台的商品评论方面级情感分析系统,从而将已经训练好的本文所提模型部署到系统中。具体来说,利用基于Python的爬虫框架Scrapy采集电商平台上多个领域的商品评论,并对数据进行预处理,使数据更趋于规范化,方便模型进行情感分类。然后,系统根据网络模型实现情感分析、结果可视化以及极性对比的功能,以供用户使用。
基于深度学习的方面级情感分析方法研究
这是一篇关于方面级情感分析,深度学习,LSTM,多头自注意力机制,依赖树的论文, 主要内容为随着互联网的快速发展,人们几乎每天都会在电商平台和社交软件中发表自己的观点、看法。通过情感分析技术能够自动从海量的等带有情感极性的评论文本中获取人们对事件、商品的情感倾向,这对于很多行业来说都有着巨大的价值。然而传统的粗粒度情感分析已经不能够满足人们的需求,人们往往希望获得对于某些事物或商品更加全面的了解。细粒度的方面级情感分析旨在分析不同方面所表达的不同情感,能够帮助人们更好的了解事物或商品的各个方面。在本文针对方面级情感分析任务进行了重点研究,提出两种深度学习模型,主要工作包括以下两点:(1)针对上下文和方面信息之间的交互信息和位置信息,提出了基于局部信息选择机制(Local Information Selection,LIS)的方面级情感分析模型。LIS首先根据上下文单词与方面词之间的位置关系计算语义相对距离(Semantic Relative Distance,SRD),利用两种处理方式和SRD阈值将句子分为两部分局部信息。然后设计规则选择出合适的局部信息与全局信息进行拼接。最后利用多头自注意力机制学习包含句子表征,输出隐藏状态并分类。模型在Sem Eval 2014的Restaurant、Laptop数据集和Twitter数据集上进行实验验证,结果表明LIS模型在三个数据集上分别达到87.24%、82.97%与75.58%的准确率。(2)针对LIS模型在获取局部信息时丢失句子原本的句法和语义的问题,以及对于学习句子表征的学习过于简单,提出了基于依赖树距离模型(Dependency-Tree Distance,DTD)。DTD模型使用句法依赖树结构重新定义语义相对距离(SRD),根据上下文单词与方面词在依赖树结构中的位置计算SRD,并据此截取局部信息。模型使用LSTM网络和多头(自)注意力机制学习句子表征,设计了交互式学习方式,能够更加深层次的提取句子信息,并将每一步的输出通过池化操作,在最后进行拼接作为最终的句子表达用于分类。模型在Sem Eval 2014的Restaurant、Laptop数据集和Twitter数据集上进行实验验证,结果表明DTD模型在三个数据集上分别达到87.91%、84.68%与75.81%的准确率。两种模型都分别采用了Glo Ve和BERT预训练词向量模型,并与三种Non-BERT模型和三种BERT-base模型进行对比实验,以验证模型的有效性。另外,设置了不同的SRD阈值进行对比实验,结果表明两种模型在Sem Eval2014和Twitter数据集上都有不同的SRD阈值以达到最优效果。
面向用户评论的方面级情感分析研究
这是一篇关于自然语言处理,方面级情感分析,预训练模型,提示学习,旋转位置编码的论文, 主要内容为随着社交媒体和电商平台的普及和发展,互联网中积累了海量用户评论文本,这些评论文本蕴含着丰富的情感信息。分析和挖掘评论文本能够明确用户的情感倾向,为政府、商家、消费者提供全面的指导建议和决策参考。然而,由于评论文本呈指数级增长,仅依赖人工处理已无法胜任此任务,如何对评论文本进行情感分析和挖掘是当前自然语言处理领域的研究热点。方面级情感分析作为一种细粒度情感分析任务,旨在识别特定方面的情感倾向,对评论文本进行方面级情感分析能够挖掘不同方面的情感极性,对商业、社会和政治领域具有重要的研究意义和参考价值。随着深度学习技术的发展,通过预训练模型提取语义特征逐渐成为目前情感分析领域的主流方法,但大多数情感分析模型存在上下游任务之间差距较大、方面词与上下文语义特征交互不足、语义特征提取比较单一等。因此,针对用户评论的特点,本文提出一种融合提示知识的方面级情感分析方法和融合位置感知的多特征方面级情感分析模型。本文的主要工作如下:(1)针对当前情感分析方法存在上下游阶段任务不一致、难以有效建模方面词和上下文之间语义关联的问题,提出一种融合提示知识的方面级情感分析方法。先手动构造提示文本,将该提示文本、原始句子和方面词共同作为BERT模型的输入,以有效捕获方面词和上下文的语义联系,提升模型对情感分析任务的感知能力;再构建情感标签词表,并将其融入情感极性映射层,减少模型的搜索空间,以利于模型获取标签词表中的语义知识,增强模型的学习能力。所提方法在Sem Eval2014Task4的Restaurant和Laptop以及Chn Senti Corp数据集上的F1值分别达到了77.42%、75.20%、94.89%,均优于其他对比模型,验证了所提方法的有效性。(2)针对现有情感分析模型存在提取语义特征较单一、长文本语义信息提取不足的问题,提出一种融合位置感知的多特征方面级情感分析模型。该模型首先在输入中添加提示文本,引导预训练模型适配下游任务,增强模型的语义特征提取能力;然后采用基于旋转位置编码的Roformer模型对评论文本的位置信息和词级别语义信息进行建模,以充分挖掘位置关系蕴含的语义特征,获取与方面词相邻的重要信息;最后通过Bi LSTM和卷积神经网络构建融合位置信息的多特征提取层,捕获长文本中含有位置信息的全局和局部语义特征,并融合上述多层次特征,以提升长文本的上下文语义相关性,增强方面词与相邻重要信息之间的交互。该模型在AI challenger 2018数据集上的F1值达到77.81%,与其他主流模型相比具有一定的优势,验证了论文模型的有效性。
面向细粒度情感分析的观点实体联合抽取技术
这是一篇关于方面级情感分析,情感三元组抽取,跨度共享,语法依赖的论文, 主要内容为细粒度情感分析是自然语言处理中的一项重要任务,其目的是自动识别出文本中所表达的情感信息。随着互联网和社交媒体的广泛普及,用户在网上发布评论、留言等文本的频率越来越高。这些文本通常包含他们的情感表达,因此对这些文本进行精细化的情感分析,可以帮助商家、政府机构以及学者们更好地了解市场趋势、用户需求和社会舆情等重要信息。因此,细粒度的情感分析具有非常重要的应用价值。为了能较为完整地解决细粒度情感分析任务,研究者们提出了方面级情感三元组抽取(Aspect Sentiment Triplet Extraction,ASTE)任务作为解决方案,即从文本中抽取出由方面词、观点词和方面级情感极性三者构成的情感三元组。本文在ASTE任务上进行展开工作:(1)本文提出了一个名为SSJE(Span-Sharing Joint Extraction)框架,旨在解决细粒度情感分析中的ASTE任务。SSJE采用联合抽取的方式能够同时识别方面词、观点词和方面词对应的情感极性,从而有效地避免了传统的流水线方法在不同子任务中遇到的错误传播。此外,SSJE通过共享所有可能包含方面词和观点词的跨度,还解决了由多个词组成的方面词和观点词所导致地问题以及能够有效处理方面词和观点词之间的一对多和多对一关系。SSJE框架通过图神经网络从句子的依存关系树中获取的依存信息,以增强跨度的语义表示,这种增强的语义信息有效地提高了抽取性能。最后,本文在两个公开的数据集进行了详尽的实验,实验结果表明本文提出的框架在ASTE任务和方面词-观点词成对抽取的任务上都达到了较好的性能。(2)基于上述的模型研究,本文设计并实现了一个观点实体联合抽取系统。本文从系统的逻辑架构以及流程架构两个维度介绍了系统的设计。在系统设计过程,为了进一步提高模型的可扩展能力,本文通过数据采集与预处理的方式构建出了一个新的语料库并针对这一语料库进行了特征提取以及模型训练,使得模型得以识别出中文评论中存在的情感三元组。在系统实现部分,为了方便用户进行使用,本文采用B/S架构完成系统的设计与实现,搭建了一个可视化界面。最后,对系统进行了功能测试和性能测试,提高系统运行的稳定性。
面向评论文本的方面级情感分析技术研究
这是一篇关于方面级情感分析,方面抽取,注意力机制,长短期记忆模型,推荐系统的论文, 主要内容为随着互联网应用的不断普及,人们的生活方式发生了巨大的变化,现在人们完全可以通过互联网购买商品、点餐吃饭、观看电影等。人们在网上进行消费之后发表对于某一产品的看法形成了大量的评论文本,从这些评论中获取消费者的情感倾向,对商家或者社会组织等制定决策有着重要意义。但是目前针对评论文本的情感分析方法只能从一个段落(或一句话)获得一种情感倾向,例如某餐厅的某条评价被标为好评,但用户并不知道是服务好还是食物好,这种方法并不能精确反映出用户真正关心的具体方面,而方面级(Aspect-level)情感分析能够从某一方面判断文本的情感倾向。基于此背景,本文对评论文本进行了方面级情感分析研究,能够挖掘出评论文本中涉及到用户关心的方面,并分析对应的情感倾向。本文的研究工作主要如下:(1)方面抽取,为了能够获取更多方面,本课题利用词性序列模板构建方面候选集合,但是集合中包含了大量语义比较相近的词,所以本课题提出了一种基于余弦相似度的近邻传播聚类算法,将相似的词进行聚类形成几个聚类类别,从而对应评论文本中的各个方面。相比于传统的聚类算法,该算法在聚类效果和时间开销上表现较好。(2)方面级情感分析,为了充分利用评论文本中的方面信息,本课题结合了方面词嵌入向量和基于注意力机制的长短期记忆模型形成了新的模型,利用该模型对评论中的各个方面进行相应的情感倾向预测,该模型在对比实验中的准确率最高。(3)系统应用,本课题利用上述算法和模型,设计并实现了一个针对产品评论的基于方面级情感分析的推荐系统。从系统需求入手,分别对系统总体和各个模块功能进行设计,并通过测试检验系统的有效性。在该系统中,消费者可以在某一类产品的属性方面选择自己最关注的方面,系统会根据消费者的选择计算产品的推荐价值,并且按照价值从高到低返回给消费者选择,这样可以节省消费者在做出购买决策之前需要阅读大量产品评论的时间。
方面级情感分析及其在电商平台上的应用研究
这是一篇关于方面级情感分析,编码网络,注意力机制,图卷积网络,词嵌入模型的论文, 主要内容为随着电子商务平台的发展,用户习惯于通过浏览商品评论了解商品的细节和质量。商品评论包含消费者对商品各方面的评价。因此,能够有效地分析出评论中商品各方面的情感极性不仅可以帮助用户全面的了解商品的信息还可以为生产商提供改进产品质量的依据。传统的情感分析任务可以通过分析文本的内容来判断文本整体的情感极性,但是不能给出文本中某部分的情感倾向。作为情感分析任务的一项细粒度任务,方面级情感分析是通过分析句子文本,从而给出不同方面对应的情感极性。因此,方面级情感分析对于分析电商平台的商品评论有直接的应用意义。本文以方面级情感分析任务所出现的问题作为研究重点,并致力于寻找解决方法,提出具有更好分类效果的模型。本文所做工作如下:(1)针对现有结合单词词性信息的方面级情感分析方法仅提取到浅层的词性特征而忽略了单词与词性之间的联系这一问题,本文提出了一种深度词嵌入模型的混合注意力网络(ELMo based Hybrid Attention Network,EHAN)。与现有网络不同,该模型不仅将深度词嵌入模型与并行编码网络相结合来捕获文本信息的情感特征,还以注意力机制的形式将单词词性的语义信息和词性信息进行融合,加强对词性的特征提取,使模型能够学习到更丰富的情感特征,以用于最终的情感极性分类。实验结果表明,与现有的基于语义信息来建模的模型相比,EHAN模型的分类效果更好,验证了所提方法可以有效地改善现有方面级情感分析方法的性能。(2)针对现有基于图卷积网络来获取句子的语法信息时不能有效利用依赖关系树的边缘信息,忽略了具体的依赖关系类型这一问题,本文提出了一种基于图卷积网络的多注意力机制的模型(Multi-Attention Mechanism based on Graph Convolutional Networks,MAMGCN)。该模型将依赖关系类型加入到语法图中,以帮助图卷积网络获取更准确的语法信息;其次,为了能够充分获取句子中的关键情感信息,模型引入语法注意力机制和多头注意力机制。在捕获语义方面的情感特征信息的同时也能学习到语法方面的有效特征信息,从而提高模型的分类准确率。在四个公开数据集上的实验结果表明,本文所提模型较基准模型在分类效果上有显著提升,验证了模型的有效性。(3)为了能够将方面级情感分析进行应用,设计了基于电商平台的商品评论方面级情感分析系统,从而将已经训练好的本文所提模型部署到系统中。具体来说,利用基于Python的爬虫框架Scrapy采集电商平台上多个领域的商品评论,并对数据进行预处理,使数据更趋于规范化,方便模型进行情感分类。然后,系统根据网络模型实现情感分析、结果可视化以及极性对比的功能,以供用户使用。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码工坊 ,原文地址:https://bishedaima.com/lunwen/48717.html