基于混合神经网络与注意力机制的虚假评论检测研究与实现
这是一篇关于虚假评论检测,BERT,混合神经网络,注意力机制的论文, 主要内容为近年来,随着互联网的高速普及与发展,特别是4G、5G移动网络的不断建设与完善,网络购物逐渐成为了人们的日常生活习惯,越来越多的网民愿意在电商平台或点评网站上通过发表评论的方式与其他用户分享它们对于所购商品的消费体验与使用评价,而这些评论内容也成为了潜在意向用户做出消费决策时的重要参考,这同时驱使了一批不法商家及群体刻意制造虚假评论干扰消费者的购买意向,进而损害消费者与合法商家的权益。虚假评论的产生严重扰乱了网购平台的购物秩序,破坏了公平的购物环境,影响了消费者正常的购物取向与消费体验。因此,实现对虚假评论的检测与过滤具有十分重要的社会价值与现实意义。本文基于评论文本特征对词嵌入技术、神经网络模型与注意力机制进行了研究与改进,提出了一种结合注意力机制的混合神经网络模型实现对虚假评论的检测,具体研究内容如下:(1)本文研究和分析了适用于虚假评论检测的深度学习模型,针对目前基于评论文本的虚假评论检测只能提取单一文本特征而无法同时兼顾的问题,提出了双通道并行混合神经网络思想,构建了基于混合神经网络与注意力机制的虚假评论检测模型(CAHHAN)。CAHHAN模型在特征提取层并行设置了 Text-CNN与HHAN双通道混合神经网络分别提取评论信息的局部文本特征与全局文本特征,通过特征融合得到同时具有局部特征与全局特征的文本特征向量;(2)为解决前述研究常用的静态词向量所面临的单一语义表征与一词多义问题,CAHHAN模型在词嵌入层运用BERT预训练模型,利用BERT模型的多头自注意力机制结合上下文语境获得符合单词实际语义的动态词向量,并进一步通过可视化研究验证了其捕获目标词上下文相互关系的能力;(3)本文进一步改进了注意力机制,提出了融合全局向量与最大池化向量的混合层次注意力机制与混合层次注意力网络(HHAN),并将其作为全局特征通道应用于CAHHAN模型中提取融合词、句两层注意力的段落层次化全局文本特征,获得更为明显的分类特征。本文通过对比实验分别检验了 CAHHAN模型中所运用的BERT预训练模型、混合神经网络思想与混合层次注意力机制的有效性,在九组对照模型实验中CAHHAN模型取得了最高的ACC与F1值,验证了 CAHHAN模型的检测效果。最后以CAHHAN模型为基础设计并开发了一套基于B/S架构的虚假评论检测系统。
基于信任度和虚假评论检测的推荐算法研究
这是一篇关于推荐系统,协同过滤,用户信任,虚假评论检测的论文, 主要内容为随着互联网技术的飞快发展,互联网信息爆炸式增长,导致信息过载问题。推荐系统是解决信息过载的重要工具。个性化推荐系统中的协同过滤推荐是目前为止应用最广泛的推荐技术。但是随着推荐系统的广泛应用,推荐算法存在着严重的数据稀疏、冷启动和数据安全等问题。推荐算法自身不能有效去除恶意数据,为有效解决这几个问题,本文对推荐系统中的虚假信息进行处理,并围绕基于信任度以及矩阵分解技术的协同过滤推荐算法展开研究。本文的主要工作和创新如下:随着电子商务的快速发展,平台内存在大量的虚假信息,严重干扰了平台的推荐系统,使得推荐给用户的项目满意度下降,本文提出融合情感极性与D-S理论的虚假评论检测方法,综合考虑了评论者行为特征,评论文本特征以及评论文本情感极性特征,构建多维特征模型。利用单特征下的支持向量机模型初步识别结果作为独立证据计算基本信任函数,再利用D-S证据理论进行决策级融合,并根据识别框架下的证据支持度对评论进行判断。从大众平台爬取数据作为数据集进行实验。在算法对比中,本文提出的算法在检测性能上优于相关文献提出的检测算法。在web2.0时代社交网络普及,基于社交网络推荐算法引起研究者的关注。针对目前信任关系考虑不全问题,本文提出基于综合信任的社会化混合推荐算法。该算法考虑了用户的综合信任度,构建信任矩阵。并且考虑了项目间的关联度,结合概率矩阵分解模型实现混合推荐算法。该算法在Epinions数据集上实验取得了不错的效果。然后结合数据检测技术再一次实验,通过虚假评论检测技术处理后的数据运用到基于综合信任的推荐算法系统中,与没有经过处理的数据推荐结果对比。检验本文算法的鲁棒性以及推荐效果是否得到提升。在Epinions数据集上实验表明,通过数据处理后的基于信任推荐算法在推荐评分误差以及算法鲁棒性都取得了提高。
基于语义表示学习的虚假评论检测算法研究
这是一篇关于虚假评论检测,语义表示,深度学习,注意力机制的论文, 主要内容为随着电子商务的发展,网上购物越发成为消费者购物的主流方式。由于巨大利益和消费者与电商平台信息不对称的情况,商家雇用一些人撰写不符合事实的评论信息误导消费者,影响人们的消费行为,造成电子商务市场混乱。因此,展开虚假评论检测研究具有实际的应用价值。虚假评论检测研究的意义在于识别评论中的虚假信息,避免人们在认识事物及购物消费时受到虚假信息的误导。为了解决现有模型识别能力较差、误判率较高、无法挖掘文本深层次语义特征的问题,本文从语义分析的方向上展开相关研究。针对短文本信息存在特征稀疏性的问题,本文提出了结合聚类与语义单元的虚假评论检测模型。模型运用聚类方法发现词向量空间中的语义群,通过语义合成得到文本信息中的语义单元,然后从语义群中筛选出语义相近的词向量与语义单元构造成文本扩展特征,有效提升了模型虚假评论检测性能。针对长文本中潜在语义特征难以挖掘的问题,本文提出了结合句子加权与注意力机制的虚假评论检测模型。由于虚假性判断中句子重要性的不同,本文使用基于句子加权的卷积神经网络获得文本信息中潜在的特征,然后将提取的特征输入到含有注意力机制的长短期记忆神经网络中进行再次编码,从而挖掘到比较准确的文本潜在语义特征。本文通过多项数值实验,对上述提出的模型进行了验证与分析,仿真实验结果表明,模型在虚假评论检测中具有较高的准确率。
基于混合神经网络与注意力机制的虚假评论检测研究与实现
这是一篇关于虚假评论检测,BERT,混合神经网络,注意力机制的论文, 主要内容为近年来,随着互联网的高速普及与发展,特别是4G、5G移动网络的不断建设与完善,网络购物逐渐成为了人们的日常生活习惯,越来越多的网民愿意在电商平台或点评网站上通过发表评论的方式与其他用户分享它们对于所购商品的消费体验与使用评价,而这些评论内容也成为了潜在意向用户做出消费决策时的重要参考,这同时驱使了一批不法商家及群体刻意制造虚假评论干扰消费者的购买意向,进而损害消费者与合法商家的权益。虚假评论的产生严重扰乱了网购平台的购物秩序,破坏了公平的购物环境,影响了消费者正常的购物取向与消费体验。因此,实现对虚假评论的检测与过滤具有十分重要的社会价值与现实意义。本文基于评论文本特征对词嵌入技术、神经网络模型与注意力机制进行了研究与改进,提出了一种结合注意力机制的混合神经网络模型实现对虚假评论的检测,具体研究内容如下:(1)本文研究和分析了适用于虚假评论检测的深度学习模型,针对目前基于评论文本的虚假评论检测只能提取单一文本特征而无法同时兼顾的问题,提出了双通道并行混合神经网络思想,构建了基于混合神经网络与注意力机制的虚假评论检测模型(CAHHAN)。CAHHAN模型在特征提取层并行设置了 Text-CNN与HHAN双通道混合神经网络分别提取评论信息的局部文本特征与全局文本特征,通过特征融合得到同时具有局部特征与全局特征的文本特征向量;(2)为解决前述研究常用的静态词向量所面临的单一语义表征与一词多义问题,CAHHAN模型在词嵌入层运用BERT预训练模型,利用BERT模型的多头自注意力机制结合上下文语境获得符合单词实际语义的动态词向量,并进一步通过可视化研究验证了其捕获目标词上下文相互关系的能力;(3)本文进一步改进了注意力机制,提出了融合全局向量与最大池化向量的混合层次注意力机制与混合层次注意力网络(HHAN),并将其作为全局特征通道应用于CAHHAN模型中提取融合词、句两层注意力的段落层次化全局文本特征,获得更为明显的分类特征。本文通过对比实验分别检验了 CAHHAN模型中所运用的BERT预训练模型、混合神经网络思想与混合层次注意力机制的有效性,在九组对照模型实验中CAHHAN模型取得了最高的ACC与F1值,验证了 CAHHAN模型的检测效果。最后以CAHHAN模型为基础设计并开发了一套基于B/S架构的虚假评论检测系统。
基于语义表示学习的虚假评论检测算法研究
这是一篇关于虚假评论检测,语义表示,深度学习,注意力机制的论文, 主要内容为随着电子商务的发展,网上购物越发成为消费者购物的主流方式。由于巨大利益和消费者与电商平台信息不对称的情况,商家雇用一些人撰写不符合事实的评论信息误导消费者,影响人们的消费行为,造成电子商务市场混乱。因此,展开虚假评论检测研究具有实际的应用价值。虚假评论检测研究的意义在于识别评论中的虚假信息,避免人们在认识事物及购物消费时受到虚假信息的误导。为了解决现有模型识别能力较差、误判率较高、无法挖掘文本深层次语义特征的问题,本文从语义分析的方向上展开相关研究。针对短文本信息存在特征稀疏性的问题,本文提出了结合聚类与语义单元的虚假评论检测模型。模型运用聚类方法发现词向量空间中的语义群,通过语义合成得到文本信息中的语义单元,然后从语义群中筛选出语义相近的词向量与语义单元构造成文本扩展特征,有效提升了模型虚假评论检测性能。针对长文本中潜在语义特征难以挖掘的问题,本文提出了结合句子加权与注意力机制的虚假评论检测模型。由于虚假性判断中句子重要性的不同,本文使用基于句子加权的卷积神经网络获得文本信息中潜在的特征,然后将提取的特征输入到含有注意力机制的长短期记忆神经网络中进行再次编码,从而挖掘到比较准确的文本潜在语义特征。本文通过多项数值实验,对上述提出的模型进行了验证与分析,仿真实验结果表明,模型在虚假评论检测中具有较高的准确率。
基于信任度和虚假评论检测的推荐算法研究
这是一篇关于推荐系统,协同过滤,用户信任,虚假评论检测的论文, 主要内容为随着互联网技术的飞快发展,互联网信息爆炸式增长,导致信息过载问题。推荐系统是解决信息过载的重要工具。个性化推荐系统中的协同过滤推荐是目前为止应用最广泛的推荐技术。但是随着推荐系统的广泛应用,推荐算法存在着严重的数据稀疏、冷启动和数据安全等问题。推荐算法自身不能有效去除恶意数据,为有效解决这几个问题,本文对推荐系统中的虚假信息进行处理,并围绕基于信任度以及矩阵分解技术的协同过滤推荐算法展开研究。本文的主要工作和创新如下:随着电子商务的快速发展,平台内存在大量的虚假信息,严重干扰了平台的推荐系统,使得推荐给用户的项目满意度下降,本文提出融合情感极性与D-S理论的虚假评论检测方法,综合考虑了评论者行为特征,评论文本特征以及评论文本情感极性特征,构建多维特征模型。利用单特征下的支持向量机模型初步识别结果作为独立证据计算基本信任函数,再利用D-S证据理论进行决策级融合,并根据识别框架下的证据支持度对评论进行判断。从大众平台爬取数据作为数据集进行实验。在算法对比中,本文提出的算法在检测性能上优于相关文献提出的检测算法。在web2.0时代社交网络普及,基于社交网络推荐算法引起研究者的关注。针对目前信任关系考虑不全问题,本文提出基于综合信任的社会化混合推荐算法。该算法考虑了用户的综合信任度,构建信任矩阵。并且考虑了项目间的关联度,结合概率矩阵分解模型实现混合推荐算法。该算法在Epinions数据集上实验取得了不错的效果。然后结合数据检测技术再一次实验,通过虚假评论检测技术处理后的数据运用到基于综合信任的推荐算法系统中,与没有经过处理的数据推荐结果对比。检验本文算法的鲁棒性以及推荐效果是否得到提升。在Epinions数据集上实验表明,通过数据处理后的基于信任推荐算法在推荐评分误差以及算法鲁棒性都取得了提高。
基于深度学习的虚假评论检测
这是一篇关于虚假评论检测,深度学习,卷积神经网络,FastText,产品特征的论文, 主要内容为随着互联网的迅速发展,网上购物以其方便快捷的优势代替了实体店购物,已成为时下最流行的消费方式。出于谋利的目的,电商平台中出现越来越多的虚假评论,这在一定程度上误导消费者的购买趋向,致使消费者买到的商品与描述不符,逐渐丧失对电商平台的信任。为了净化电商环境,研究学者通过提取评论文本和评论者的各项特征并利用传统分类器进行虚假评论检测,虽然这类方法取得了一定的成果,但是提取特征的过程中依赖于专家知识,而且没有考虑相关产品的特征,不具有广泛应用性。虚假评论一般会比真实评论使用更多情感词描述目标产品的特征,针对不同的目标产品,虚假评论者会对不同的特征进行描述,为了使得检测方法适用于不同领域,本文利用产品的相关特征,结合深度学习方法提出了两种虚假评论检测模型。第一种是融合产品相关特征的虚假评论检测方法,该方法将产品相关特征与评论文本组合,以此作为输入来训练卷积神经网络模型实现虚假评论检测,最后将该算法与两个有效的传统分类器组合,降低了过拟合问题,提高检测准确率。第二种是基于FastText的虚假评论检测方法,该方法首先使用语料库训练Word2Vec模型,基于该模型扩充了产品特征词汇集,并建立文本向量,经过卷积层、池化层提取特征后,利用FastText实现分类,解决了产品评论数据集存在的类别不均衡问题,同时提高了模型的训练速度。为了验证算法的有效性,利用Python语言爬取了亚马逊网站的商品评论数据集,并基于该数据集分别针对上述两种算法设计了多组对比实验。实验结果表明,算法一利用产品相关特征有助于提高虚假评论检测的准确度,使用模型组合的方式可以降低过拟合问题。算法二训练Word2Vec进行文本建模能够更好地表示文本的深层语义,使用FastText分类能够解决类别不均衡的问题,提高准确度,同时缩短模型在数据量较大情况下的训练时间。
基于混合神经网络与注意力机制的虚假评论检测研究与实现
这是一篇关于虚假评论检测,BERT,混合神经网络,注意力机制的论文, 主要内容为近年来,随着互联网的高速普及与发展,特别是4G、5G移动网络的不断建设与完善,网络购物逐渐成为了人们的日常生活习惯,越来越多的网民愿意在电商平台或点评网站上通过发表评论的方式与其他用户分享它们对于所购商品的消费体验与使用评价,而这些评论内容也成为了潜在意向用户做出消费决策时的重要参考,这同时驱使了一批不法商家及群体刻意制造虚假评论干扰消费者的购买意向,进而损害消费者与合法商家的权益。虚假评论的产生严重扰乱了网购平台的购物秩序,破坏了公平的购物环境,影响了消费者正常的购物取向与消费体验。因此,实现对虚假评论的检测与过滤具有十分重要的社会价值与现实意义。本文基于评论文本特征对词嵌入技术、神经网络模型与注意力机制进行了研究与改进,提出了一种结合注意力机制的混合神经网络模型实现对虚假评论的检测,具体研究内容如下:(1)本文研究和分析了适用于虚假评论检测的深度学习模型,针对目前基于评论文本的虚假评论检测只能提取单一文本特征而无法同时兼顾的问题,提出了双通道并行混合神经网络思想,构建了基于混合神经网络与注意力机制的虚假评论检测模型(CAHHAN)。CAHHAN模型在特征提取层并行设置了 Text-CNN与HHAN双通道混合神经网络分别提取评论信息的局部文本特征与全局文本特征,通过特征融合得到同时具有局部特征与全局特征的文本特征向量;(2)为解决前述研究常用的静态词向量所面临的单一语义表征与一词多义问题,CAHHAN模型在词嵌入层运用BERT预训练模型,利用BERT模型的多头自注意力机制结合上下文语境获得符合单词实际语义的动态词向量,并进一步通过可视化研究验证了其捕获目标词上下文相互关系的能力;(3)本文进一步改进了注意力机制,提出了融合全局向量与最大池化向量的混合层次注意力机制与混合层次注意力网络(HHAN),并将其作为全局特征通道应用于CAHHAN模型中提取融合词、句两层注意力的段落层次化全局文本特征,获得更为明显的分类特征。本文通过对比实验分别检验了 CAHHAN模型中所运用的BERT预训练模型、混合神经网络思想与混合层次注意力机制的有效性,在九组对照模型实验中CAHHAN模型取得了最高的ACC与F1值,验证了 CAHHAN模型的检测效果。最后以CAHHAN模型为基础设计并开发了一套基于B/S架构的虚假评论检测系统。
基于异质集成学习的虚假评论检测研究
这是一篇关于机器学习,异质集成学习,投票法,虚假评论检测,Word2vec的论文, 主要内容为由于网购接触不到商品,所以用户只能从电商平台上了解相关的产品信息,其中评论信息越来越被用户重视。许多商家发现好评能带来巨额回报,差评能让对手亏损甚至倒闭,所以“刷评”行为一直存在。为了防止卖家的恶性竞争、保证电商平台能够公平交易、保护消费者的权益不受侵犯,检测虚假评论一直是个研究热点。本文对虚假评论检测进行深入研究,主要工作分为以下几个方面:首先,针对Word2vec模型无法识别英语中的词对信息进行改进,提出了Bigram-Word2vec模型。该模型首先利用Bigram模型识别英语中的词对信息,在此基础上,对文本信息进行处理以后,再输入到Word2vec模型中训练相关的词向量。其次,由于词对取值个数的不同,Bigram-Word2vec模型训练出来的词向量的质量也不同。为了进一步优化Bigram-Word2vec模型,本文尝试了取多组值用于训练词向量,以寻找最优的词向量。再次,为了解决传统的虚假评论检测领域中使用单一的机器学习模型的问题,本文将异质集成学习领域中的相关知识应用到虚假评论检测领域中。在尝试将多个异质模型进行集成的过程中,针对异质集成学习中硬投票法遇到投票数相同及软投票法中权重如何设置的问题,提出了两种解决方式:二分类加权硬投票法和加权软投票法。最后,本文使用多种文本特征提取方法对亚马逊数据集进行特征提取,再结合多个模型对文本进行分类。为了对分类结果不理想的原因做出解释提出了“词重复率”的概念。同时也在该数据集上验证了本文提出的方法。
基于深度学习的多维特征虚假评论检测算法研究
这是一篇关于虚假评论检测,多维特征,深度学习,注意力机制的论文, 主要内容为随着电子商务的迅速发展,网上购物逐渐发展成为人们购物的主要方式。由于网上购物中的消费者与电商平台商家信息不对称的特点,在网上购物的过程中,电商平台中的商品评论信息逐渐成为消费者网购决策的主要依据。但是,由于利益的驱使,越来越多的商品虚假评论信息出现在消费者面前,并且由于网络水军、网络职业写手的存在使得商品的虚假评论与真实评论的区分难度越来越大,使得消费者不能直观的获取到买家对商品购买体验与使用体验的反馈信息,因此商品虚假评论检测研究随之展开。随着研究者的不断努力,越来越多的虚假评论检测方法被提出来。然而面对当今虚假评论具有很高仿真性的特点,当前的虚假评论检测方法慢慢暴露出局限性:基于评论内容特征的检测的传统机器学习方法,对于自然语言处理领域,语言特征的提取对于领域知识具有很强的依赖性,算法识别能力较差,泛化能力较弱,误判率较高;人为虚假评论具有很高的仿真性,单纯从评论内容这一维度特征构建模型对虚假评论识别具有一定困难。针对以上问题,本文提出了一种基于深度学习的多维特征虚假评论检测模型。该模型使用深度学习中的双向长短时记忆网络模型(Bi-LSTM)来获取商品评论文本内容的上下文语义信息特征来取代传统机器学习中人工特征选择过程。同时加入评论内容自身特征、评论者行为相关特征、商家行为相关特征并使用卷积神经网络(CNN)通过不同步长的卷积核(filter)进行特征组合来帮助区分仿真性很高的难以识别的虚假评论。最后本文将注意力机制(Attention Mechanism)加入到基于深度学习的虚假评论检测模型中来调整多维特征对最终分类结果的影响权重,提高模型检测的准确率与召回率,同时注意力机制可以对特征权重高可视化输出展示,提高用户对虚假评论识别的置信度。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设项目助手 ,原文地址:https://bishedaima.com/lunwen/55916.html