基于深度学习的虚假评论检测研究与实现
这是一篇关于虚假评论,语义相似性,图卷积网络,情感特征,Transformer模型的论文, 主要内容为电商平台中真实可信的用户评论可以帮助消费者做出正确的消费决策。然而,受不同动因驱使,电商平台中也充斥着大量虚假评论。虚假评论不仅会误导用户的消费决策,同时也会对商家及电商平台造成消极的影响。在此背景下,虚假评论的检测与治理对监督网站运营、净化网络环境具有重要的意义。本文基于深度学习技术对虚假评论检测方法展开研究。为实现对虚假评论的准确、高效检测,从评论间相似性与评论文本情感两种角度出发,提出两种虚假评论检测方法。在此基础上,利用上述两种方法中提取的蕴含评论间相似性和评论情感强度的特征,提出了一种基于多线索的虚假评论检测方法,并设计实现了一个可对评论进行自动采集及虚假评论检测的系统。主要内容如下:(1)提出一种基于图卷积网络的虚假评论检测方法。虚假评论间通常会有高度相似的内容,但是现有的基于深度学习的虚假评论检测方法,通常对每条评论单独提取文本特征而未充分考虑评论间的相似性。本文利用不同评论中词汇的语义相似性间接衡量评论间相似性,并基于图卷积网络进行虚假评论检测。首先,基于词汇语义相似性构建评论文本图,将虚假评论检测问题转化为节点分类问题。其次,利用图卷积网络聚合相邻节点的邻域信息,深入挖掘评论间的相似性关系,获取包含评论间相似性的特征向量进行虚假评论检测。在虚假评论检测通用数据集上,与CNN、LSTM、Text_GCN等模型相比,该方法将准确率分别提升了7%、4.8%与1.3%。(2)提出一种融合情感特征的虚假评论检测方法。为了达到鼓吹宣传的效果,虚假评论表现的情感通常比较强烈,但是现有的基于情感特征的虚假评论检测方法大多仅对评论中的情感词进行简单的统计计数,忽略了不同情感词有程度差别的重要属性。为此,提出一种新的融合情感特征的虚假评论检测方法。该方法首先基于评论文本构建情感词典,综合考虑情感词的不同形式及情感词与程度副词的依赖关系,对评论文本表达的情感更加准确地量化描述;然后,将情感特征与文本内容特征融合,结合Transformer模型实现虚假评论检测。在Amazon数据集上,与LSTM模型相比,该方法在提高检测效率的同时,将准确率提升了0.59%。(3)考虑到一条虚假评论可能同时具有上述两方面特征,将上述两种方法中提取到的蕴含评论间相似性与评论情感强度的特征进行融合,设计了基于多线索的虚假评论检测方法,并基于该方法设计并实现虚假评论在线检测系统。系统分为服务端与客户端两个模块。服务端主要实现评论数据的采集、基于多线索的虚假评论检测模型训练以及评论的在线检测等核心功能;客户端主要实现评论检测任务管理及评论检测结果的展示。在Amazon数据集上,基于多线索的检测准确率与单独使用上述两种方法相比分别提升3.24%与1.14%。实验结果表明融合评论间相似性和情感强度两方面特征具有有效性。同时,利用大众点评网站的评论数据验证了该系统可以实现评论的自动采集和虚假评论的在线检测。
基于深度学习的虚假评论检测研究与实现
这是一篇关于虚假评论,语义相似性,图卷积网络,情感特征,Transformer模型的论文, 主要内容为电商平台中真实可信的用户评论可以帮助消费者做出正确的消费决策。然而,受不同动因驱使,电商平台中也充斥着大量虚假评论。虚假评论不仅会误导用户的消费决策,同时也会对商家及电商平台造成消极的影响。在此背景下,虚假评论的检测与治理对监督网站运营、净化网络环境具有重要的意义。本文基于深度学习技术对虚假评论检测方法展开研究。为实现对虚假评论的准确、高效检测,从评论间相似性与评论文本情感两种角度出发,提出两种虚假评论检测方法。在此基础上,利用上述两种方法中提取的蕴含评论间相似性和评论情感强度的特征,提出了一种基于多线索的虚假评论检测方法,并设计实现了一个可对评论进行自动采集及虚假评论检测的系统。主要内容如下:(1)提出一种基于图卷积网络的虚假评论检测方法。虚假评论间通常会有高度相似的内容,但是现有的基于深度学习的虚假评论检测方法,通常对每条评论单独提取文本特征而未充分考虑评论间的相似性。本文利用不同评论中词汇的语义相似性间接衡量评论间相似性,并基于图卷积网络进行虚假评论检测。首先,基于词汇语义相似性构建评论文本图,将虚假评论检测问题转化为节点分类问题。其次,利用图卷积网络聚合相邻节点的邻域信息,深入挖掘评论间的相似性关系,获取包含评论间相似性的特征向量进行虚假评论检测。在虚假评论检测通用数据集上,与CNN、LSTM、Text_GCN等模型相比,该方法将准确率分别提升了7%、4.8%与1.3%。(2)提出一种融合情感特征的虚假评论检测方法。为了达到鼓吹宣传的效果,虚假评论表现的情感通常比较强烈,但是现有的基于情感特征的虚假评论检测方法大多仅对评论中的情感词进行简单的统计计数,忽略了不同情感词有程度差别的重要属性。为此,提出一种新的融合情感特征的虚假评论检测方法。该方法首先基于评论文本构建情感词典,综合考虑情感词的不同形式及情感词与程度副词的依赖关系,对评论文本表达的情感更加准确地量化描述;然后,将情感特征与文本内容特征融合,结合Transformer模型实现虚假评论检测。在Amazon数据集上,与LSTM模型相比,该方法在提高检测效率的同时,将准确率提升了0.59%。(3)考虑到一条虚假评论可能同时具有上述两方面特征,将上述两种方法中提取到的蕴含评论间相似性与评论情感强度的特征进行融合,设计了基于多线索的虚假评论检测方法,并基于该方法设计并实现虚假评论在线检测系统。系统分为服务端与客户端两个模块。服务端主要实现评论数据的采集、基于多线索的虚假评论检测模型训练以及评论的在线检测等核心功能;客户端主要实现评论检测任务管理及评论检测结果的展示。在Amazon数据集上,基于多线索的检测准确率与单独使用上述两种方法相比分别提升3.24%与1.14%。实验结果表明融合评论间相似性和情感强度两方面特征具有有效性。同时,利用大众点评网站的评论数据验证了该系统可以实现评论的自动采集和虚假评论的在线检测。
基于深度学习的虚假评论检测研究与实现
这是一篇关于虚假评论,语义相似性,图卷积网络,情感特征,Transformer模型的论文, 主要内容为电商平台中真实可信的用户评论可以帮助消费者做出正确的消费决策。然而,受不同动因驱使,电商平台中也充斥着大量虚假评论。虚假评论不仅会误导用户的消费决策,同时也会对商家及电商平台造成消极的影响。在此背景下,虚假评论的检测与治理对监督网站运营、净化网络环境具有重要的意义。本文基于深度学习技术对虚假评论检测方法展开研究。为实现对虚假评论的准确、高效检测,从评论间相似性与评论文本情感两种角度出发,提出两种虚假评论检测方法。在此基础上,利用上述两种方法中提取的蕴含评论间相似性和评论情感强度的特征,提出了一种基于多线索的虚假评论检测方法,并设计实现了一个可对评论进行自动采集及虚假评论检测的系统。主要内容如下:(1)提出一种基于图卷积网络的虚假评论检测方法。虚假评论间通常会有高度相似的内容,但是现有的基于深度学习的虚假评论检测方法,通常对每条评论单独提取文本特征而未充分考虑评论间的相似性。本文利用不同评论中词汇的语义相似性间接衡量评论间相似性,并基于图卷积网络进行虚假评论检测。首先,基于词汇语义相似性构建评论文本图,将虚假评论检测问题转化为节点分类问题。其次,利用图卷积网络聚合相邻节点的邻域信息,深入挖掘评论间的相似性关系,获取包含评论间相似性的特征向量进行虚假评论检测。在虚假评论检测通用数据集上,与CNN、LSTM、Text_GCN等模型相比,该方法将准确率分别提升了7%、4.8%与1.3%。(2)提出一种融合情感特征的虚假评论检测方法。为了达到鼓吹宣传的效果,虚假评论表现的情感通常比较强烈,但是现有的基于情感特征的虚假评论检测方法大多仅对评论中的情感词进行简单的统计计数,忽略了不同情感词有程度差别的重要属性。为此,提出一种新的融合情感特征的虚假评论检测方法。该方法首先基于评论文本构建情感词典,综合考虑情感词的不同形式及情感词与程度副词的依赖关系,对评论文本表达的情感更加准确地量化描述;然后,将情感特征与文本内容特征融合,结合Transformer模型实现虚假评论检测。在Amazon数据集上,与LSTM模型相比,该方法在提高检测效率的同时,将准确率提升了0.59%。(3)考虑到一条虚假评论可能同时具有上述两方面特征,将上述两种方法中提取到的蕴含评论间相似性与评论情感强度的特征进行融合,设计了基于多线索的虚假评论检测方法,并基于该方法设计并实现虚假评论在线检测系统。系统分为服务端与客户端两个模块。服务端主要实现评论数据的采集、基于多线索的虚假评论检测模型训练以及评论的在线检测等核心功能;客户端主要实现评论检测任务管理及评论检测结果的展示。在Amazon数据集上,基于多线索的检测准确率与单独使用上述两种方法相比分别提升3.24%与1.14%。实验结果表明融合评论间相似性和情感强度两方面特征具有有效性。同时,利用大众点评网站的评论数据验证了该系统可以实现评论的自动采集和虚假评论的在线检测。
基于深度学习的虚假评论检测研究与实现
这是一篇关于虚假评论,语义相似性,图卷积网络,情感特征,Transformer模型的论文, 主要内容为电商平台中真实可信的用户评论可以帮助消费者做出正确的消费决策。然而,受不同动因驱使,电商平台中也充斥着大量虚假评论。虚假评论不仅会误导用户的消费决策,同时也会对商家及电商平台造成消极的影响。在此背景下,虚假评论的检测与治理对监督网站运营、净化网络环境具有重要的意义。本文基于深度学习技术对虚假评论检测方法展开研究。为实现对虚假评论的准确、高效检测,从评论间相似性与评论文本情感两种角度出发,提出两种虚假评论检测方法。在此基础上,利用上述两种方法中提取的蕴含评论间相似性和评论情感强度的特征,提出了一种基于多线索的虚假评论检测方法,并设计实现了一个可对评论进行自动采集及虚假评论检测的系统。主要内容如下:(1)提出一种基于图卷积网络的虚假评论检测方法。虚假评论间通常会有高度相似的内容,但是现有的基于深度学习的虚假评论检测方法,通常对每条评论单独提取文本特征而未充分考虑评论间的相似性。本文利用不同评论中词汇的语义相似性间接衡量评论间相似性,并基于图卷积网络进行虚假评论检测。首先,基于词汇语义相似性构建评论文本图,将虚假评论检测问题转化为节点分类问题。其次,利用图卷积网络聚合相邻节点的邻域信息,深入挖掘评论间的相似性关系,获取包含评论间相似性的特征向量进行虚假评论检测。在虚假评论检测通用数据集上,与CNN、LSTM、Text_GCN等模型相比,该方法将准确率分别提升了7%、4.8%与1.3%。(2)提出一种融合情感特征的虚假评论检测方法。为了达到鼓吹宣传的效果,虚假评论表现的情感通常比较强烈,但是现有的基于情感特征的虚假评论检测方法大多仅对评论中的情感词进行简单的统计计数,忽略了不同情感词有程度差别的重要属性。为此,提出一种新的融合情感特征的虚假评论检测方法。该方法首先基于评论文本构建情感词典,综合考虑情感词的不同形式及情感词与程度副词的依赖关系,对评论文本表达的情感更加准确地量化描述;然后,将情感特征与文本内容特征融合,结合Transformer模型实现虚假评论检测。在Amazon数据集上,与LSTM模型相比,该方法在提高检测效率的同时,将准确率提升了0.59%。(3)考虑到一条虚假评论可能同时具有上述两方面特征,将上述两种方法中提取到的蕴含评论间相似性与评论情感强度的特征进行融合,设计了基于多线索的虚假评论检测方法,并基于该方法设计并实现虚假评论在线检测系统。系统分为服务端与客户端两个模块。服务端主要实现评论数据的采集、基于多线索的虚假评论检测模型训练以及评论的在线检测等核心功能;客户端主要实现评论检测任务管理及评论检测结果的展示。在Amazon数据集上,基于多线索的检测准确率与单独使用上述两种方法相比分别提升3.24%与1.14%。实验结果表明融合评论间相似性和情感强度两方面特征具有有效性。同时,利用大众点评网站的评论数据验证了该系统可以实现评论的自动采集和虚假评论的在线检测。
基于心理特征分析的钓鱼邮件检测系统设计与实现
这是一篇关于钓鱼邮件,说服性原则特征,情感特征的论文, 主要内容为社会工程学攻击是一种常见的网络攻击手段,其主要的攻击载体是电子邮件,即钓鱼邮件攻击。电子邮件使用的普遍性导致钓鱼邮件攻击的危害性极大,并且由于其伪装手段的不断提升,已经严重威胁到了网络用户的信息财产安全。目前钓鱼邮件检测算法大多都是将相关符号的出现次数、关键词是否出现等作为特征提取的依据,使用这种方法提取到的特征不够准确,会直接影响钓鱼邮件检测效果。针对此问题,本文提出了一种基于心理特征分析的钓鱼邮件检测算法。本算法使用的特征包含心理特征和原始特征。心理特征包含说服性原则特征和情感特征两个部分,原始特征包含邮件头部特征和邮件体特征两个部分。说服性原则特征是由基于BERT的说服性原则特征提取模型提取,由于针对说服性原则特征的公开数据集较少,所在本文在训练说服性原则特征提取模型前还构建了一个说服性原则特征数据集。说服性原则特征包括稀缺性原则、互利互惠原则以及权威性原则三维特征。情感特征由基于BERT和TextCNN的情感特征提取模型提取,包括悲观、厌恶、惊讶、乐观、信任、喜悦、恐惧、悲伤、期待以及情感特征总数十维特征。本文使用Stacking集成训练方法训练得到基于心理特征分析的钓鱼邮件检测算法,并且研究了在集成模型训练时,基学习器的选择和元学习器训练方式对最终获得算法检测效果的影响。最后,通过实验验证了本文提出算法的有效性。以本文提出的钓鱼邮件检测算法为基础,结合黑名单检测方法,设计并实现了基于心理特征分析的钓鱼邮件检测系统。本系统主要包括用户管理模块、黑名单管理模块、邮件特征提取模块、钓鱼邮件检测模块以及检测结果统计模块五个部分。本文对每个模块都进行了功能测试。最终的系统测试结果表明本系统能有效抵御钓鱼邮件攻击。
基于在线评论的游客情感特征研究——以蜈支洲岛旅游区为例
这是一篇关于游客情感,情感特征,情感词典,LDA主题模型的论文, 主要内容为数字化应用不断驱动旅游行业的发展变革,越来越多旅游者利用网络平台进行旅游产品预订、游后体验评价分享等活动,产生了海量旅游文本数据,旅游产品评论反映了游客消费后的真实感受,蕴含着游客对于旅游目的地的情感态度。能否准确把握游客的情感态度,了解旅游者旅游体验后的真实想法与真正需求,是影响行业规划、产品设计、营销开展的至关因素。然而,由于旅游消费场景的特殊性,使用通用方法会降低情感倾向分类的准确性,目前尚无成熟可靠的游客情感特征分析方法。针对上述问题,本文使用大数据文本分析技术,以蜈支洲岛旅游区的游客评论为素材展开分析,从评论情感倾向和正负面评论主题两方面对蜈支洲岛旅游区游客情感特征进行挖掘。首先,整合现有通用词典资源,从基准情感词扩张和候选情感词挖掘两方面改进情感词典构建SO-PMI算法,构建出专属旅游领域情感词典,对游客评论进行正负面情感分类。其次,利用LDA主题模型进一步抽取正、负面评论的主题,结合评论内容分析游客正负面评论的主题来源。研究发现:(1)通过实证验证,利用基准情感词扩张以及N-gram模型改进SO-PMI算法,构建出旅游领域情感词典,能够有效提高情感分类算法的整体性能;(2)整体而言,游客对于蜈支洲岛旅游区的抱有较为正面情感度,但负面情感也占有不小的比重;(3)游客正面评论主题集中在自然风光、海上项目体验以及整体服务质量上,负面评论主题集中在岛内过于商业化,性价比不高、游玩体验单一和景区管理水平有待提升等方面。研究通过改进旅游领域文本情感倾向分析方法,结合正负面评论主题提取,构建出了较为完善可靠的游客情感特征分析框架,拓展了研究游客情感偏好的方法。对蜈支洲岛游客情感特征进行分析,有助于指导景区针对性规划和营销,使景区更好更快发展,有较好的理论和应用价值。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设货栈 ,原文地址:https://bishedaima.com/lunwen/55122.html