基于评论文本的评分预测研究
这是一篇关于推荐系统,评分预测,评论文本,深度学习,知识图谱的论文, 主要内容为随着互联网的蓬勃发展,网络信息迅猛增长。高速流通的信息可以给人们的日常生活带来方便,但这也意味着用户快速精准地找到所需信息变得愈加困难。用户每次执行打开页面、点击鼠标和填写表单等操作都会产生数据。推荐系统可以从这些数据中推测出用户的兴趣偏好,从而给用户推荐个性化信息。推荐系统具有实际的应用需求,如淘宝、今日头条和网易云音乐等凭借着精准推荐在同类市场竞争中占据了优势。同时推荐系统也是学术界的热门议题,其研究方向主要有两种,一种是对于用户的Top-N推荐,另外一种就是用户对商品评分的预测。ToP-N推荐是为用户推荐商品列表,其实质还是评分预测。近年来,基于评论文本的评分预测推荐算法受到越来越多研究者的关注。用户编写的评论文本包含更多的可靠信息,可以从中深度挖掘出商品的特性以及用户的兴趣偏好从而实现更精准的推荐。本文基于评论文本解决的是目前较为常见的评分预测问题,主要工作如下:(1)提出了一种基于评论图谱的推荐模型。该模型包含知识加工、特征构建和预测回归三个阶段。首先利用Doc2vec模型抽取评论的语义特征;然后使用基于图模型的方法抽取评论关键词,并利用知识图谱构建评论关键词间的语义关系对用户的兴趣偏好进行扩展。通过融合评论语义特征以及从知识图谱中抽取的网络节点特征来表示用户和商品的特征向量,最后在预测回归阶段采用libFM模型对评分进行预测。(2)提出了一种基于双层注意力机制的评分预测推荐模型。该模型包含两个平行的卷积神经网络,联合学习用户和商品的隐藏特征表示,建模时综合考虑了细粒度的词汇和粗粒度的评论两个层面,将连接的词向量和评论向量作为网络的输入,并采用基于Word2vec的语义一阶跳转方法表示评论向量,进一步丰富评论的语义表达;在卷积层之前设计注意力层,加强重要特征对评分预测的贡献,并增加了模型的可解释性;顶层使用因子分解机模拟高阶潜在特征的相互作用,以进行评分预测。实验结果表明,所提出的方法相比于基准方法有更低的均方根误差,可有效提高评分预测精度。
基于深度学习的推荐算法研究
这是一篇关于推荐系统,评论文本,主题模型,深度学习,矩阵分解的论文, 主要内容为互联网企业使用推荐系统技术来解决信息过载问题,在推荐系统中,协同过滤推荐方法是一种应用广泛的推荐技术,在学术研究和工程实现上取得了很好的应用成果。然而随着数据量的增长,有价值的数据充斥在大量杂乱数据集合中,使得推荐模型的可用数据稀疏性较大,而传统的协同过滤推荐算法不能有效地解决这些问题,致使模型对数据的拟合能力较差,从而影响了推荐的准确度。基于深度学习的推荐方法凭借着强大的数据处理能力,近年来成为了推荐系统中一个研究热点,然而此类推荐方法在数据输入方式和深度网络处理结构上还有待改进,受此启发,本文对基于深度学习的推荐算法展开了研究,其主要工作和创新如下:针对传统的协同过滤推荐算法对稀疏数据拟合能力差的问题,本文提出了一种基于融合评论文本和外积的深度协同过滤推荐模型。首先,通过改进的主题模型来提取用户和物品评论文本中的潜在主题分布特征并以特征向量形式表示;其次,考虑到内积评分预测不能够充分地体现出用户和物品主题特征向量之间隐藏的关联性,本文采用外积交互的方式映射用户和物品的特征表达,建立了一个关于主题特征的二维交互映射矩阵,这样的外积操作不再将用户和物品特征向量各维度视为独立存在,而是有关联的,之后使用多卷积神经网络对此交互矩阵进行特征提取获得预测评分,本文通过文本和评分数据建立推荐模型,所提出的方法在一定程度上解决了数据稀疏问题,通过仿真实验与其它算法进行比较,在推荐性能上有所提升。针对推荐系统中的数据稀疏和冷启动问题,结合评分数据与物品的评论文本数据,本文提出了一种基于深度学习的改进矩阵分解推荐模型,考虑到传统矩阵分解推荐模型中评分数据的稀疏性问题,在传统矩阵分解模型的基础上加入了用户和物品的偏置影响因子和全局评分偏置影响因子,这样有利于提高预测模型的泛化能力;建立了注意力双向长短期记忆网络对物品评论文本中的物品隐藏信息进行识别,将识别出的物品评论文本中的隐藏特征作为一种辅助信息通过正则项的形式融合到改进的矩阵分解算法中,将最终得到的预测评分作为给目标用户产生推荐的依据。通过仿真实验与其它算法进行比较,结果表明本文提出的模型具有较高的推荐精准度。
基于评论文本的评分预测深度推荐模型的研究及应用
这是一篇关于推荐系统,评论文本,深度学习,注意力机制,情感分析的论文, 主要内容为推荐系统的出现缓解了信息过载所带来的一系列不便问题,为用户提供精准的信息推荐。但是数据稀疏性、冷启动等问题仍然对推荐系统的性能产生了极大的限制。随着新热点深度学习技术的崛起,文本处理技术也迎来了新突破。研究人员开始利用文本处理技术将评论文本向量化表示并利用评论文本的信息实现推荐,这在一定程度上缓解了数据稀疏性问题。以此为契机,基于评论文本的深度推荐模型受到了极大的关注,而如何从评论文本中挖掘出更多有价值的信息以提升推荐模型的性能成为了研究的热点。本文以评论文本为主要研究对象,探讨基于评论文本的评分预测深度推荐模型。首先将新提出的双重注意力层融入基于卷积神经网络的文本处理器优化模型的特征提取能力;然后使用改进的基于细粒度文本的方面类别识别器结合方面类别情感分析器生成方面类别情感信息,并将情感信息运用于原模型提升评分预测效果;最后设计并实现了电商原型系统。本文的具体研究工作如下:(1)针对现存主流的基于评论文本的评分预测深度推荐模型未能充分考虑评论文本在不同层面的重要度信息对模型效果的影响,提出一种新的评分预测深度推荐模型DATCo NN。该模型在主流文本处理器的基础上进行改进,一方面在词向量处理过程中融入融合上下文信息的词级别注意力层,利用卷积神经网络强化单词之间的耦合性,突出重要度更高的单词;另一方面在整合用户和项目向量矩阵的过程中嵌合融入时间因子的评论级别注意力层,引入人脑遗忘规律的概念,将时间因子融入注意力机制拟合实际推荐场景下用户对项目的兴趣程度随时间变化的情况,降低无用评论对建模效果的影响。实验结果表明,改进后的模型能够很好的挖掘词级别和评论级别的重要度信息,有效改善模型的特征提取能力。(2)利用深度学习技术对评论文本进行特征提取实质上是一个抽象的过程,无法提取评论文本评论对象的具象化信息以及用户对评论对象的情感倾向。而将外部标注的方面类别信息引入模型对评论文本的方面类别及情感极性进行定义能够很好的弥补这一方面的不足。但是,如何针对评论文本前后表意不同的问题准确识别其方面类别以及如何将方面类别情感信息运用于推荐模型是此方案难点。针对上述难点问题,在原模型的基础上进一步优化,提出一种改进的评分预测深度推荐模型ADATCo NN。一方面,模型依照标点符号和依存句法关系将评论文本切分为子句片段并将方面类别转移到更为契合的子句片段中,利用上述细粒度文本的方面类别信息训练识别器,缓解评论文本前后片段表意不同所导致的方面类别冲突;另一方面,将方面类别信息以及情感分析器ATAE生成的情感极性融入用户偏好及项目属性向量,同时利用方面类别识别过程中的损失优化推荐模型损失函数的结构,使模型能够捕捉方面类别属性并准确把握用户的情感导向。实验结果表明,改进模型ADATCo NN能够很好的将用户情感信息融入推荐模型,提升评分预测的准确性。(3)在上述研究的基础上,本文设计并实现了电商原型系统。系统采用目前主流的技术架构,实现了电商平台的主要功能,并将本文研究的推荐模型封装起来为用户提供商品推荐功能,很好的展现了本文提出的推荐模型的使用价值。
基于评论文本的深度推荐算法研究
这是一篇关于深度学习,推荐系统,评论文本,时序信息,注意力机制的论文, 主要内容为为缓解互联网信息指数式增长带来的信息过载问题,推荐系统被广泛地应用于诸多领域中。评论文本包含着用户和商品的多元信息,推荐系统可以挖掘这些信息以预测用户对商品的偏好,推荐系统对此开展了丰富的研究。然而,如何提高评论文本语义理解能力,提取评论文本深层次的特征,捕获更全面的用户和商品特征,值得进一步研究。基于以上问题,本文探索了基于评论文本的推荐算法研究。现有的方法通常等价地交互用户和商品的特征,但用户特征表示用户对目标商品的偏好,商品特征表示商品的属性信息,即用户和商品的重要程度不同且不对称。因此,本文提出了基于评论文本自适应特征提取的推荐算法,该推荐算法首先使用动态词嵌入预训练模型BERT解决单词多义性问题,避免语义理解产生的偏差;然后利用Bi-GRU网络和注意力机制提取用户特征和商品特征,增强特征表达能力;最后设计了一种自适应特征拼接机制来平衡用户和商品在特征交互时的重要程度。该模型在6个亚马逊数据集上实验表明性能优于基准模型,自适应特征拼接机制可以有效地平衡用户和商品特征各自的重要程度,提高了预测评分精度。以往基于评论文本的推荐系统通常挖掘静态评论信息,建模用户和商品特征,忽略了用户偏好和商品流行度会随着时间变化而发生偏移的问题。因此,本文提出了基于评论文本长短期特征提取的推荐算法,该推荐算法首先采用词级和评论级两层注意力机制挖掘评论长期特征;然后设计了一种时间注意力层将时序信息和评论文本相结合,捕捉用户和商品的短期特征;最后引入协方差去除长期特征和短期特征间的冗余信息。在4个亚马逊数据集上的实验表明,该模型性能优于基准模型,长短期特征提取网络可以有效提取用户偏好和商品流行度的动态特征,提高推荐性能。
面向评论文本的方面级别情感分析技术研究
这是一篇关于方面级别情感分析,评论文本,语言学资源,门控机制,卷积神经网络的论文, 主要内容为随着信息技术的蒸蒸日上,互联网特别是其中的移动互联网日益成为人民群众生活中至关重要的一部分。人们越来越热衷于在各种网站上和移动应用中发表自己的评论,面对这些迅猛增长的文本评论数据,怎样更好的理解这些数据,更加迅速有效的挖掘这些数据背后蕴藏的情感信息,显得越来越重要。情感分析(Sentiment Analysis)技术的出现正是为了针对这些问题。方面级别情感分析(Aspect-level Sentiment Analysis)是情感分析技术的一个重要子任务,是一个十分具有挑战性的问题,其任务目的是自动预测同一个句子中各个不同方面的情感极性。方面级别情感分析相比传统句子级别情感分析能够给出更详细、更具体的结果,在电商平台等应用领域内具有十分广阔的潜在应用前景。因此,方面级别情感分析技术得到了学术界和企业界的广泛关注,这些年来成为了一个热门的研究课题。近年来,传统的句子级别情感分析研究已经取得了很不错的成果,在实际生活中也得到了广泛应用。然而,传统句子级别所用的研究方法在针对更细粒度的方面级别情感分析时性能一直不高,因此方面级别情感分析研究中仍然存在许多亟待解决的问题。本论文针对面向评论文本的方面级别情感分析技术进行研究,研究成果主要有:一、针对深度神经网络中存在的不可解释性问题以及现实生活中丰富的语言学资源(语法规则等等)未得到利用的问题,提出将卷积神经网络(CNNs,Convolutional Neural Networks)与语言学资源相融合的方法。具体地,首先将输入的评论语句表示为向量形式,同时将句子的方面信息也表示为向量形式,然后把这两种形式的向量拼接起来组合成输入向量输入到卷积神经网络。最后将语言学规则建模成正则化项加入到卷积神经网络中。最终实验结果表明,与基线系统相比,该方法在方面级别情感分析任务上性能有较大提升,同时改善了模型的可解释性。二、针对评论语句中各个方面的情感信息没有得到较好利用这一问题,在用卷积神经网络作为基本网络架构的基础上又加入了门控机制(Gating Mechanism)来更好的选择输出的情感特征。此外,对语言学资源进行了更深入的研究,提出新的语言学正则项加入到卷积神经网络中。实验结果表明,门控机制能有效地利用句子中的方面情感信息,同时,新提出的语言学正则项效果明显。整个系统相比基线系统,能取得更好的效果。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码港湾 ,原文地址:https://bishedaima.com/lunwen/49175.html