基于多源用户评论的评分预测研究
这是一篇关于个性化推荐,协同过滤,评论的论文, 主要内容为在“大数据”时代,互联网上每天都会产生海量数据,造成“信息过载”问题。“信息过载”问题是指人们在获取自己感兴趣的信息时,因为面对的信息过于繁杂,很难找到自己真正需要的信息。推荐系统是当前应对“信息过载”问题最有用的方法之一,在诸多领域都发挥着重要的作用。协同过滤推荐算法作为当前使用范围最广的一种推荐算法,可以对用户的历史行为记录进行统计和分析,从而挖掘出用户偏好以及物品属性,为用户提供更精准的个性化推荐服务。协同过滤推荐算法还可以挖掘出用户没有表现出来的偏好,提高推荐结果的多样性和新颖性。但该算法有一个严重的缺陷,在用户-物品评分矩阵极度稀疏时,存在数据稀疏问题,预测准确度会受到很大影响。传统的推荐算法往往只利用用户对物品的评分或用户的历史行为记录来获取用户偏好,忽视了用户评论中包含的信息,因此会造成推荐结果出现偏离。用户撰写的评论往往蕴含着丰富的语义信息,可以反映用户对物品不同属性的偏好。近年来,随着隐含语义分析技术的发展,研究者们开始通过使用用户评论更精准地获得用户偏好和物品属性,从而提高个性化推荐的准确度。聚焦于推荐系统中的评分预测问题,本文主要通过利用用户历史评分信息,结合评论补充算法对用户评论进行扩充,针对数据稀疏问题提出了基于多源用户评论的评分预测算法。其中主要包含了以下方面的工作:·分析当前推荐算法的研究现状,对传统的协同过滤算法以及基于评论文本的推荐算法进行调研。·提出了基于多源相似用户评论的评分预测算法。该算法首先设计评论补充算法为每个用户从相似用户处收集补充评论,其中相似用户是指具有相似消费行为和历史评分记录的用户;然后运用隐含语义分析技术提取评论中蕴含的用户偏好信息和物品属性信息;最后使用多层感知机将用户偏好信息和物品属性信息进行整合,实现基于多源用户评论的评分预测模型。·通过在四个基准数据集上完成验证实验,对本文提出的算法与传统的基于协同过滤的评分预测算法以及基于评论文本的评分预测算法进行性能比对。实验结果表明,相比于传统的基于协同过滤的评分预测算法以及基于评论文本的评分预测算法,本文提出的算法性能有所提高。·对基于多源相似用户评论的评分预测算法进行了改进,提出了基于多源用户评论的评分预测算法,通过在四个基准数据集上进行消融实验,验证了该算法的有效性。
基于标签的个性化推荐系统的研究与实现
这是一篇关于协同过滤,评论,情感标签,相似度,推荐的论文, 主要内容为随着电子商务和Internet的飞速发展,愈来愈多的消费者学会了在网上浏览信息资源,极大的方便了用户。然而随着各种信息资源的选择愈来愈多,人们经常会迷失于繁多的资源空间里面,无法迅速且准确的找到自己所需,借助于个性化推荐系统,这一问题得到了极大的缓解。协同过滤是推荐系统的主流推荐算法,但随着用户物品数目的日益增多和系统规模的不断扩大,许多问题的出现严重导致推荐系统的推荐质量严重下降,如稀疏性问题、Cold-Start问题等等。本文提出了一种基于情感标签的改进的协同过滤推荐算法(Collaborative Filtering Based on Preference Tag,CFBPT),从用户评论数据中自动抽取情感标签,结合情感标签和评分数据共同产生推荐结果,来缓解传统协同过滤推荐算法的稀疏性问题和用户冷启动问题,并对其做了实验分析,结果证明本文的研究成果具有一定的有效性和可行性。本文的主要工作如下:(1)从用户评论中提取情感标签(Preference Tag,PT)。传统的标签的定义是指用来描述信息的关键词,是由专业的研究人员或者用户自动生成标注的文字,呈现自由性。本文提出一种新的标签形式——情感标签,它是来源于用户评论,根据算法自动生成,将其作为数据源运用到改进的CFBPT算法中。(2)针对物品邻居集计算不准确问题,提出了一种改进的综合相似度计算方法。本文将评论挖掘技术引入协同过滤算法中,根据Apriori算法和句法模板等技术抽取特征词和情感词对,量化物品在各个特征上的分数,经过聚类形成一个新的矩阵即物品-特征矩阵,将其结合用户评分共同计算物品相似度。实验证明不仅经过聚类之后,矩阵维度降低,计算量减少,而且通过情感标签的修正相似性值,使得物品邻居集更准确。(3)针对用户-物品评分矩阵存在的稀疏性问题,将得到的物品预测评分填充到用户-物品评分矩阵,结合基于用户的协同过滤思想对用户产生推荐。实验结果表明,改进的CFBPT算法提高了推荐结果的精确度。(4)针对传统协同过滤算法存在的冷启动问题,本文对新用户表达的相关特征偏好构建伪物品-特征向量,寻找与其相似的物品聚类簇。(5)最后构建了个性化推荐系统,对以上改进的算法进行了实验验证,得出结论。
众评网的设计与实现
这是一篇关于评论,店铺,SpringMVC的论文, 主要内容为电子商务目前已经融入到了我们生活当中,人们对商品和商店的认识也由广告和友人推荐的被动方式开始转变为主动获取相关评论和推荐,将草根大众的消费体验与消费评论汇聚整合并发布的第三方点评网站在我国开始出现并取得了较快的发展,这其中比较有代表性的即为提供读书、音乐等文化资讯为主的豆瓣网和以餐饮为主的大众点评网。 本人所做的系统是综合以上的特点,设计和实现对各种类型的店铺进行评论的平台,店铺的分类有餐馆、酒店、药店、家电数码等等,用户通过注册,手机验证后登陆网站系统,然后可以添加自己喜爱的店铺,添加的方式可以通过手动输入,也可以上传二维码,可以对店铺进行打分,推荐好的商品,对店铺的服务、环境和总体进行评价。评价的结果可以同步分享到新浪微博。本系统主要分为前台和后台两个主要大的模块组成,后台的模块有:字典数据管理、管理员管理、权限管理、地区管理、商业中心管理、店铺管理、统计管理等主要功能,前台包括有:添加修改店铺、按关键字搜索店铺、店铺信息展示、店铺评论、店铺GOOGLE地图展示等功能。 本系统采用较为先进的软件中间层框架SpringMVC和Hibernate,Spring相结合进行开发。本系统实现所用的语言主要为JAVA和JavaScript,页面展示框架主要为JQuery和JfreeChart插件。数据库采用MYSQL5.5。语言开发工具为Myeclipse8.5,WEB服务器是Tomcat。
基于交互图分层池化的虚假新闻检测研究
这是一篇关于虚假新闻检测,评论,传播,图神经网络,分层池化的论文, 主要内容为信息技术快速发展,社交媒体逐渐取代了传统媒体,信息在社交媒体上快速传播的同时,也给虚假新闻传播带来了可乘之机,虚假新闻对于个人和整个社会都有潜在的危害。新闻传播过程中的用户交互形成了一个复杂的异构图,其中评论和传播是两个重要组成部分,并且都包含了可用于评估新闻真实性的特征。现有的虚假新闻检测模型存在较多缺陷,在评论特征提取上,传统词向量与循环神经网络结合的文本表示方式,语义表达能力弱,评论回复结构保留和冗余评论去除等方面考虑不全面,在传播网络方面,也没有充分利用网络中存在的群体信息。考虑到现有模型的不足,基于评论交互和传播交互,提出了交互图分层池化的虚假新闻检测模型CPGP(Comment-Propagation Graph Pooling)。利用用户交互构建得到评论图和传播图,其中评论图以评论为主,并结合新闻句子以及与评论相关的推文作为结点,属性为对应的文本,边代表回复关系或内容相似关系,并使用预训练Bert提取文本语义;传播图以新闻作者、原推用户、转发用户作为图中结点,并根据朋友圈关系对传播结构进行重建,并以用户资料作为结点属性。CPGP模型使用图神经网络学习图结点潜在特征,对于评论图,使用基于结点选择的方式对评论图进行分层池化,以保留关键内容结点;对于传播图,使用基于结点聚类的方式对传播图进行分层池化,以捕捉传播群体特征。模型CPGP依据池化前的图特征学习具体方式,分为使用图卷积神经网络的CPGP-GCN模型,以及使用图注意力网络的CPGP-GAT模型。在Fake News Net数据集上,提出的模型与多个基线模型进行了实验对比。实验结果表明,CPGP-GCN、CPGP-GAT模型的综合性能均优于其它模型,且CPGP-GCN模型整体性能要优于CPGP-GAT。在Fake News Net的Gossip Cop子数据集上,性能较优的CPGP-GCN准确率和F1分数,比基线模型相应最优的指标分别提升了4.02%和3.66%,在Politi Fact子数据集上则分别提升了3.87%和3.23%。消融实验结果也验证了用户评论和传播信息对于新闻真实性评估的重要性,且二者具有互补作用。
基于多源用户评论的评分预测研究
这是一篇关于个性化推荐,协同过滤,评论的论文, 主要内容为在“大数据”时代,互联网上每天都会产生海量数据,造成“信息过载”问题。“信息过载”问题是指人们在获取自己感兴趣的信息时,因为面对的信息过于繁杂,很难找到自己真正需要的信息。推荐系统是当前应对“信息过载”问题最有用的方法之一,在诸多领域都发挥着重要的作用。协同过滤推荐算法作为当前使用范围最广的一种推荐算法,可以对用户的历史行为记录进行统计和分析,从而挖掘出用户偏好以及物品属性,为用户提供更精准的个性化推荐服务。协同过滤推荐算法还可以挖掘出用户没有表现出来的偏好,提高推荐结果的多样性和新颖性。但该算法有一个严重的缺陷,在用户-物品评分矩阵极度稀疏时,存在数据稀疏问题,预测准确度会受到很大影响。传统的推荐算法往往只利用用户对物品的评分或用户的历史行为记录来获取用户偏好,忽视了用户评论中包含的信息,因此会造成推荐结果出现偏离。用户撰写的评论往往蕴含着丰富的语义信息,可以反映用户对物品不同属性的偏好。近年来,随着隐含语义分析技术的发展,研究者们开始通过使用用户评论更精准地获得用户偏好和物品属性,从而提高个性化推荐的准确度。聚焦于推荐系统中的评分预测问题,本文主要通过利用用户历史评分信息,结合评论补充算法对用户评论进行扩充,针对数据稀疏问题提出了基于多源用户评论的评分预测算法。其中主要包含了以下方面的工作:·分析当前推荐算法的研究现状,对传统的协同过滤算法以及基于评论文本的推荐算法进行调研。·提出了基于多源相似用户评论的评分预测算法。该算法首先设计评论补充算法为每个用户从相似用户处收集补充评论,其中相似用户是指具有相似消费行为和历史评分记录的用户;然后运用隐含语义分析技术提取评论中蕴含的用户偏好信息和物品属性信息;最后使用多层感知机将用户偏好信息和物品属性信息进行整合,实现基于多源用户评论的评分预测模型。·通过在四个基准数据集上完成验证实验,对本文提出的算法与传统的基于协同过滤的评分预测算法以及基于评论文本的评分预测算法进行性能比对。实验结果表明,相比于传统的基于协同过滤的评分预测算法以及基于评论文本的评分预测算法,本文提出的算法性能有所提高。·对基于多源相似用户评论的评分预测算法进行了改进,提出了基于多源用户评论的评分预测算法,通过在四个基准数据集上进行消融实验,验证了该算法的有效性。
基于多源用户评论的评分预测研究
这是一篇关于个性化推荐,协同过滤,评论的论文, 主要内容为在“大数据”时代,互联网上每天都会产生海量数据,造成“信息过载”问题。“信息过载”问题是指人们在获取自己感兴趣的信息时,因为面对的信息过于繁杂,很难找到自己真正需要的信息。推荐系统是当前应对“信息过载”问题最有用的方法之一,在诸多领域都发挥着重要的作用。协同过滤推荐算法作为当前使用范围最广的一种推荐算法,可以对用户的历史行为记录进行统计和分析,从而挖掘出用户偏好以及物品属性,为用户提供更精准的个性化推荐服务。协同过滤推荐算法还可以挖掘出用户没有表现出来的偏好,提高推荐结果的多样性和新颖性。但该算法有一个严重的缺陷,在用户-物品评分矩阵极度稀疏时,存在数据稀疏问题,预测准确度会受到很大影响。传统的推荐算法往往只利用用户对物品的评分或用户的历史行为记录来获取用户偏好,忽视了用户评论中包含的信息,因此会造成推荐结果出现偏离。用户撰写的评论往往蕴含着丰富的语义信息,可以反映用户对物品不同属性的偏好。近年来,随着隐含语义分析技术的发展,研究者们开始通过使用用户评论更精准地获得用户偏好和物品属性,从而提高个性化推荐的准确度。聚焦于推荐系统中的评分预测问题,本文主要通过利用用户历史评分信息,结合评论补充算法对用户评论进行扩充,针对数据稀疏问题提出了基于多源用户评论的评分预测算法。其中主要包含了以下方面的工作:·分析当前推荐算法的研究现状,对传统的协同过滤算法以及基于评论文本的推荐算法进行调研。·提出了基于多源相似用户评论的评分预测算法。该算法首先设计评论补充算法为每个用户从相似用户处收集补充评论,其中相似用户是指具有相似消费行为和历史评分记录的用户;然后运用隐含语义分析技术提取评论中蕴含的用户偏好信息和物品属性信息;最后使用多层感知机将用户偏好信息和物品属性信息进行整合,实现基于多源用户评论的评分预测模型。·通过在四个基准数据集上完成验证实验,对本文提出的算法与传统的基于协同过滤的评分预测算法以及基于评论文本的评分预测算法进行性能比对。实验结果表明,相比于传统的基于协同过滤的评分预测算法以及基于评论文本的评分预测算法,本文提出的算法性能有所提高。·对基于多源相似用户评论的评分预测算法进行了改进,提出了基于多源用户评论的评分预测算法,通过在四个基准数据集上进行消融实验,验证了该算法的有效性。
文本信息增强的矩阵分解模型及其在推荐系统中的应用研究
这是一篇关于矩阵分解,推荐系统,文本,评论的论文, 主要内容为在过去的十多年中,推荐系统被学者们广泛研究,一些实用的推荐方法也被运用到了现实的工业系统之中,如移动软件市场、电商网站、电影网站等等。传统的推荐系统的方法主要集中研究用户对物品的评分,但是在现实的系统中,用户在对物品打分时,通常会留下一段文本描述自己的感受,表明自己评分的原因和立场。这些文本信息中通常包含丰富且重要的信息,如用户的偏好,物品的特性。但是,大多数已有的推荐系统模型常常会忽略这些文本信息,原因在于文本信息处理困难并常带有大量噪音、数据维度不一致、难以与传统模型相整合等等。本文提出了一种文本信息增强的矩阵分解模型,尝试同时利用评分和文本信息,并研究其在推荐系统中的各项应用。本文的贡献如下:一、提出了一个利用文本中名词的主题特征建模来增强用户特征矩阵的矩阵分解模型。二、进一步提出了一个同时利用文本中名词和修饰词来增强物品特征矩阵的矩阵分解模型。三、实现了一个基于本文提出的模型的原型系统,展示了本文的模型能在现实中被合理地利用。同时,依据提出的模型和方法,本文在现实的数据集上进行了大量的相关实验,证明了模型对文本信息的有效利用,并研究了模型在推荐系统上的各项应用,如提高推荐准确度、改善冷启动问题等等。
基于评论的推荐模型设计与实现
这是一篇关于推荐系统,评论,局部注意力机制,联邦学习,数据孤岛的论文, 主要内容为近年来互联网行业发展迅猛,数据量呈指数式增长,信息过载问题也日益严重。推荐系统作为一种解决手段已被广泛采用,推荐系统可以帮助用户根据历史记录中找到用户自身偏好。这种便捷、智能的系统已在用户中非常流行。随着推荐系统的发展和企业间的竞争,提高推荐系统的准确性已成为企业增强核心竞争力的关键。推荐系统通过信息过滤为人们提供有价值的信息,基于矩阵分解的推荐模型已被广泛应用于推荐系统中。但是在数据稀疏程度高时,这种模型的推荐效果不佳。为了缓解数据稀疏的问题,许多推荐模型利用了附属信息,基于评论的推荐模型是其中一种。它将评论信息作为辅助信息来提取用户特征和项目特征,缓解数据稀疏带来的冷启动问题。但是这些模型普遍没有考虑评论中单词或短语的权重以及评论中的序列信息,因此推荐的质量受到限制。同数据稀疏问题一样,数据孤岛问题也会导致推荐效果受到影响。由于商业竞争和数据隐私等因素导致许多业务类似的公司之间数据不共享。因此在推荐时会因为单一公司数据量和数据类型不足影响推荐效果和用户体验。解决这种数据孤岛问题可以采用联邦学习和推荐系统相结合的方法。基于联邦学习的推荐模型采用分布式结构联合各个不同客户端的数据,使得推荐模型能利用更多的数据类型进行模型训练以提高推荐性能。针对上述推荐系统存在的问题,本文从以下两个方面进行研究:(1)基于局部注意力和GRU的推荐模型。本文提出了一种结合局部注意力和门控循环单元的推荐模型(Deep Recommendation Based on Local attention and GRU,DLAG)。DLAG模型的思路如下:首先使用局部注意力为评论中的单词或短语分配权重。其次将带有权重的评论信息送入卷积神经网络提取评论特征。得到用户特征向量和商品特征向量后再利用双向门控循环单元提取出评论之间的序列信息,并生成最终特征向量。最后,利用神经协同过滤算法预测用户对商品的评分。该模型通过对评论的单词进行加权和提取序列信息的方式缓解数据稀疏的问题。通过对三个不同的数据集进行训练,实验结果表明,DLAG模型在特定数据集上的推荐性能优于其他模型。(2)基于联邦学习的推荐模型。用户的购买数据普遍分散在各个网购平台,而组成这些购买数据的特征相似,它们能映射在同一特征空间,这样就为联合这些数据训练推荐模型提供了方便。为了使DLAG模型在这种数据分散情况下推荐效果更佳,本文提出利用联邦学习的思想训练DLAG模型(Fed-DLAG),模型采用的算法为联邦平均算法(Fed AVG)。该算法需要多个客户端和一个中央服务器共同协作完成推荐模型的训练。首先中央服务器初始化模型参数并为各个客户端分配权重,其次中央服务器在客户端上传梯度时根据权重进行加权汇总,最后再向各个客户端分发中央服务器更新后的参数。这一过程会循环多次直至模型收敛。本文在此基础上增加了差分隐私算法来实现上传梯度时的私密性,并在模型训练时控制客户端训练的轮次,减少了多余的通信成本。实验结果表明,Fed-DLAG模型能够保证用户数据隐私的情况下与DLAG模型的推荐性能相当。
基于评论数据的注意力推荐模型的研究
这是一篇关于推荐系统,注意力机制,评论,矩阵分解,协同过滤的论文, 主要内容为随着智能化、数据化的兴起,大数据与人工智能在科技发展中起着越来越重要的作用。大数据中蕴含着丰富的价值和巨大的潜力,如果能够充分挖掘这些价值和潜力,那么信息社会的发展将突飞猛进。推荐系统能够挖掘大数据中蕴含的价值与潜力,所以推荐系统在企业的发展和互联网行业的兴起中扮演者一个重要的角色。协同过滤是传统推荐系统的主要方法。时至今日,协同过滤算法依然是现有推荐系统的主流算法。协同过滤主要应用的方法是矩阵分解,通过将评分矩阵分解为用户的隐含因子以及商品的隐含因子两个矩阵进行交互后,来对未评分的商品进行预测评分。但是协同过滤方法在数据稀疏程度较高的情况下推荐效果不佳。通过借助一些辅助信息如商品ID、用户ID、商品评论、用户评论等可以在一定程度上解决数据稀疏问题。所以,基于评论的推荐模型应运而生,但是普通的基于评论的推荐模型没有考虑不同的词对于建模用户和商品的重要性,许多基于评论的模型没有对评论中的词划分权重,导致许多无效词没有被过滤,影响推荐效果。所以,在基于评论的模型中仍存在以下问题:(1)评论中的词语没有划分权重,无效词语没有被过滤。(2)基于评论的模型可解释性差。传统的基于评论的推荐模型对用户的评论和商品的评论分别进行建模,没有考虑二者之间的关联,导致预测结果的可解释性差。(3)过于陈旧的用户评论对商品的推荐意义不大。(4)基于评论的推荐模型虽然能够从文本信息中提取用户偏好和商品特征,有效缓解了评分数据的稀疏性,但由于没有使用评分矩阵,所以无法获取的用户和商品的潜在因子。针对以上问题,本文从以下两个方面进行研究:(1)基于双重注意力机制的文本推荐模型:针对评论中关键词与无效词语没有加以区分以及没有考虑商品和用户二者之间的关联性上,Deep Recommendation Based on Dual Attention Mechanism(DARA)模型运用了双重注意力机制,首先局部注意力机制提取了文本中的关键字,提取了现有评论的特征同时过滤掉了无用信息。之后使用商品描述注意力与用户特征相结合,增强用户商品之间的关联性。实验结果表明,DARA模型在特定数据集上的推荐效果优于其他模型。(2)基于评论文本热度的推荐模型:针对太过久远用户的评论对即将被推荐给用户的商品没有实际意义的问题,本文提出的Recommendation model based on the heat of comment text(RRHP)模型设计了一个时间制裁函数。对当前需要推荐的商品进行时间间隔惩罚,时间间隔越久,用户对商品的评论对模型的影响越小。同时,在解决用户特征与商品的深层隐特征未被充分挖掘的问题上,本文将已有的评分矩阵的隐特征加入用户与商品的特征之中,提高预测的准确率。在实验部分,针对Amazon 5-core上的四个数据集进行了实验,实验结果表明RRHP模型的推荐效果优于其他模型。
基于注意力机制的茶产品深度协同推荐研究
这是一篇关于茶产品,文本卷积神经网络,交互对注意力机制,评论,推荐的论文, 主要内容为随着农产品电商的飞速发展,茶产品作为一种特色农产品,正努力开辟电商渠道,从线下迈向线上,通过网络走向千家万户。推荐系统当前在电影、图书等电子商务中的应用与研究越来越广泛,也将成为未来茶产品电子商务发展的必然趋势。当前的茶产品推荐系统,不能识别用户关注点的差异,而识别用户的兴趣点,对进一步挖掘用户偏好和提高推荐精度有着重要的意义。在深度学习中,注意力机制通过对特征向量的权重进行重新赋值,提高对重点特征的关注效率,因此利用注意力机制的特性,提高协同过滤方法对稀疏数据中重点特征的关注能力是本文的研究重点。本论文以茶产品电子商务个性化推荐为研究对象,基于茶产品的评论信息,分别提取用户偏好和茶产品特征。主要研究内容如下:(1)针对当前的茶产品推荐系统,很少考虑用户和茶产品的交互信息对关注重点特征的影响,提出了用户与茶产品信息关联的注意力机制模型—Pair-Attention。在计算用户特征的注意力权重时,加入茶产品特征的影响,获取用户的关注点;在更新茶产品特征的注意力权值时,将用户特征作为辅助信息,探究交互信息对获取茶产品重点特征的影响。(2)提出了一种基于注意力机制的茶产品深度协同推荐模型。该模型利用评论文本形成的词向量矩阵作输入。并采用多组不同尺寸卷积核的文本卷积神经网络对文本向量矩阵进行特征提取。同时结合Pair-Attention,对用户和茶产品特征向量进行赋权,起到关注重点特征的作用。最后通过多层感知机完成用户的评分预测和推荐任务。(3)利用真实茶产品数据集进行相关实验仿真,验证本文提出的交互对注意力机制—Pair-Attention的有效性,并探究不同参数设置对茶产品推荐过程中评分预测精度的影响。同时,将本文提出的算法与传统的矩阵分解算法、多层感知机算法和扩展奇异值分解算法等进行对比,实验结果表明,本文提出的融合交互对注意力机制的茶产品推荐方法在性能上明显优于传统的推荐方法。
基于评论的推荐模型设计与实现
这是一篇关于推荐系统,评论,局部注意力机制,联邦学习,数据孤岛的论文, 主要内容为近年来互联网行业发展迅猛,数据量呈指数式增长,信息过载问题也日益严重。推荐系统作为一种解决手段已被广泛采用,推荐系统可以帮助用户根据历史记录中找到用户自身偏好。这种便捷、智能的系统已在用户中非常流行。随着推荐系统的发展和企业间的竞争,提高推荐系统的准确性已成为企业增强核心竞争力的关键。推荐系统通过信息过滤为人们提供有价值的信息,基于矩阵分解的推荐模型已被广泛应用于推荐系统中。但是在数据稀疏程度高时,这种模型的推荐效果不佳。为了缓解数据稀疏的问题,许多推荐模型利用了附属信息,基于评论的推荐模型是其中一种。它将评论信息作为辅助信息来提取用户特征和项目特征,缓解数据稀疏带来的冷启动问题。但是这些模型普遍没有考虑评论中单词或短语的权重以及评论中的序列信息,因此推荐的质量受到限制。同数据稀疏问题一样,数据孤岛问题也会导致推荐效果受到影响。由于商业竞争和数据隐私等因素导致许多业务类似的公司之间数据不共享。因此在推荐时会因为单一公司数据量和数据类型不足影响推荐效果和用户体验。解决这种数据孤岛问题可以采用联邦学习和推荐系统相结合的方法。基于联邦学习的推荐模型采用分布式结构联合各个不同客户端的数据,使得推荐模型能利用更多的数据类型进行模型训练以提高推荐性能。针对上述推荐系统存在的问题,本文从以下两个方面进行研究:(1)基于局部注意力和GRU的推荐模型。本文提出了一种结合局部注意力和门控循环单元的推荐模型(Deep Recommendation Based on Local attention and GRU,DLAG)。DLAG模型的思路如下:首先使用局部注意力为评论中的单词或短语分配权重。其次将带有权重的评论信息送入卷积神经网络提取评论特征。得到用户特征向量和商品特征向量后再利用双向门控循环单元提取出评论之间的序列信息,并生成最终特征向量。最后,利用神经协同过滤算法预测用户对商品的评分。该模型通过对评论的单词进行加权和提取序列信息的方式缓解数据稀疏的问题。通过对三个不同的数据集进行训练,实验结果表明,DLAG模型在特定数据集上的推荐性能优于其他模型。(2)基于联邦学习的推荐模型。用户的购买数据普遍分散在各个网购平台,而组成这些购买数据的特征相似,它们能映射在同一特征空间,这样就为联合这些数据训练推荐模型提供了方便。为了使DLAG模型在这种数据分散情况下推荐效果更佳,本文提出利用联邦学习的思想训练DLAG模型(Fed-DLAG),模型采用的算法为联邦平均算法(Fed AVG)。该算法需要多个客户端和一个中央服务器共同协作完成推荐模型的训练。首先中央服务器初始化模型参数并为各个客户端分配权重,其次中央服务器在客户端上传梯度时根据权重进行加权汇总,最后再向各个客户端分发中央服务器更新后的参数。这一过程会循环多次直至模型收敛。本文在此基础上增加了差分隐私算法来实现上传梯度时的私密性,并在模型训练时控制客户端训练的轮次,减少了多余的通信成本。实验结果表明,Fed-DLAG模型能够保证用户数据隐私的情况下与DLAG模型的推荐性能相当。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码工坊 ,原文地址:https://bishedaima.com/lunwen/51917.html