基于用户评论的跨域推荐模型
这是一篇关于跨域推荐,评论信息,生成对抗网络,域自适应,细粒度观点,跨域迁移的论文, 主要内容为传统推荐系统仅利用评分数据或少量评论数据等交互信息进行推荐,而这些用户-项目交互占比很小,在信息化时代下,存在严重的数据稀疏和冷启动问题。随着深度学习和神经网络的发展,出现了大量的跨域推荐(Cross-Domain Recommendation,CDR)模型方法,其核心思想是利用从其他领域收集的信息来辅助另一个领域进行。虽然现有的跨域推荐模型方法在一定程度上缓解了数据稀疏性问题,但仍然存在如下一些问题:一是只是简单利用评分数据,没有将用户和项目的其它属性充分利用起来,数据本身挖掘不足,导致成本增加;二是知识跨域迁移难,面临冷启动问题;三是存在数据稀疏和数据不平衡问题。因此,本文为解决以上跨域推荐中存在的问题,进行了以下两方面的工作:(1)针对现有大多数跨域推荐模型方法只是简单利用评分数据,对评论信息挖掘不足,论文提出了一个基于评论细粒度观点的跨域推荐模型(Cross-Domain Recommendation Model Based on Fine-Grained Opinion from Review,FGOR-CDRM)。评论信息中往往包含用户的多个观点,如何充分利用评论信息中的细粒度观点挖掘其潜在价值以更好解决跨域推荐冷启动和数据稀疏问题,成为当下跨域推荐的研究重点与难点。FGOR-CDRM模型主要由评论细粒度观点提取、辅助评论增强、跨域相关性学习三个模块组成。首先,将文本卷积神经网络(Text CNN)与门控机制结合,通过设置两个全局细粒度观点矩阵指导查询,有效提取评论信息的细粒度观点;其次,在文本卷积之上增加一层卷积,利用相似非重叠用户的评论构建辅助文档,在增加训练数据多样性的同时有效缓解了数据稀疏;最后,学习跨域细粒度观点之间的相关性,利用静态细粒度观点构建相关矩阵并进行语义匹配,实现目标域冷启动用户对项目的评分预测。在实验中我们选取Amazon数据集中的Book、Movies and TV、CDs and Vinyl三个类别形成三个数据领域对进行实验。实验结果表明,FGOR-CDRM模型在三个数据领域对下的表现均优于其它基准模型,以“电影-图书”数据领域对为例,FGOR-CDRM模型的MAE比基线模型中ANR模型提高6.09%,比CDLFM模型提高3.58%;(2)针对在跨域推荐系统的数据稀疏性、数据不平衡以及信息迁移难问题,论文提出了一个基于GAN的用户评论跨域推荐模型(Cross-Domain Recommendation Model of User Review based on GAN,CDUR-GAN)。首先,在CDUR-GAN模型中加入用户评论信息和图片信息,以便充分利用数据,并为用户、项目及其交互学习可迁移的潜在表示;其次,在判别器中融入注意力机制,在判别器输出叠加之后,加入Attention层,以训练提升生成器模型的推荐准确度和稳定性;最后,采用对抗域自适应技术的思想,针对推荐系统领域重新进行改进,将对抗域自适应技术应用到跨域推荐领域,使得目标域中的用户-项目交互尽可能靠近源域评分特征,以解决在跨域之间信息迁移难的问题。在实验中,选取Amazon数据集中的Digital Music、Music Instruments、Home&Kitchen、Office Products、CDs五个类别形成三个数据域对进行实验。实验结果表明,CDUR-GAN对比基线模型中表现最好的ANR模型,在三个数据域对下MAE分别取得了6.46%、9.06%、3.75%的提升,MSE取得了6.84%、4.87%的提升。
知识关联的跨领域推荐算法研究
这是一篇关于跨领域推荐,知识图谱,冷启动,图注意力网络,域自适应的论文, 主要内容为推荐系统是一种卓越的信息过滤工具,采用个性化的方式为用户提供满足其需求的内容,对于缓解大数据时代下的“信息过载”问题具有重要意义。然而,传统单一领域下的推荐系统受限于冷启动、数据稀疏等问题。跨领域推荐为上述问题提供了解决方案,其利用辅助领域更加丰富的信息对用户行为进行更加准确的建模,从而引导数据稀疏的目标领域下的推荐任务,提高推荐系统的综合性能。但由于不同领域间存在数据异构与特征不匹配等问题,直接进行领域间的知识迁移可能会导致负面影响。针对上述挑战,本文针对知识关联的跨领域推荐算法开展研究,主要聚焦于跨领域知识的迁移、跨领域协同偏好信息的捕获以及多源信息的合理利用等研究内容。本文主要研究工作如下:(1)基于知识图谱的跨领域知识关联分析。针对跨领域间通常存在的数据异构和知识异质问题,本文提出将知识图谱作为公共知识建立领域间的关联。在此基础上,通过对知识图谱提供信息进行详细分析,本文提出从语义内容和连通结构两种角度实现域间关联,以实现对知识图谱的可利用信息的充分挖掘。(2)基于域自适应的语义特征提取模型。模型从语义内容角度出发,针对包含多领域海量信息的知识图谱,采用域自适应学习的方法自动地提取领域内可迁移的语义内容特征,以发掘领域间潜在语义关联。其中,通过上下文表示学习算法挖掘知识图谱中推荐相关的语义信息,进而基于对抗训练的思想将跨领域语义特征的分布进行统一,以实现语义概念的自动组织及领域间可迁移语义特征的有效提取,从而将不同领域的知识进行关联。(3)基于图注意力的跨领域推荐模型。模型从域间知识的拓扑连通关系出发,通过端到端的方式对跨领域高阶信息进行显式地建模。本文构建了一种跨领域协同知识图,通过知识图谱连接跨领域的用户-项目交互信息,实现跨领域数据的关联。在跨领域协同知识图谱中,利用图注意力网络更新图节点(用户、项目或知识图谱中的实体)的嵌入表示。进一步地,本文设计多种特征融合方式并进行对比分析,将基于域自适应学习的语义内容信息与跨领域协同知识图的拓扑连通信息进行融合,旨在生成更加完善的项目画像,最终预测目标领域项目与用户兴趣的匹配程度。本文在真实数据集上对冷启动场景进行模拟并开展实验,分别从准确性和多样性两个方面综合评估推荐算法性能。实验结果表明,相比于其它单领域或跨领域推荐算法,本文提出的算法分别在MRR及多样性指标上提升了11.41-29.76%和0.41-2.11%,能够在准确预测用户既有偏好的同时,探索用户更加广泛的潜在兴趣,从而提升用户体验并增强跨领域推荐的综合性表现。
基于用户评论的跨域推荐模型
这是一篇关于跨域推荐,评论信息,生成对抗网络,域自适应,细粒度观点,跨域迁移的论文, 主要内容为传统推荐系统仅利用评分数据或少量评论数据等交互信息进行推荐,而这些用户-项目交互占比很小,在信息化时代下,存在严重的数据稀疏和冷启动问题。随着深度学习和神经网络的发展,出现了大量的跨域推荐(Cross-Domain Recommendation,CDR)模型方法,其核心思想是利用从其他领域收集的信息来辅助另一个领域进行。虽然现有的跨域推荐模型方法在一定程度上缓解了数据稀疏性问题,但仍然存在如下一些问题:一是只是简单利用评分数据,没有将用户和项目的其它属性充分利用起来,数据本身挖掘不足,导致成本增加;二是知识跨域迁移难,面临冷启动问题;三是存在数据稀疏和数据不平衡问题。因此,本文为解决以上跨域推荐中存在的问题,进行了以下两方面的工作:(1)针对现有大多数跨域推荐模型方法只是简单利用评分数据,对评论信息挖掘不足,论文提出了一个基于评论细粒度观点的跨域推荐模型(Cross-Domain Recommendation Model Based on Fine-Grained Opinion from Review,FGOR-CDRM)。评论信息中往往包含用户的多个观点,如何充分利用评论信息中的细粒度观点挖掘其潜在价值以更好解决跨域推荐冷启动和数据稀疏问题,成为当下跨域推荐的研究重点与难点。FGOR-CDRM模型主要由评论细粒度观点提取、辅助评论增强、跨域相关性学习三个模块组成。首先,将文本卷积神经网络(Text CNN)与门控机制结合,通过设置两个全局细粒度观点矩阵指导查询,有效提取评论信息的细粒度观点;其次,在文本卷积之上增加一层卷积,利用相似非重叠用户的评论构建辅助文档,在增加训练数据多样性的同时有效缓解了数据稀疏;最后,学习跨域细粒度观点之间的相关性,利用静态细粒度观点构建相关矩阵并进行语义匹配,实现目标域冷启动用户对项目的评分预测。在实验中我们选取Amazon数据集中的Book、Movies and TV、CDs and Vinyl三个类别形成三个数据领域对进行实验。实验结果表明,FGOR-CDRM模型在三个数据领域对下的表现均优于其它基准模型,以“电影-图书”数据领域对为例,FGOR-CDRM模型的MAE比基线模型中ANR模型提高6.09%,比CDLFM模型提高3.58%;(2)针对在跨域推荐系统的数据稀疏性、数据不平衡以及信息迁移难问题,论文提出了一个基于GAN的用户评论跨域推荐模型(Cross-Domain Recommendation Model of User Review based on GAN,CDUR-GAN)。首先,在CDUR-GAN模型中加入用户评论信息和图片信息,以便充分利用数据,并为用户、项目及其交互学习可迁移的潜在表示;其次,在判别器中融入注意力机制,在判别器输出叠加之后,加入Attention层,以训练提升生成器模型的推荐准确度和稳定性;最后,采用对抗域自适应技术的思想,针对推荐系统领域重新进行改进,将对抗域自适应技术应用到跨域推荐领域,使得目标域中的用户-项目交互尽可能靠近源域评分特征,以解决在跨域之间信息迁移难的问题。在实验中,选取Amazon数据集中的Digital Music、Music Instruments、Home&Kitchen、Office Products、CDs五个类别形成三个数据域对进行实验。实验结果表明,CDUR-GAN对比基线模型中表现最好的ANR模型,在三个数据域对下MAE分别取得了6.46%、9.06%、3.75%的提升,MSE取得了6.84%、4.87%的提升。
基于迁移学习的核燃料芯块端面缺损检测算法研究
这是一篇关于核燃料芯块,缺陷检测,语义分割,迁移学习,域自适应的论文, 主要内容为核能作为一种低碳环保的清洁能源,对我国未来能源结构转型具有重要意义。核能的主要来源是核燃料芯块裂变所产生的热能,而受制于材料及工艺等因素,核燃料芯块表面可能存在多种类型的缺陷。缺陷分为因大面积掉块形成的缺损和因挤压造成的裂纹两大类,其中又以端面缺损危害性最大。对于核燃料芯块缺损检测,由于核燃料领域的特殊性,目前常用的方法还是使用基于固定阈值的传统图像处理算子,但在应对复杂多变的缺损特征上表现得不尽如人意。基于深度学习技术的缺损检测方法是一种有望解决上述困难的新方法。该方法在训练阶段通过大量类别分布均衡的原始数据来应对多变的缺损形貌,但是核燃料芯块制备过程良品率远超次品率,获取大量缺损样本存在固有的困难。针对目前核燃料芯块检测尚存的问题,提出基于迁移学习的域自适应缺损检测方案,以实现在缺少样本或者标签的情况下快速完成检测任务。本课题主要研究工作如下:第一部分:分析检测任务,搭建图像采集系统与建立迁移数据集。首先分析芯块的外形结构特点,明确检测任务。在实验室环境下搭建图像采集系统,采集不同材质芯块端面缺损图像,构建迁移学习数据集。第二部分:设计并验证缺损检测网络Defect Net。首先分析了原始UNet结构的相关特点及在本领域的优势。使用坐标协同注意力机制,组正则化等特征模块来改善UNet结构特征恢复能力弱等问题并增强其泛化性能,为下一步迁移网络做准备。实验结果表明,使用Defect Net在源域数据集上的F-score评分达到了91.52%,并经过消融实验验证,特征恢复环节增加的特性模块并没有给网络参数带来显著提升。第三部分:设计迁移网络方式并验证不同种迁移方案的性能。首先比较不同迁移方案的优缺点,选定域自适应方案来解决目标域问题。在Defect Net基础上增加多层域自适应层来学习源域和目标域之间差异转换特征,提出使用不同权重的协方差矩阵损失来充当自适应层学习目标,并在实验中对比参与训练的目标域标签数量对网络性能的影响情况。实验结果证明,在使用3.3%真实标签参与网络训练的情况下,网络停止时F-score指标达到了97.23%。搭建模拟检测平台验证在线检测性能,Ada Defect Net最终实现了97.54%的平均检测准确率,其结果也满足实际应用需要。本课题致力于将迁移学习技术应用到核燃料芯块端面缺损检测领域中,使用域自适应迁移解决相关问题。实验结果表明:相比于传统深度学习算法需要大量标注数据,本方法可以在标注极少量真实标签的情况下实现对芯块端面缺损的准确检测。本方案能够降低网络训练要求,加速深度学习技术落地,为实现对核燃料芯块检测提出新的解决方案。
监控场景的域自适应行人重识别算法研究
这是一篇关于行人重识别,域自适应,多维度注意力,域内归一化,多域特征融合的论文, 主要内容为随着“平安城市”、“城市立体化治安防控”等安防项目的落地实施,行人重识别作为智能安防的核心技术,在日常生活中的重要性与日俱增。行人重识别(Re-ID)技术旨在从不同摄像范围内查找出目标人物,广泛应用于公共安全、刑事侦查和智能商业等领域,是人工智能方向的研究热点之一。当前有监督场景的行人重识别技术已经获得了极高的精度,然而在实际应用中,要求数据集属于同一相机网络,极大的限制了网络的泛化能力。因此,将在源域上训练的网络迁移到目标域中的域自适应Re-ID成为当前的研究重点。然而,不同相机拍摄的数据,存在背景、分辨率和光照不同等问题,导致行人表征提取模糊和身份分类错误。此外,训练的源域与目标域之间存在较大的风格差异和域内特征差异分布剧烈,导致网络提取多域特征能力不足。针对上述问题,本文展开了深入研究。主要工作如下:(1)为了更好的挖掘不同通道的显著特征,同时避免行人身份过拟合,本文提出了基于多维度注意力机制的行人重识别网络(MDAN)。具体地说,MDAN由骨干网络、多维度注意力模块(MAB)和优化损失模块(BIM)组成。MAB用来引导骨干网络提取不同通道中的显著空间信息,BIM通过减少对Re-ID损失函数约束,避免网络训练对行人身份的过拟合。在这两个模块的加成下,网络的训练过程可以学习到更有效的行人表征信息,并加快损失函数的收敛,提高网络的训练速度。(2)为了降低域间和域内特征剧烈分布差异的影响,本文提出基于多域特征差异的域自适应行人重识别网络(MDFUDA-Net)。具体地说,MDFUDA-Net由骨干网络、域内特征归一化模块(IDNB)和多域特征融合模块(IFMB)组成。IDNB通过在消除域内风格特征的同时关注被实例归一化模块丢失掉的信息,提高网络不同域特征的提取能力。IFMB通过对源域和目标域特征实现更深层次的域间融合来降低域间隙带来的性能影响。MDFUDA-Net利用这两个模块同时削弱域间和域内风格差异,提高网络迁移性能。(3)为了验证MDAN和MDFUDA-Net的有效性与先进性,本文在Market-1501、Duke MTMC-Re ID、MSMT17三个公开数据集上进行了大量的实验对比以及消融实验。实验结果表明,与目前域自适应行人重识别方法相比,本文设计的MDAN和MDFUDA-Net在mAP和Rank-1精度上均达到了较高的性能。
基于特征对齐域自适应网络的显微图像细胞核分割研究
这是一篇关于显微图像,细胞核分割,域自适应,生成对抗网络,自注意力的论文, 主要内容为病理学分析是许多疾病临床诊断的金标准。显微镜下病理切片中细胞核的数目、形态和分布可以为临床医生提供诊断和治疗依据。然而,临床医生根据显微图像来手动判断是繁琐且耗时的,还受医生主观性因素得影响。因此,采用深度学习等自动分割方法来实现显微图像中的细胞核分割是十分可取且有意义的。但是,显微图像中细胞核重叠粘连、形状差异大、核内颜色不均、背景复杂,且标签的难以获取,导致显微图像细胞核分割是一个极具挑战性的任务。针对上述问题,本文构建了一个结合域自适应网络和分割网络的两阶段细胞核分割框架。其中,第一阶段的域自适应网络利用源域图像来生成类目标域图像,从而形成可用于目标域图像分割任务的训练数据;第二阶段的分割网络用来学习扩增后的类目标域图像特征,通过加强提取细胞核的判别性特征,实现对目标域显微图像中细胞核的分割。针对目标域图像标签难以获取等问题,本文首先在第一阶段设计了一个基于整体和局部特征对齐的域自适应网络(Global and Local Feature Alignment Network,GLFA-Net),用于带标签的类目标域图像生成,其主要包括全局特征对齐网络、局部特征对齐网络、增强一致性正则化三个方面。其中,全局特征对齐网络主要基于Cycle-GAN改进,通过添加域不变和域特定特征提取器来加强源域和目标域之间整体语义特征的一致性,为生成类目标域提供全局信息指导;局部特征对齐网络通过引入自注意力机制来强化网络中的局部信息,维持源域图像和生成的类目标域图像间像素级语义的一致性,从而有效区分细胞核和复杂混乱的背景区域;此外,还引入增强的一致性正则化来优化整体特征对齐损失函数,从而动态关注语义和结构变化,增强判别器对增强数据的敏感性,提升网络泛化能力和提高生成的类目标域图片的质量。其次,在第二阶段将扩充后的类目标域数据应用于分割网络。具体地,在第二阶段采用Mask R-CNN为主体,并引入轮廓提取单元构建分割网络,从而让网络更加关注细胞核边界区域。本文在具有挑战性的源域数据集BBBCV039、目标域数据集Kumar和TNBC上评估所提出方法的性能,并将结果与目前最先进的方法进行比较。实验结果表明,所提出的方法在两个目标域数据集上与目前最先进的方法具有较强竞争力。
基于特征对齐域自适应网络的显微图像细胞核分割研究
这是一篇关于显微图像,细胞核分割,域自适应,生成对抗网络,自注意力的论文, 主要内容为病理学分析是许多疾病临床诊断的金标准。显微镜下病理切片中细胞核的数目、形态和分布可以为临床医生提供诊断和治疗依据。然而,临床医生根据显微图像来手动判断是繁琐且耗时的,还受医生主观性因素得影响。因此,采用深度学习等自动分割方法来实现显微图像中的细胞核分割是十分可取且有意义的。但是,显微图像中细胞核重叠粘连、形状差异大、核内颜色不均、背景复杂,且标签的难以获取,导致显微图像细胞核分割是一个极具挑战性的任务。针对上述问题,本文构建了一个结合域自适应网络和分割网络的两阶段细胞核分割框架。其中,第一阶段的域自适应网络利用源域图像来生成类目标域图像,从而形成可用于目标域图像分割任务的训练数据;第二阶段的分割网络用来学习扩增后的类目标域图像特征,通过加强提取细胞核的判别性特征,实现对目标域显微图像中细胞核的分割。针对目标域图像标签难以获取等问题,本文首先在第一阶段设计了一个基于整体和局部特征对齐的域自适应网络(Global and Local Feature Alignment Network,GLFA-Net),用于带标签的类目标域图像生成,其主要包括全局特征对齐网络、局部特征对齐网络、增强一致性正则化三个方面。其中,全局特征对齐网络主要基于Cycle-GAN改进,通过添加域不变和域特定特征提取器来加强源域和目标域之间整体语义特征的一致性,为生成类目标域提供全局信息指导;局部特征对齐网络通过引入自注意力机制来强化网络中的局部信息,维持源域图像和生成的类目标域图像间像素级语义的一致性,从而有效区分细胞核和复杂混乱的背景区域;此外,还引入增强的一致性正则化来优化整体特征对齐损失函数,从而动态关注语义和结构变化,增强判别器对增强数据的敏感性,提升网络泛化能力和提高生成的类目标域图片的质量。其次,在第二阶段将扩充后的类目标域数据应用于分割网络。具体地,在第二阶段采用Mask R-CNN为主体,并引入轮廓提取单元构建分割网络,从而让网络更加关注细胞核边界区域。本文在具有挑战性的源域数据集BBBCV039、目标域数据集Kumar和TNBC上评估所提出方法的性能,并将结果与目前最先进的方法进行比较。实验结果表明,所提出的方法在两个目标域数据集上与目前最先进的方法具有较强竞争力。
基于多视图信息的三维模型分类与检索算法研究
这是一篇关于三维模型分类与检索,多视图,小样本学习,域自适应的论文, 主要内容为三维模型的多视图信息能够全面地表征物体的视觉特性和潜在的空间结构信息。随着三维模型数据的飞速增长,如何对三维模型实现智能的分类与检索,是当前学术界和工业界的研究热点。目前,传统的三维模型分类方法需要大量的有标记的数据。然而,只有部分用于学术研究的三维模型数据集有详细的人工标注。因此,如何在有人工标记的训练对象很少的情况下实现对三维模型的有效分类,是一个亟待解决的问题。此外,不同的构建方式会使三维模型数据集呈现不同的数据格式与模态,因此,如何实现跨域三维模型检索,也是三维模型检索技术面临的一个挑战。针对目前有人工标记的三维模型数据集较少的问题,本文将基于视图的三维模型分类方法与小样本学习相结合,提出了基于小样本的多视图组合经验贝叶斯三维模型分类方法。该方法将训练集的样本输入到多视图卷积神经网络中,完成多视图预训练学习。然后,将在预训练中获得的深度神经网络权重通过“缩放和移动”的方式迁移到小样本任务中,并对组合经验贝叶斯学习中的超先验学习器进行元学习。最后,利用超先验学习器生成对应于不同特定训练任务的超参数,并使用这些超参数来更新和集成基础学习器,实现对于小样本任务的分类。为了验证该方法,本文划分了Meta-Model Net和Meta-Shape Net数据集,并在此基准上进行了大量实验,在与相关领域流行的算法比较后,验证了本方法的优越性。针对跨域的三维模型检索问题,本文将基于视图的三维模型检索方法与域自适应方法相结合,提出了基于多视图分批谱惩罚的跨域三维模型检索方法。在利用奇异值来量化特征的可转移性与可识别性的过程中,传统的域自适应网络往往认为只有具有最大奇异值的特征向量可以增强特征的可转移性,但是这种方式一定程度上抑制了特征的可识别性。该方法首先利用卷积神经网络提取三维模型的多视图特征。然后将池化后的特征传入条件对抗域适应网络,进而完成分类器与识别器的训练,最后通过分批谱惩罚的方式对多视图特征的最大奇异值进行惩罚。该方法在保证特征可转移性的同时,提高了特征的可识别性,实现了不同数据集之间的知识迁移。为了验证该方法,本文在PSB和NTU两个三维模型数据集上互相检索,并与相关领域流行的算法进行比较,验证了本文提出方法的优越性。
基于用户评论的跨域推荐模型
这是一篇关于跨域推荐,评论信息,生成对抗网络,域自适应,细粒度观点,跨域迁移的论文, 主要内容为传统推荐系统仅利用评分数据或少量评论数据等交互信息进行推荐,而这些用户-项目交互占比很小,在信息化时代下,存在严重的数据稀疏和冷启动问题。随着深度学习和神经网络的发展,出现了大量的跨域推荐(Cross-Domain Recommendation,CDR)模型方法,其核心思想是利用从其他领域收集的信息来辅助另一个领域进行。虽然现有的跨域推荐模型方法在一定程度上缓解了数据稀疏性问题,但仍然存在如下一些问题:一是只是简单利用评分数据,没有将用户和项目的其它属性充分利用起来,数据本身挖掘不足,导致成本增加;二是知识跨域迁移难,面临冷启动问题;三是存在数据稀疏和数据不平衡问题。因此,本文为解决以上跨域推荐中存在的问题,进行了以下两方面的工作:(1)针对现有大多数跨域推荐模型方法只是简单利用评分数据,对评论信息挖掘不足,论文提出了一个基于评论细粒度观点的跨域推荐模型(Cross-Domain Recommendation Model Based on Fine-Grained Opinion from Review,FGOR-CDRM)。评论信息中往往包含用户的多个观点,如何充分利用评论信息中的细粒度观点挖掘其潜在价值以更好解决跨域推荐冷启动和数据稀疏问题,成为当下跨域推荐的研究重点与难点。FGOR-CDRM模型主要由评论细粒度观点提取、辅助评论增强、跨域相关性学习三个模块组成。首先,将文本卷积神经网络(Text CNN)与门控机制结合,通过设置两个全局细粒度观点矩阵指导查询,有效提取评论信息的细粒度观点;其次,在文本卷积之上增加一层卷积,利用相似非重叠用户的评论构建辅助文档,在增加训练数据多样性的同时有效缓解了数据稀疏;最后,学习跨域细粒度观点之间的相关性,利用静态细粒度观点构建相关矩阵并进行语义匹配,实现目标域冷启动用户对项目的评分预测。在实验中我们选取Amazon数据集中的Book、Movies and TV、CDs and Vinyl三个类别形成三个数据领域对进行实验。实验结果表明,FGOR-CDRM模型在三个数据领域对下的表现均优于其它基准模型,以“电影-图书”数据领域对为例,FGOR-CDRM模型的MAE比基线模型中ANR模型提高6.09%,比CDLFM模型提高3.58%;(2)针对在跨域推荐系统的数据稀疏性、数据不平衡以及信息迁移难问题,论文提出了一个基于GAN的用户评论跨域推荐模型(Cross-Domain Recommendation Model of User Review based on GAN,CDUR-GAN)。首先,在CDUR-GAN模型中加入用户评论信息和图片信息,以便充分利用数据,并为用户、项目及其交互学习可迁移的潜在表示;其次,在判别器中融入注意力机制,在判别器输出叠加之后,加入Attention层,以训练提升生成器模型的推荐准确度和稳定性;最后,采用对抗域自适应技术的思想,针对推荐系统领域重新进行改进,将对抗域自适应技术应用到跨域推荐领域,使得目标域中的用户-项目交互尽可能靠近源域评分特征,以解决在跨域之间信息迁移难的问题。在实验中,选取Amazon数据集中的Digital Music、Music Instruments、Home&Kitchen、Office Products、CDs五个类别形成三个数据域对进行实验。实验结果表明,CDUR-GAN对比基线模型中表现最好的ANR模型,在三个数据域对下MAE分别取得了6.46%、9.06%、3.75%的提升,MSE取得了6.84%、4.87%的提升。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码向导 ,原文地址:https://bishedaima.com/lunwen/54452.html