迁移学习及其在跨领域推荐中的应用研究
这是一篇关于推荐,迁移学习,跨领域,CNN,评论文本,数据均衡的论文, 主要内容为互联网技术的不断普及以及大数据时代的到来使人们可以通过众多渠道获取大量的信息,在为人们带来无限便利的同时产生了“信息过载”问题,而推荐系统可以帮助人们从繁杂的信息中挑选出有价值的信息,很好的缓解了“信息过载”问题。然而传统的推荐存在数据稀疏和用户冷启动问题,跨领域推荐可以很好的解决这一问题,它将其它领域丰富的信息迁移到目标领域,帮助目标领域提高推荐的准确性。但目前大多的跨领域推荐工作均采用评分,忽略了包含着更为丰富的用户和项目信息的评论文本。为此,本文对跨领域推荐方法展开了深入的研究,主要工作如下:(1)考虑到推荐系统存在数据稀疏和用户冷启动问题,本文针对评论文本提出一种基于卷积神经网络的跨领域推荐模型(CNN-based Cross-domain Recommendation,CNCR)。首先将评论文本生成用户评论文本文档和项目评论文本文档,并生成对应的词向量文档;然后利用卷积神经网络(Convolutional Neural Network,CNN)有效的提取用户和项目评论文本文档中丰富的信息,得到用户特征和项目特征;其次利用迁移学习的思想,构造共享域作为知识迁移的桥梁,利用共享域的CNN提取源域和目标域的共享特征,同时利用源域和目标域的CNN提取领域特有的特征;最后将不同领域的特征融合进行评分预测,从而实现跨领域推荐。(2)考虑到数据不均衡的现象会导致模型预测结果偏向于样本数据较多的类别,本文在CNCR模型的基础上融合代价敏感学习方法,提出了基于CNN和代价敏感的跨领域推荐模型CNCR-CS(Cost-Sensitive and CNCR)。CNCR-CS模型将代价敏感学习方法用于模型的训练过程,提出了融合代价敏感策略的L2损失函数CSL2(Cost-Sensitive and L2),使得模型的错分代价和最小,从而缓解了上述问题。(3)本文在Amazon的不同领域的数据集上进行了相应的实验,验证本文提出的模型的有效性。实验结果表明,相较于对比模型,利用评论文本和神经网络的本文模型在MAE和RMSE上均有提升,取得了较好的评分预测结果。同时验证了本文提出的CSL2函数的有效性以及本文迁移方法的有效性,此外本文通过控制评论数目的方法设计了其它的实验验证了本文模型缓解数据稀疏问题的能力以及缓解用户冷启动问题的能力,对模型的重要参数进行了相应的分析,同时验证了模型的泛化能力。本文充分的利用了评论文本,合理有效的挖掘了评论文本中蕴含的用户和项目信息,提高了跨领域推荐性能,同时使跨领域推荐的方法在深度学习和评论文本上有了新的发展。
跨领域网络文本立场检测关键技术研究与应用
这是一篇关于立场检测,跨领域,表情符号,对比学习的论文, 主要内容为跨领域立场检测可在有限的源域数据资源条件下,挖掘源域和目标域之间的内在联系,有效解决新生话题的立场检测问题。针对跨领域网络文本立场检测研究中,表情符号对用户立场表达的影响问题,本文以中文互联网用户文本为研究对象,重点围绕表情符号融合文本的特征提取和领域泛化两个关键过程开展研究。本文的主要贡献如下:(1)构建了一个跨领域表情符号融合文本立场检测数据集和词嵌入模型。针对当前中文语境下跨领域表情符号融合文本标注数据匮乏的问题,自行采集并构建了一个跨领域立场检测数据集;针对当前表情符号向量构造方法的主观性较强、复杂度较高问题,采用模型训练的方式将表情符号投影到与文本一致的Word2Vec词嵌入空间。实验结果表明,训练得到的词向量能够准确地捕获表情符号的语义信息。(2)提出了一种基于双词嵌入的表情符号融合文本立场检测方法。针对表情符号语义识别困难的问题,从当前未考虑的表情符号和文本句法结构的关联性问题角度出发,通过扩展句法依赖关系,提取了表情符号融合文本的句法结构特征;针对Word2Vec模型上下文语义表征不足的问题,结合BERT模型提出了一种基于双词嵌入的立场检测方法DWE-SFEM。实验结果表明,其他方法相比,DWE-SFEM方法在F指标上有所提升,验证了该方法在处理文本立场检测任务中的有效性。(3)提出了一种基于对比域适应的跨领域立场检测方法。针对源域标注数据资源稀缺的问题,提出了一种以EDA方法为基础并结合表情符号位置信息的数据增强方法EDAWE;针对域间特征分布差异较大和域内相似语义文本表达形式多样化的问题,结合自适应技术和对比学习技术提出了一种跨领域立场检测方法CDASFEM。实验结果表明,EDAWE方法可有效提高单领域下的立场检测效果,CDASFEM方法可有效应对跨领域立场检测任务。(4)设计并实现了一套立场检测系统。以本文提出的两种立场检测方法为基础,从需求分析、系统设计、详细设计等方面,设计并实现了一套立场检测系统,该系统通过标准的外部调用接口为相关信息系统提供统一规范的立场检测服务。系统测试结果表明,该系统满足了需求分析阶段的功能性和非功能性技术指标。本文主要针对融合表情符号的网络文本的跨领域立场检测任务进行了理论研究和技术应用,其成果可应用于舆情管理、电商评价等多个领域。
跨领域网络文本立场检测关键技术研究与应用
这是一篇关于立场检测,跨领域,表情符号,对比学习的论文, 主要内容为跨领域立场检测可在有限的源域数据资源条件下,挖掘源域和目标域之间的内在联系,有效解决新生话题的立场检测问题。针对跨领域网络文本立场检测研究中,表情符号对用户立场表达的影响问题,本文以中文互联网用户文本为研究对象,重点围绕表情符号融合文本的特征提取和领域泛化两个关键过程开展研究。本文的主要贡献如下:(1)构建了一个跨领域表情符号融合文本立场检测数据集和词嵌入模型。针对当前中文语境下跨领域表情符号融合文本标注数据匮乏的问题,自行采集并构建了一个跨领域立场检测数据集;针对当前表情符号向量构造方法的主观性较强、复杂度较高问题,采用模型训练的方式将表情符号投影到与文本一致的Word2Vec词嵌入空间。实验结果表明,训练得到的词向量能够准确地捕获表情符号的语义信息。(2)提出了一种基于双词嵌入的表情符号融合文本立场检测方法。针对表情符号语义识别困难的问题,从当前未考虑的表情符号和文本句法结构的关联性问题角度出发,通过扩展句法依赖关系,提取了表情符号融合文本的句法结构特征;针对Word2Vec模型上下文语义表征不足的问题,结合BERT模型提出了一种基于双词嵌入的立场检测方法DWE-SFEM。实验结果表明,其他方法相比,DWE-SFEM方法在F指标上有所提升,验证了该方法在处理文本立场检测任务中的有效性。(3)提出了一种基于对比域适应的跨领域立场检测方法。针对源域标注数据资源稀缺的问题,提出了一种以EDA方法为基础并结合表情符号位置信息的数据增强方法EDAWE;针对域间特征分布差异较大和域内相似语义文本表达形式多样化的问题,结合自适应技术和对比学习技术提出了一种跨领域立场检测方法CDASFEM。实验结果表明,EDAWE方法可有效提高单领域下的立场检测效果,CDASFEM方法可有效应对跨领域立场检测任务。(4)设计并实现了一套立场检测系统。以本文提出的两种立场检测方法为基础,从需求分析、系统设计、详细设计等方面,设计并实现了一套立场检测系统,该系统通过标准的外部调用接口为相关信息系统提供统一规范的立场检测服务。系统测试结果表明,该系统满足了需求分析阶段的功能性和非功能性技术指标。本文主要针对融合表情符号的网络文本的跨领域立场检测任务进行了理论研究和技术应用,其成果可应用于舆情管理、电商评价等多个领域。
基于文本UGC的深度神经网络跨领域推荐研究
这是一篇关于文本UGC,深度神经网络,跨领域,推荐系统的论文, 主要内容为作为一种能够有效缓解信息过载问题的主要工具,推荐系统的研究与应用日益广泛,但一直面临着数据稀疏性问题的困扰。跨领域推荐是一种缓解数据稀疏性问题的有效方法,其通过利用辅助域的用户—物品交互数据来帮助目标域生成推荐结果,已成为推荐系统领域的研究热点。当前主流的跨领域推荐大多使用张量分解方法,该方法只能模拟线性的用户—物品交互关系,特征提取能力较差。深度神经网络对于多源异构数据有着强大的处理能力,十分适合应用于跨领域推荐之中,然而现有研究重点多集中在单领域推荐,对基于深度神经网络技术的跨领域推荐的研究却很少,因此研究基于深度神经网络技术的高性能跨领域推荐模型具有重要的应用价值和理论意义。本文在对当前国内外神经网络推荐技术以及跨领域推荐相关研究进行了系统地总结与分析的基础上,提出了一种基于文本UGC(User Generated Content)的深度神经网络跨领域推荐模型。该模型分为目标域模型和辅助域模型两部分,以同一用户在不同领域的文本UGC为辅助信息实现了目标域特征和辅助域特征的融合,能够以端到端的方式预测评分并实现物品推荐。论文主要的研究工作有:(1)改进了神经协同过滤(NCF,Neural Collaborative Filtering)模型并将其作为本模型的目标域模型。神经协同过滤模型利用嵌入化技术实现用户和物品特征的构造,本文将目标域文本UGC特征向量分别与目标域用户和物品嵌入特征向量进行element-wise运算,从而在NCF模型中融入了文本UGC信息,实现了NCF模型的改进。(2)构建了基于文本UGC的跨领域关联特征提取神经网络并将其作为本模型的辅助域模型。为了全面且合理地提取跨领域关联特征,通过辅助域模型的跨领域特征交互层以及关联特征注意力层实现了跨领域关联特征的权值分配与高效提取。(3)构建了统一的跨领域推荐整体模型。通过在目标域模型和辅助域模型的顶部增加共享层的方式,有效融合了目标域和辅助域特征,缓解了数据稀疏性问题并提升了整体模型的推荐性能。
基于张量分解的跨领域推荐方法及其应用
这是一篇关于推荐系统,单领域,跨领域,矩阵分解,张量分解的论文, 主要内容为近年来,互联网,尤其移动互联网飞速发展,各大互联网公司从中获取了大量与用户生活和行为模式相关的数据。如何利用这些数据,从各类庞杂数据中挖掘出有用信息,并以此对用户进行相关产品与功能的推荐成为一项难题。从目前来看,学术界与工业界对单领域的个性化推荐有了较为深刻的研究,单领域推荐是学术界与工业界解决推荐问题的主流方法,它通过学习某指定领域的历史数据,来预测该领域的用户行为与偏好。然而,单领域推荐对数据稀疏等问题没有很好的解决方案,有较大局限性。为此,将多个领域数据联合考虑,为目标领域推荐提供帮助的跨领域推荐成为推荐系统的热门课题。本文首先阐述了单领域推荐的不足和跨领域推荐的优势,强调了跨领域推荐的研究意义,介绍了跨领域推荐所要解决的问题与面临的挑战,分析了当前主要的基于跨领域的推荐算法。在这些跨领域的背景知识下,本文选择基于张量分解的跨领域推荐作为研究重点。本文详细论述了张量分解的理论基础,根据张量分解的特点寻找其适合的跨领域推荐应用场景。本文主要研究工作体现在如下两方面:1.基于张量分解的跨领域航班推荐系统本文介绍了航班推荐的背景,明确航班推荐问题的需求及其与传统推荐的不同。继而介绍了简单的航班推荐思路及其中的不足。然后,根据航班推荐的特点,提出了一个跨领域张量分解的改进算法,将历史权重策略加入到算法中用来解决跨领域航班推荐问题。此外,本文提出了该算法并行化的实现思路。2.基于张量分解的跨领域新电影推荐系统本文介绍了新电影推荐的背景,明确新电影推荐问题的需求。继而介绍了利用单领域解决新电影推荐的思路及其中的不足。然后,基于隐式跨领域张量分解算法解决新电影推荐问题。此外,本文针对新电影推荐的特点提出了该算法存储与计算的优化方法。
面向产品评论的情感分类方法研究
这是一篇关于产品评论,情感分类,卷积神经网络,跨领域,神经结构对应学习的论文, 主要内容为目前,电子商务已经对我们的生活产生了巨大的影响。历史消费者对电商产品发表的评论,正在潜移默化地影响着其他消费人群的购买行为。因此,对电商平台的产品评论进行情感分类研究逐步成为新的研究热点。某个领域的产品评论如果有充足的标签数据,则可以基于有监督的方法构建产品评论的情感分类模型。然而,领域的标签数据难以获取,或者标注费时费力。而产品评论的情感分类领域性很强,在某个领域的标签数据上训练好的情感分类器,应用到其他领域时性能下降较多。针对上述问题,本文分别提出了单领域和跨领域的情感分类方法,开展了以下三个方面的研究工作:(1)针对单领域的产品评论标签语料充足的情况,提出了改进卷积神经网络的情感分类方法。卷积神经网络擅于捕获特征,较适合进行句子级的情感分类。然而,卷积滤波器的初始化会影响最终分类器的性能。因此本文提出一种利用语义特征向量来对滤波器进行初始化的方法。在亚马逊产品评论和中文产品评论数据集上的实验证明,本文的方法可以有效提高产品评论的情感分类准确率。(2)针对新的领域(目标域)缺少标签数据,而其他领域(源域)的情感分类器应用到该领域时性能下降较多的问题,本文提出了一种基于特征扩展的神经结构对应学习的跨领域情感分类方法。通过改进枢轴特征的提取,将单个源域的标签语料作为辅助数据,训练适合于目标域的情感分类模型。在亚马逊产品评论情感数据集上进行了实验,验证了所提方法的有效性。(3)针对多个源领域的产品评论有标签数据的情况,本文提出了一种多源域集成迁移的情感分类方法。通过获取多个源域到同一个目标域的映射特征,训练多个情感分类器,并根据集成一致性原则为不同的情感分类器加权,最后构建目标域的情感分类器。在亚马逊产品评论情感数据集上进行了实验,验证了所提方法相比单源域的跨领域情感分类方法获得了更好的性能。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码驿站 ,原文地址:https://bishedaima.com/lunwen/56095.html