基于兴趣漂移的用户动态推荐模型研究
这是一篇关于兴趣漂移,动态推荐,长短期兴趣,矩阵分解,隐式反馈的论文, 主要内容为“信息迷航”和“信息过载”问题由来已久,推荐系统能够帮助用户在海量的产品空间中进行筛选。但是传统的推荐算法以静态算法为主,其基本假设是用户兴趣是静止不变的。这种假设与事实不符,导致面对现实数据时,传统算法存在推荐准确性差、算法可解释性差等诸多问题。事实上用户兴趣不仅不断变化,而且具有一定的规律。在目前用户兴趣建模的研究成果梳理中发现,考虑用户兴趣动态变化的研究往往将用户兴趣衰减同等对待,较少为用户兴趣类型进行区分,即使有部分研究考虑到长短期兴趣问题,也仅从时间因子识别方面加以分析,没有从用户对项目属性关注的数量、用户活跃度、项目流行度等考虑,使长短期兴趣信息表述不够完整,用户兴趣刻画不够全面。另外,推荐领域的绝大多数文献都侧重于处理显式数据,然而在许多实际情况下,特别是在电子商务领域需要处理隐式反馈数据。本文基于隐性反馈数据提出了融合长短期兴趣和矩阵分解协同过滤的混合推荐模型LSIMF(Long-term and Short-term Interest and Matrix Factorization for Collaborative Filtering),主要贡献有:(1)本文构建的混合模型对数据稀疏、用户兴趣刻画不细致以及传统应对兴趣漂移的算法过于注重时间因素而忽略主动探索用户的新兴趣等问题提出了解决方案。通过将用户—项目偏好矩阵换为用户—属性偏好矩阵,降低了矩阵稀疏性。通过用户偏好建模以及用户兴趣模式的细分,得到用户偏好文档和用户兴趣分布。通过融合矩阵分解的协同过滤,主动探索了用户的新兴趣。(2)实验结果表明,与遗忘曲线、时间窗口和基于矩阵分解的协同过滤算法对比,本文提出的混合推荐模型LSIMF在精准率、召回率、F1-Score评价指标上有较明显的提高。(3)本文计算用户兴趣偏好时,优化了推荐中随时间变化的兴趣漂移问题,提取了用户长短期兴趣集合、用户活跃度、项目流行度等相关指标,可为用户自动打标签,为后续研究用户兴趣的动态演化过程或者网站功能扩展提供更多选择。
移动互联网环境下土壤采样替代样点的推荐方法研究
这是一篇关于移动互联网,土壤采样,地理环境相似性,替代样点,动态推荐的论文, 主要内容为在数字土壤制图中,野外土壤采样是进行土壤属性信息空间推测必不可少的重要环节。在实际的野外采样过程中,因野外地理环境的复杂性和采样条件的不确定性,经常会遇到样点不可采的情况:如布设的采样点位于植被茂密无法通行的灌木丛中,位于地形崎岖难以通行的山坡,或位于基础设施建设区等。样点不可采会破坏原有样点布设方案的完整性,进而影响土壤推理制图的精度。现有学者往往通过为采样点设计备选样点的方式来应对该问题。但室内样点布设阶段提出的静态解决方案无法实时应对多变的野外采样条件,无法从根本上解决这一问题。针对上述问题,本文提出了一种移动互联网环境下的土壤采样替代样点动态推荐方法。基于地理环境相似性原理,通过计算研究区中各点与不可采样点的地理环境相似性,将与不可采点地理环境相似、且可达性好的样点作为替代样点,并将方法应用于移动互联网环境下,实现替代样点的动态推荐。本文的主要研究内容与结论如下。1.土壤采样替代样点的计算方法研究当已布设的采样点不可采时,首先基于地理环境相似性原理,计算研究区中各点与不可采点的地理环境相似度,并以不可采点为中心设置一个缓冲区距离,选择相似度大于一定阈值且位于缓冲区范围内的样点构成候选样点集;然后,对候选样点集中的候选样点进行空间代表性分析,将空间代表性较好的候选样点作为替代样点;最后,对每个替代样点进行空间可达性分析,计算用户当前位置到每个替代样点的可达性,以辅助采样人员确定最终的替代样点。2.土壤采样替代样点动态推荐的原型系统设计本文在移动互联网环境下设计开发了土壤采样替代样点动态推荐系统,该系统包括移动客户端与服务器端两部分。移动客户端负责与采样人员交互,包括基本的地图服务、样点管理、替代样点计算的参数设置和动态显示等。服务器端接收客户端上传的参数,并基于地理环境相似性原理实现替代样点动态推荐的计算工作。3.方法应用与评价选择安徽省宣城市为研究区,应用本文提出的替代样点动态推荐方法,在实际的野外采样过程中进行替代样点的实时推荐和采样。假设前期工作已采集的30个真实属性值已知的样点为不可采的目标样点,利用本文方法计算得到30个替代样点,采用如下两种方法进行替代样点的评价:(1)比较替代样点与相应的目标样点土壤属性的相对偏差;(2)分别利用替代样点和相应的目标样点进行土壤属性推理制图,并对制图精度结果进行对比分析。实验结果表明:(1)利用本文方法计算得到的替代样点与相应的目标样点的土壤属性相对偏差较小;(2)采用替代样点进行土壤属性推理制图的精度与采用30个目标样点进行土壤属性推理制图的精度差别较小。总之,利用本文方法能够实现野外采样时替代样点的实时动态推荐,能够有效地提高野外采样效率,降低采样成本;利用本文方法计算得到的替代样点具有与原有目标样点相似的土壤属性。
推荐系统中动态推荐算法研究
这是一篇关于动态推荐,推荐系统,新闻推荐,上下文老虎机的论文, 主要内容为互联网技术的飞速发展使人类进入了大数据时代,“信息过载”成为亟待解决的问题之一。推荐系统作为一种解决“信息过载”问题的技术已被广泛应用于互联网应用。传统基于统计学习和深度学习的推荐技术通过定期更新模型来应对物品流行度的变化和候选集的更新,不能及时根据物品流行度的变化而更新推荐优先级,新物品加入时也不能迅速地完成冷启动。动态推荐算法(如多臂老虎机Bandit)能够一定程度上解决上述问题,但准确度有待提高,这是因为:1)它们的模型能力有限,以Contextual-Bandit类算法中的LinUCB为例,LinUCB算法采用线性模型拟合用户对特定物品的兴趣,表征能力有限,由此限制了算法性能;2)它们没有考虑用户特征分布的异质性,推荐效果不佳。针对以上两个问题,本文选定新闻推荐作为动态推荐算法的具体场景,基于一个大规模、真实的在线新闻系统的用户行为日志,测量了该新闻推荐系统中新闻流行度的动态变化、新闻上下架的模式,观察了用户特征分布。基于观察结果,提出了两个算法来分别改进上述问题,并基于实际数据对算法进行了评估。主要贡献如下:(1)针对现有模型表达能力欠佳的问题,本文提出使用神经网络代替常规数学模型来建模用户和期望回报之间的关系,解决了神经网络在线更新和损失函数选择的两个难题。具体来说,为解决神经网络的在线训练在样本不均衡的情况下难以收敛的问题,我们提出了用户反馈敏感的训练方法:根据不同的用户反馈采用不同迭代次数。该方法相对于传统的训练方式取得了近40%的增益。其次,本文将推荐问题建模为回归、分类和策略梯度问题,系统地尝试了分类、回归和策略梯度三种损失函数。通过实验发现:在合理的配置下,采用策略梯度的损失函数,我们的算法相较于LinUCB算法取得了 2.1%的性能增益,证明了算法的性能。(2)针对传统Contextual-Bandit算法没有考虑用户特征异质性的问题,本文创新性地提出了一种对用户特征敏感的分级推荐算法。该算法能够动态判别用户所属的类别,然后根据用户的类别,动态匹配合适的推荐器,来获得最佳的推荐性能。实验表明,该算法相较于传统的LinUCB推荐算法取得了 3.3%的性能增益,证明了算法的性能。本文在Contextual-Bandit动态推荐算法上的研究,进一步提高了当前主流动态推荐算法的性能,具有一定的理论价值和应用价值。
基于异质信息网络的表征学习推荐方法研究
这是一篇关于异质信息网络,网络表征学习,推荐系统,动态推荐,三角嵌入的论文, 主要内容为随着移动互联网技术的不断发展,网络结构及其拓扑日益复杂,数据规模爆炸式扩张,使得如何迅速而准确地从海量信息中搜集和获取更多有价值的数据及其特征已经成为当前关注的热点。个性化推荐算法就是一种通过对用户历史活动资料进行分析,挖掘用户潜在偏好信息的有效方法。协同过滤推荐算法作为经典的个性化推荐算法,可以准确发现其喜好与倾向,并对其倾向的商品进行筛选、预测与推荐。然而,面对数据规模快速增长,以及日益复杂的推荐问题,协同过滤推荐算法存在一些无法回避的问题:仅考虑用户与项目间的矩阵交互;同时对用户数据稀疏性以及冷启动问题也缺少有效的解决策略。近年来,由多种属性节点与边链接构成的异质信息网络(Heterogeneous Information Network,简称HIN)可以融合复杂多源异构信息,具有强大的数据建模和分析能力,已被广泛研究应用于很多大数据分析与挖掘的复杂任务中。由于这种异质信息网络在分析和处理建模表征数据的异质性等诸多复杂问题上具有较高的应用灵活性,被国内外学者用于自动推荐系统的表征建模过程中。这些异质推荐算法多基于元路径获取用户的相关信息,同时也利用网络表征学习来进行表征融合。推荐性能提升的同时,也存在以下的问题:首先,传统协同过滤推荐方法仅考虑用户和商品的历史交互行为,无法利用异质信息网络中隐藏的复杂关系,导致可扩展性问题;针对用户历史信息稀疏,结合异质辅助信息在局部推理可能发生冲突,导致稀疏不一致性问题;其次,基于异质信息网络的推荐方法通常仅考虑异质信息网络中低阶交互,而忽略其中某些高阶关系,易带来信息缺失问题;最后,用户的兴趣偏好可能会随着时间的推移而发生变化,出现兴趣漂移问题,影响推荐效果。针对上述这些问题,本文提出了一系列关于异质信息网络推荐的研究方法,利用异质信息网络丰富的结构和语义信息进行推荐,主要工作内容如下:(1)针对传统协同过滤推荐方法的可扩展性问题,提出了一种异质信息融合网络嵌入的注意力偏好推荐方法(MFFHINE),通过联合优化矩阵分解模型和融合函数,可有效利用属性信息。进而采用了一种基于注意力机制的融合策略,将不同权重元路径产生的偏好特征有机融合,用于解决异质信息网络推理过程的局部稀疏不一致性问题。(2)针对基于异质信息网络推荐方法的信息缺失问题,提出了一种在异质信息网络中采用三角嵌入的高阶推荐方法(RLTE),通过多层级嵌入为指导的异质网络嵌入方法,分别利用skip-gram模型和局部三角化结构挖掘异质信息网络中隐藏的低阶和高阶关系,通过这些潜在信息的特征融合缓解信息缺失问题。(3)针对动态推荐过程中用户兴趣漂移的问题,提出了一种用时序因子追踪用户兴趣偏好的策略方法(DRLTE),结合三角高阶多层级信息融合进行动态推荐,解决兴趣漂移的不确定性问题。最后,全文工作以Python语言实现,并与相关的基准和SOTA推荐算法进行比较及参数分析,在真实大规模数据集实验也表明本文提出的相关模型方法有效可行。
采用时间信息的多行为序列推荐研究
这是一篇关于推荐系统,序列推荐,多行为推荐,动态推荐,对比学习的论文, 主要内容为推荐系统帮助用户缓解信息过载带来的压力并满足用户的个性化需求,已广泛应用于各行各业。目前推荐系统仍然存在以下挑战:(1)大多数方法忽略了用户和项目的动态变化,没有充分利用交互的时间信息;(2)已有研究通常对用户和项目之间的单一交互行为数据进行建模,未能充分利用多行为数据;(3)推荐系统的数据集往往存在数据稀疏、数据不平衡以及数据噪声等问题。针对上述问题,本文研究如何充分利用用户-项目交互类型的多样性和动态性以提升推荐性能,主要进行了以下工作。(1)利用用户和项目交互的时间信息和多行为数据,提出Dy MBRec模型。首先将用户的历史交互序列分为项目序列、时间序列和行为序列;然后结合绝对位置,分别通过时间感知的自注意力模块和行为感知的自注意力模块进行权重计算,得到时间相关和行为相关的嵌入表示;最后将两个嵌入表示以加权方式得到最终的用户偏好嵌入表示,并进行下一项推荐。在两个真实的具有时间信息的多行为数据集上的实验表明,Dy MBRec与相关的推荐模型相比获得了更优的推荐性能。(2)为了解决推荐中的数据稀疏和数据噪声问题,将对比学习引入多行为序列推荐,提出CL-MBRec模型。首先使用基于时间间隔和项目相关性的数据增强方法对多行为序列数据进行增强;然后通过多行为序列编码器生成序列嵌入表示,同时运用对比学习保持增强序列与原始序列的高度相似性;接着用多任务训练优化多行为序列推荐的下一项预测目标和对比学习目标;最后根据得到的用户交互序列嵌入表示进行下一项推荐。在两个真实的具有时间信息的多行为数据集上的实验验证了CL-MBRec中多行为数据增强的有效性。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕业设计货栈 ,原文地址:https://bishedaima.com/lunwen/56223.html