面向稀疏数据的加权slope one算法改进研究
这是一篇关于加权slope one算法,稀疏性,巴氏系数,矩阵填充,时间因子的论文, 主要内容为随着信息技术不断发展,产生的数据量越来越多,人们如何快速而准确的找到感兴趣的信息变得越来越困难,而推荐系统能有效解决该问题。但是,推荐系统持续发展的同时依然面临许多问题,如数据稀疏性问题、冷启动问题等。本文主要以加权slope one算法为研究基础。加权slope one算法是协同过滤算法的一种,其主要依靠项目评分数值差,采用线性方式进行预测。此方法计算简洁,但是在数据稀疏时效果较差,因此针对加权slope one算法存在的问题以及数据稀疏性问题,本文进行如下研究:(1)加权slope one算法仅仅考虑评分用户数量对结果的影响,并没有考虑用户或项目自身内在联系,因此,本文考虑用户相似度对结果的影响。此外,由于传统相似度计算方式如皮尔逊相关系数、余弦相似度等,在计算相似度时主要依赖用户共同评分,当共同评分很少甚至没有时,此时运用传统相似度计算方式取得的结果较差,因此,本文提出一种融合巴氏系数的加权slope one算法(BCWSOA)。从两方面进行改进:一是利用巴氏系数改进用户相似度,首先使用巴氏系数分析用户相关性计算出全局相似度,再与传统相似度计算方法加权融合,得到最终用户相似度;二是利用巴氏系数优化预测评分公式,用巴氏系数计算项目相似度,并将其作为权重因子优化预测评分公式。(2)针对加权slope one算法中数据稀疏性问题,常用的解决方法有矩阵填充。目前,大多数填充是采用数据的平均数、中位数和众数等方式。虽然可以缓解数据稀疏问题,但是这些填充方法未考虑用户和项目本身特性,未考虑用户评分易受主观性以及环境等其他因素的影响,从而导致用户对项目的评分不准确。由于项目属性是固定不变的,因此,可以根据用户对项目属性的偏好,间接体现用户对项目的喜好,故本文提出一种新的评分矩阵填充方法。首先计算用户对项目属性的偏好值,再联合用户平均评分,最后填充评分矩阵。基于填充后的评分矩阵,又考虑到用户兴趣爱好随时间动态变化,于是引入时间因子变量,故第四章提出一种基于评分矩阵填充和时间因子的加权slope one算法(FTWSOA)。本文算法以加权slope one算法为基准,为验证提出的BCWSOA和FTWSOA两种算法,通过在Movie Lens数据集上实验,结果表明:BCWSOA和FTWSOA两种算法相比于其他算法在MAE和RMSE两个指标上均有更好的效果。
基于多样性的个性化推荐方法研究
这是一篇关于推荐方法,时间因子,相似度计算,用户聚类,多样性的论文, 主要内容为随着互联网技术包括云计算、大数据等的兴起以及快速发展,互联网上数据和信息出现了爆涨趋势。互联网信息数据中潜藏着难以估量的价值,为现今时代的人们提供了全方位的便利,但是也造成严重的“信息过载”,此时推荐系统应运而生,并得到了广泛应用,同时还能够帮助用户发现其感兴趣的新项目。基于准确性的推荐是应用最广泛的推荐方法,但是仅仅依赖准确性可能会造成推荐结果的过度拟合,从而降低用户的满意度。由此,推荐方法的另一个评价指标--推荐多样性,越来越受到研究人员和网络平台的重视,并发挥着重要的作用。推荐多样性的提高可以让用户获得更好的个性化体验,使得用户对网站平台忠诚度得以提高,帮助用户发现更多感兴趣的长尾商品,提高商家的总体利润。但是基于多样性的推荐应用越来越广泛的同时也存在忽视时间因素的影响、用户相似性计算不全面、用户聚类局部最优等问题。为了相应的解决以上所提问题,本文提出一种基于多样性的个性化推荐方法,使得出的推荐结果不仅可以确保准确性不下降,而且可以使推荐总体多样性得以提高。本文主要创新性研究如下:(1)针对用户对项目的兴趣随着时间发生迁移的问题,引入改进的logistic权重函数作为时间因子用来修正用户评分,使得所提方法能尽可能提高近期用户-项目评分权重,减少远期用户-项目评分权重,准确反映用户当前的兴趣偏好特征,提高推荐结果的准确性。(2)针对协同过滤推荐中用户相似性计算不全面的问题,根据用户对项目的偏好程度计算得出用户-类别偏好矩阵,合理融合用户评分相似度以及用户类别相似度,从而能够得到用户综合相似度,克服了传统协同过滤推荐中仅注重用户评分,忽略用户兴趣偏好的不足,提高了用户相似性计算的全面性和准确性。(3)针对推荐过程中采用谱聚类算法出现聚类结果容易陷入局部最优的问题,选用自适应局部尺度参数缓解尺度参数敏感,并且引入用户间的权重因子来抑制离群点的影响优化谱聚类,提高用户聚类的准确性,增加跨类选择最近邻的区分度,实现提升目标用户近邻的多样性从而提升推荐结果多样性的目标。在Movie Lens数据集上进行实验,确定了基于综合相似性、基于谱聚类优化等算法中的最优参数,然后将本文提出的方法与其他四种推荐算法在准确性与多样性两个方面对比分析,实验结果说明该方法能实现在保证准确性的基础上提升推荐的总体多样性。
结合时间因子与贡献度的协同过滤推荐算法研究
这是一篇关于贡献度,时间因子,相似度,协同过滤,推荐的论文, 主要内容为在信息呈爆发式增长的今天,推荐系统可以在海量信息中为用户提供个性化推荐服务,它通过使用不同的推荐算法来为目标用户产生推荐。在众多推荐算法中,协同过滤算法应用最为广泛。然而,随着用户和项目的增加,该算法也面临一些问题。本文主要针对传统的协同过滤算法未考虑用户兴趣变化、不同用户对同一项目评分差异过大、热门项目的影响以及用户间非对称影响力等问题,研究解决办法,设计更高效的推荐算法。具体工作如下:针对传统的基于用户的协同过滤算法未考虑用户兴趣变化和不同用户对同一项目评分差异过大的问题,设计了一种融合贡献度和评分时间的协同过滤推荐算法CTCF,该算法在用户相似度计算中引入可信误差阈值、贡献度与时间因子(评分时间)。首先,利用用户评分信息构建用户-评分矩阵与用户-评分时间矩阵,依据可信误差阈值来计算用户贡献度;然后,引入拟合贡献度与评分时间的遗忘曲线来得到时间权重;再将时间权重引入皮尔逊相关系数中计算用户相似度;最后,找出目标用户的近邻集,筛选近邻喜欢而目标用户未评分的项目,预测目标用户对这些项目的评分,按评分由高到低生成Top-N推荐。在Movie Lens数据集上的测试结果表明,CTCF算法具有更高的F1值,有效提高了推荐的准确性和动态性。针对传统的基于用户的协同过滤算法未考虑热门项目的影响以及用户间非对称影响力的问题,设计了融合影响力和CTCF的推荐算法ICTCF。该算法在CTCF的基础上,通过引入基于项目交互次数的惩罚函数来降低热门项目的影响;利用可信度、可靠度、自我意识等指标刻画用户特性,并与惩罚函数相结合计算用户影响力;将用户影响力与用户贡献度融合得到新的贡献度,用新的贡献度改进时间权重,并将之用于用户相似度的计算。在hetrec2011和ml-latest-small两种数据集上的实验结果表明,ICTCF算法可以提高推荐质量。开发了一个背单词推荐原型系统,将所设计的ICTCF算法应用在该系统中产生推荐列表。应用结果表明:本文的研究成果具有一定的实用性。
融合潜在因子和时间因子的信任关系推荐算法研究
这是一篇关于推荐系统,信任关系,潜在因子,时间因子的论文, 主要内容为互联网与信息技术的突飞猛进极大地促进了用户个人信息(User Generated Content,UGC)的指数增长。用户作为一个独立的个体参与社交活动,分析用户信任的交互数据,能够为用户进行个性化信任推荐。本文针对信任推荐算法研究中存在的数据稀疏、冷启动、信息挖掘不充分问题,融合潜在因子和时间因子两种信任影响因素,明确定义了信任经验和信任程度概念和相应的解决方法。本文首先分析了信任推荐算法的研究现状。针对数据稀疏和冷启动问题引起的推荐精度较低问题,本文基于LFM(Latent Factor Model)模型,通过降维来分析用户-项目潜在因子的影响。利用迭代调整用户和项目的潜在向量,结合用户间信任影响因素,从而对每个维度潜在向量做出具体解释。其次,针对信任推荐用户-项目信息挖掘不充分的问题,分析用户的信任经验和信任程度对其行为、兴趣在显式信任和隐式信任两方面的影响。同时考虑了信任的传播性和不对称性,探索用户潜在信任偏好模式,提出了融合潜在因子的信任关系推荐算法。再次,针对信任值在推荐过程中变化的问题,在没有给出具体显式信任的情况下,通过用户-项目数据挖掘隐式信任,在分析用户行为和兴趣影响的同时考虑时间因素,引入时间因子,探索用户的信任变化趋势,并应用到信任推荐中。进一步挖掘用户基于信任关系数据下行为、兴趣的时间模式,提出融合潜在因子和时间因子的信任关系推荐算法。最后,分别将本文提出的两种算法在真实的数据集上进行实验验证。
基于低秩矩阵分解的协同过滤推荐算法的研究
这是一篇关于协同过滤,低秩矩阵,类别偏好,时间因子,系统实现的论文, 主要内容为随着信息网络技术的发展,电子商务得到了很好的发展,网上购物成为了人们生活中不可或缺的重要组成部分。而购物网站上商品如此繁多,如何可以找到自己喜欢的物品呢?正是基于此,推荐系统才诞生,它在为我们推荐个性化物品中起到了显著的作用。目前在电子商务系统中应用的推荐系统主要有以下几种:基于内容的推荐、协同过滤算法的推荐和混合推荐。本文主要介绍的是基于矩阵分解模型的协同过滤算法及其优化。协同过滤算法在电子商务中的应用最为普遍,它又分为基于邻域的协同过滤和基于矩阵分解模型的协同过滤,而矩阵分解技术在协同过滤算法中的研究也属于前沿的技术之一。低秩矩阵分解剔除了原有评分矩阵的冗余的信息和一些无效的信息,又在最大的程度上,保留了评分矩阵的有效信息,符合了矩阵降维的思想,在计算量上大大的减少,也节省了存储空间成本,因此,低秩矩阵分解在推荐系统这一领域有着不错的成绩。本文从分析低秩矩阵分解的协同过滤算法的研究入手,查阅了相关的资料,并比较了国内外的研究现状,确定了本文研究的方向及方法。本文研究的内容及创新如下:首先,本文在低秩矩阵分解的协同过滤算法下,融入k-means聚类算法。在评分矩阵使用低秩矩阵分解之后,使用K-means聚类算法将物品根据物品特征矩阵分为k个类别,再在每个类别里计算每个用户对这个类别的偏好,即类别偏好。用户常常购买某一个类别的物品,经常给某个类别的物品好评,这些反馈出来就是类别偏好。第二,考虑到用户的兴趣偏好会随着时间而会有所不同,因此加入了时间因子,以时间因子作为权重来限制时间较远的评分数据对模型的影响。第三,通过实验来验证本文的算法。实验结果表明,与传统的算法比较,优化后的协同过滤算法在推荐的准确度和推荐质量上都有明显的提高。最后,本文在此改进的算法基础上设计和实现了一个商场购买网站系统。系统的功能包括浏览商品、热销推荐、猜你喜欢、加入购物车、后台管理等等,加入了个性化推荐功能,可以给用户带来很好的体验。
结合时间因子与贡献度的协同过滤推荐算法研究
这是一篇关于贡献度,时间因子,相似度,协同过滤,推荐的论文, 主要内容为在信息呈爆发式增长的今天,推荐系统可以在海量信息中为用户提供个性化推荐服务,它通过使用不同的推荐算法来为目标用户产生推荐。在众多推荐算法中,协同过滤算法应用最为广泛。然而,随着用户和项目的增加,该算法也面临一些问题。本文主要针对传统的协同过滤算法未考虑用户兴趣变化、不同用户对同一项目评分差异过大、热门项目的影响以及用户间非对称影响力等问题,研究解决办法,设计更高效的推荐算法。具体工作如下:针对传统的基于用户的协同过滤算法未考虑用户兴趣变化和不同用户对同一项目评分差异过大的问题,设计了一种融合贡献度和评分时间的协同过滤推荐算法CTCF,该算法在用户相似度计算中引入可信误差阈值、贡献度与时间因子(评分时间)。首先,利用用户评分信息构建用户-评分矩阵与用户-评分时间矩阵,依据可信误差阈值来计算用户贡献度;然后,引入拟合贡献度与评分时间的遗忘曲线来得到时间权重;再将时间权重引入皮尔逊相关系数中计算用户相似度;最后,找出目标用户的近邻集,筛选近邻喜欢而目标用户未评分的项目,预测目标用户对这些项目的评分,按评分由高到低生成Top-N推荐。在Movie Lens数据集上的测试结果表明,CTCF算法具有更高的F1值,有效提高了推荐的准确性和动态性。针对传统的基于用户的协同过滤算法未考虑热门项目的影响以及用户间非对称影响力的问题,设计了融合影响力和CTCF的推荐算法ICTCF。该算法在CTCF的基础上,通过引入基于项目交互次数的惩罚函数来降低热门项目的影响;利用可信度、可靠度、自我意识等指标刻画用户特性,并与惩罚函数相结合计算用户影响力;将用户影响力与用户贡献度融合得到新的贡献度,用新的贡献度改进时间权重,并将之用于用户相似度的计算。在hetrec2011和ml-latest-small两种数据集上的实验结果表明,ICTCF算法可以提高推荐质量。开发了一个背单词推荐原型系统,将所设计的ICTCF算法应用在该系统中产生推荐列表。应用结果表明:本文的研究成果具有一定的实用性。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码项目助手 ,原文地址:https://bishedaima.com/lunwen/46409.html