面向稀疏数据的加权slope one算法改进研究
这是一篇关于加权slope one算法,稀疏性,巴氏系数,矩阵填充,时间因子的论文, 主要内容为随着信息技术不断发展,产生的数据量越来越多,人们如何快速而准确的找到感兴趣的信息变得越来越困难,而推荐系统能有效解决该问题。但是,推荐系统持续发展的同时依然面临许多问题,如数据稀疏性问题、冷启动问题等。本文主要以加权slope one算法为研究基础。加权slope one算法是协同过滤算法的一种,其主要依靠项目评分数值差,采用线性方式进行预测。此方法计算简洁,但是在数据稀疏时效果较差,因此针对加权slope one算法存在的问题以及数据稀疏性问题,本文进行如下研究:(1)加权slope one算法仅仅考虑评分用户数量对结果的影响,并没有考虑用户或项目自身内在联系,因此,本文考虑用户相似度对结果的影响。此外,由于传统相似度计算方式如皮尔逊相关系数、余弦相似度等,在计算相似度时主要依赖用户共同评分,当共同评分很少甚至没有时,此时运用传统相似度计算方式取得的结果较差,因此,本文提出一种融合巴氏系数的加权slope one算法(BCWSOA)。从两方面进行改进:一是利用巴氏系数改进用户相似度,首先使用巴氏系数分析用户相关性计算出全局相似度,再与传统相似度计算方法加权融合,得到最终用户相似度;二是利用巴氏系数优化预测评分公式,用巴氏系数计算项目相似度,并将其作为权重因子优化预测评分公式。(2)针对加权slope one算法中数据稀疏性问题,常用的解决方法有矩阵填充。目前,大多数填充是采用数据的平均数、中位数和众数等方式。虽然可以缓解数据稀疏问题,但是这些填充方法未考虑用户和项目本身特性,未考虑用户评分易受主观性以及环境等其他因素的影响,从而导致用户对项目的评分不准确。由于项目属性是固定不变的,因此,可以根据用户对项目属性的偏好,间接体现用户对项目的喜好,故本文提出一种新的评分矩阵填充方法。首先计算用户对项目属性的偏好值,再联合用户平均评分,最后填充评分矩阵。基于填充后的评分矩阵,又考虑到用户兴趣爱好随时间动态变化,于是引入时间因子变量,故第四章提出一种基于评分矩阵填充和时间因子的加权slope one算法(FTWSOA)。本文算法以加权slope one算法为基准,为验证提出的BCWSOA和FTWSOA两种算法,通过在Movie Lens数据集上实验,结果表明:BCWSOA和FTWSOA两种算法相比于其他算法在MAE和RMSE两个指标上均有更好的效果。
基于局部优化奇异值分解和聚类的协同过滤算法研究
这是一篇关于协同过滤,巴氏系数,奇异值分解,K-Means++聚类,局部优化的论文, 主要内容为目前,人类正处于一个信息技术和互联网高速发展的信息过载时代。作为一种有效缓解信息过载问题的工具,推荐系统个性化地引导用户选择满足其需求的项目。推荐系统能够将项目精准地匹配给对应的用户,主要采用对用户的行为数据进行计算,从而获得用户的偏好需求。推荐系统通过有效地将用户需求与最优产品进行映射,在提高用户获取、保留和满意度方面发挥了重要作用。推荐算法决定了推荐系统的质量,优秀的推荐算法可以减少运算时间和内存消耗,并将符合用户偏好的项目推荐给目标用户。因此,推荐系统具有广泛的应用价值,对其核心推荐算法的研究具有意义。其中,最广泛使用的推荐算法是协同过滤算法。协同过滤算法的推荐结果丰富并且易于发现用户的兴趣偏好,但存在严重的数据稀疏、扩展性差等问题。数据稀疏问题导致在计算用户相似性时准确率较低,从而使得算法的推荐准确性下降。针对传统协同过滤方法数据稀疏和扩展性差的不足,本文提出基于局部优化奇异值分解和聚类的协同过滤算法。该算法采用局部优化的奇异值分解和K-Means++聚类对用户-项目评分矩阵中的相似用户进行聚类并降低维度,利用基于巴氏系数的相似性计算方法来减少数据稀疏对相似性计算的影响。本文主要工作及研究内容包括以下几个方面:首先,针对传统相似性计算方法只利用共同评分项目的评分来计算相似度而不适用于稀疏数据的缺点,提出一种基于巴氏系数的相似性计算方法。改进的相似性计算方法利用巴式系数计算项目之间的全局相似性,同时也将每一对评分之间的局部相似性考虑在内。本文利用用户的全部评分信息来计算拥有较少共同评分项目或没有共同评分项目的用户之间的相似性。实验结果表明在稀疏的数据集中基于巴氏系数的相似性计算方法的性能优于传统相似性计算方法。其次,基于奇异值分解的协同过滤推荐方法可以有效缓解用户-项目评分矩阵稀疏对推荐精度的影响。但是在利用随机梯度下降法进行求解的过程中,随着误差下降速度逐渐降低需要大量的迭代次数。本文利用近似差分矩阵来表示评分矩阵的局部结构并作为一个新的目标函数,从而达到局部优化的效果。实验结果表明在达到相同预测效果时,基于奇异值分解的推荐方法始终需要比基于局部优化奇异值分解的推荐方法更多的迭代次数。最后,为了提高基于局部优化奇异值分解的协同过滤推荐方法的推荐速度,本文利用K-Means++技术对降维后的矩阵进行聚类。K-Means++聚类技术可以缩小邻居集查找范围,提高推荐速度。局部优化的奇异值分解和K-Means聚类对用户-项目评分矩阵中的相似用户进行聚类并降低维度,基于巴氏系数的改进相似性计算方法用于计算用户之间的相似度确定用户的邻居集。基于局部优化奇异值分解和K-Means++聚类的协同过滤算法与其他方法相比不仅考虑到如何从根本上改善评分矩阵稀疏问题,也考虑到如何解决相似性计算方法对共同评分项目的依赖;并以不增加算法时间复杂度为前提,提高算法的推荐速度。为了验证本文所提方法的有效性,在Movie Lens数据集上进行了对比试验。实验结果表明,本文方法可以有效缓解数据稀疏问题对推荐性能的影响,有效地提高推荐准确性。
基于局部优化奇异值分解和聚类的协同过滤算法研究
这是一篇关于协同过滤,巴氏系数,奇异值分解,K-Means++聚类,局部优化的论文, 主要内容为目前,人类正处于一个信息技术和互联网高速发展的信息过载时代。作为一种有效缓解信息过载问题的工具,推荐系统个性化地引导用户选择满足其需求的项目。推荐系统能够将项目精准地匹配给对应的用户,主要采用对用户的行为数据进行计算,从而获得用户的偏好需求。推荐系统通过有效地将用户需求与最优产品进行映射,在提高用户获取、保留和满意度方面发挥了重要作用。推荐算法决定了推荐系统的质量,优秀的推荐算法可以减少运算时间和内存消耗,并将符合用户偏好的项目推荐给目标用户。因此,推荐系统具有广泛的应用价值,对其核心推荐算法的研究具有意义。其中,最广泛使用的推荐算法是协同过滤算法。协同过滤算法的推荐结果丰富并且易于发现用户的兴趣偏好,但存在严重的数据稀疏、扩展性差等问题。数据稀疏问题导致在计算用户相似性时准确率较低,从而使得算法的推荐准确性下降。针对传统协同过滤方法数据稀疏和扩展性差的不足,本文提出基于局部优化奇异值分解和聚类的协同过滤算法。该算法采用局部优化的奇异值分解和K-Means++聚类对用户-项目评分矩阵中的相似用户进行聚类并降低维度,利用基于巴氏系数的相似性计算方法来减少数据稀疏对相似性计算的影响。本文主要工作及研究内容包括以下几个方面:首先,针对传统相似性计算方法只利用共同评分项目的评分来计算相似度而不适用于稀疏数据的缺点,提出一种基于巴氏系数的相似性计算方法。改进的相似性计算方法利用巴式系数计算项目之间的全局相似性,同时也将每一对评分之间的局部相似性考虑在内。本文利用用户的全部评分信息来计算拥有较少共同评分项目或没有共同评分项目的用户之间的相似性。实验结果表明在稀疏的数据集中基于巴氏系数的相似性计算方法的性能优于传统相似性计算方法。其次,基于奇异值分解的协同过滤推荐方法可以有效缓解用户-项目评分矩阵稀疏对推荐精度的影响。但是在利用随机梯度下降法进行求解的过程中,随着误差下降速度逐渐降低需要大量的迭代次数。本文利用近似差分矩阵来表示评分矩阵的局部结构并作为一个新的目标函数,从而达到局部优化的效果。实验结果表明在达到相同预测效果时,基于奇异值分解的推荐方法始终需要比基于局部优化奇异值分解的推荐方法更多的迭代次数。最后,为了提高基于局部优化奇异值分解的协同过滤推荐方法的推荐速度,本文利用K-Means++技术对降维后的矩阵进行聚类。K-Means++聚类技术可以缩小邻居集查找范围,提高推荐速度。局部优化的奇异值分解和K-Means聚类对用户-项目评分矩阵中的相似用户进行聚类并降低维度,基于巴氏系数的改进相似性计算方法用于计算用户之间的相似度确定用户的邻居集。基于局部优化奇异值分解和K-Means++聚类的协同过滤算法与其他方法相比不仅考虑到如何从根本上改善评分矩阵稀疏问题,也考虑到如何解决相似性计算方法对共同评分项目的依赖;并以不增加算法时间复杂度为前提,提高算法的推荐速度。为了验证本文所提方法的有效性,在Movie Lens数据集上进行了对比试验。实验结果表明,本文方法可以有效缓解数据稀疏问题对推荐性能的影响,有效地提高推荐准确性。
基于局部优化奇异值分解和聚类的协同过滤算法研究
这是一篇关于协同过滤,巴氏系数,奇异值分解,K-Means++聚类,局部优化的论文, 主要内容为目前,人类正处于一个信息技术和互联网高速发展的信息过载时代。作为一种有效缓解信息过载问题的工具,推荐系统个性化地引导用户选择满足其需求的项目。推荐系统能够将项目精准地匹配给对应的用户,主要采用对用户的行为数据进行计算,从而获得用户的偏好需求。推荐系统通过有效地将用户需求与最优产品进行映射,在提高用户获取、保留和满意度方面发挥了重要作用。推荐算法决定了推荐系统的质量,优秀的推荐算法可以减少运算时间和内存消耗,并将符合用户偏好的项目推荐给目标用户。因此,推荐系统具有广泛的应用价值,对其核心推荐算法的研究具有意义。其中,最广泛使用的推荐算法是协同过滤算法。协同过滤算法的推荐结果丰富并且易于发现用户的兴趣偏好,但存在严重的数据稀疏、扩展性差等问题。数据稀疏问题导致在计算用户相似性时准确率较低,从而使得算法的推荐准确性下降。针对传统协同过滤方法数据稀疏和扩展性差的不足,本文提出基于局部优化奇异值分解和聚类的协同过滤算法。该算法采用局部优化的奇异值分解和K-Means++聚类对用户-项目评分矩阵中的相似用户进行聚类并降低维度,利用基于巴氏系数的相似性计算方法来减少数据稀疏对相似性计算的影响。本文主要工作及研究内容包括以下几个方面:首先,针对传统相似性计算方法只利用共同评分项目的评分来计算相似度而不适用于稀疏数据的缺点,提出一种基于巴氏系数的相似性计算方法。改进的相似性计算方法利用巴式系数计算项目之间的全局相似性,同时也将每一对评分之间的局部相似性考虑在内。本文利用用户的全部评分信息来计算拥有较少共同评分项目或没有共同评分项目的用户之间的相似性。实验结果表明在稀疏的数据集中基于巴氏系数的相似性计算方法的性能优于传统相似性计算方法。其次,基于奇异值分解的协同过滤推荐方法可以有效缓解用户-项目评分矩阵稀疏对推荐精度的影响。但是在利用随机梯度下降法进行求解的过程中,随着误差下降速度逐渐降低需要大量的迭代次数。本文利用近似差分矩阵来表示评分矩阵的局部结构并作为一个新的目标函数,从而达到局部优化的效果。实验结果表明在达到相同预测效果时,基于奇异值分解的推荐方法始终需要比基于局部优化奇异值分解的推荐方法更多的迭代次数。最后,为了提高基于局部优化奇异值分解的协同过滤推荐方法的推荐速度,本文利用K-Means++技术对降维后的矩阵进行聚类。K-Means++聚类技术可以缩小邻居集查找范围,提高推荐速度。局部优化的奇异值分解和K-Means聚类对用户-项目评分矩阵中的相似用户进行聚类并降低维度,基于巴氏系数的改进相似性计算方法用于计算用户之间的相似度确定用户的邻居集。基于局部优化奇异值分解和K-Means++聚类的协同过滤算法与其他方法相比不仅考虑到如何从根本上改善评分矩阵稀疏问题,也考虑到如何解决相似性计算方法对共同评分项目的依赖;并以不增加算法时间复杂度为前提,提高算法的推荐速度。为了验证本文所提方法的有效性,在Movie Lens数据集上进行了对比试验。实验结果表明,本文方法可以有效缓解数据稀疏问题对推荐性能的影响,有效地提高推荐准确性。
基于slope one的特征信息融合推荐算法研究
这是一篇关于矩阵分解,对象属性,时间因子,巴氏系数,用户信息的论文, 主要内容为由于信息技术的飞速发展,以至于海量的信息量产生与传播,人们每日都面对大量的信息,因此,人们想要快速准确找到自己所需的信息不再是轻而易举的事情。基于此问题,人们提出了推荐系统,其中协同过滤推荐算法是推荐算法中应用较广泛的一种。Slope one是协同过滤推荐算法的一种,本文基于slope one算法,融合数据的特征信息,提出了两种算法,一种是融合矩阵分解和评分信息的改进协同过滤推荐算法(MPSCF),另一种是巴氏系数优化融合矩阵分解和评分信息的改进协同过滤推荐算法(BC-MPSCF)。本文最后对巴氏系数优化融合矩阵分解和评分信息的改进协同过滤推荐算法进行改进,融合用户信息,提高算法模型的推荐能力。本文算法在数据集Movie Lens100k进行实验。具体的工作内容如下:(1)本文研究融合矩阵分解和评分信息的改进协同过滤推荐算法。本文首先对数据集分析,可以发现数据稀疏度非常高,数据稀疏度达到93.7%,数据稀疏性会影响算法模型的预测准确度。因此对于数据稀疏性的问题,本文通过两种方式缓解数据稀疏性。一种是通过矩阵分解的方式,得到一个新的评分矩阵。新的评分矩阵能够得到合适的评分替代原始评分矩阵中未评分的数值,此方法可以达到缓解数据稀疏性的目的,而且还能提高推荐算法的评分预测准确度。第二种是考虑到每个对象都有属于其自身的属性,通过对象属性与时间因素,得到用户对对象属性兴趣矩阵,通过考虑用户对对象属性,也能缓解数据稀疏性。并且本文考虑用户的兴趣存在变化,会随着时间变动而变化,因此,将时间因素与加权slope one算法结合,构建新的评分预测公式,即时间优化加权slope one算法。本文提出的MPSCF算法,新的评分矩阵通过皮尔逊系数得到用户相似度,用户对对象属性兴趣矩阵通过余弦相似度得到用户相似度,将两个相似度通过参数a结合得到最终用户相似度。然后选取相似度的用户作为目标用户的邻居,通过时间优化加权slope one算法进行评分预测。通过评价指标RMSE和MAE的结果可知,参数a取值为0.8时,此时融合矩阵分解和评分信息的改进协同过滤推荐算法模型预测能力更佳。并且通过实验结果可以知道,融合矩阵分解和评分信息的改进协同过滤推荐算法准确度比其他传统算法都有所提高。(2)由于本文实验使用用户相似度确定目标用户的邻居集合,因此,本文基于融合矩阵分解和评分信息的改进协同过滤推荐算法,提出通过巴氏系数对用户相似度进行优化,提出一种巴氏系数优化融合矩阵分解和评分信息的改进协同过滤推荐算法模型。通过实验发现,参数a的值为0.8时,巴氏系数优化融合矩阵分解和评分信息的改进协同过滤推荐算法的预测效果更佳,并且与融合矩阵分解和评分信息的改进协同过滤推荐算法相比较,巴氏系数优化融合矩阵分解和评分信息的改进协同过滤推荐算法的推荐效果更好。因此,BC-MPSCF算法模型的推荐能力强于其他传统推荐算法。(3)本文研究基于用户信息的巴氏系数优化融合矩阵分解和评分信息的改进协同过滤推荐算法。在巴氏系数优化融合矩阵分解和评分信息的改进协同过滤推荐算法基础上,考虑用户的信息的影响,本文是考虑性别、年龄和职业这三个用户信息。对用户信息进行用户的单标签信息与多标签信息的实验研究,通过实验结果说明,用户信息对于巴氏系数优化融合矩阵分解和评分信息的改进协同过滤推荐算法改进有效果,并且通过实验结果可知,并不是融合用户信息越多,巴氏系数优化融合矩阵分解和评分信息的改进协同过滤推荐算法的改进效果越好。对于巴氏系数优化融合矩阵分解和评分信息的改进协同过滤推荐算法的改进,需要融合重要且适当的用户信息。综上所述,本文基于slope one,考虑特征信息,对协同过滤算法进行改进,提出的两种算法都能提高传统算法的评分预测能力,并且融合用户信息,对巴氏系数优化融合矩阵分解和评分信息的改进协同过滤推荐算法进行改进,能加强巴氏系数优化融合矩阵分解和评分信息的改进协同过滤推荐算法的评分预测效果,提升算法推荐能力。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码导航 ,原文地址:https://bishedaima.com/lunwen/56345.html