8篇关于数据稀疏性的计算机毕业论文

今天分享的是关于数据稀疏性的8篇计算机毕业论文范文, 如果你的论文涉及到数据稀疏性等主题,本文能够帮助到你

基于改进的加权Slope one协同过滤推荐算法研究

这是一篇关于推荐算法,协同过滤算法,加权Slope one算法,数据稀疏性的论文, 主要内容为互联网的快速发展以及电子商务的不断壮大,如何处理信息过载的问题成为研究热点。面对杂乱文章的信息,如何从大量信息中找出自己感兴趣的信息变得十分浪费时间和精力,基于此,推荐系统应运而生。在没有确切的浏览目的情境下,推荐系统能够帮助用户找到自己感兴趣的内容,所以在具体的应用中获得了比较大的成功。目前推荐系统在电子商务网站,电影,视频网站,音乐网络电台,社交网络等方面应用广泛,例如国外的亚马逊、Netfix、CDNow和国内的淘宝网、当当网、豆瓣等。然而人们对项目的需求一般是模糊和不稳定的,因此研究出高准确率的算法和能捕捉到用户的实际需求的推荐系统,这些需求对探索推荐算法的计算机研究者们提出了比较高的要求。协同过滤推荐是现有的最成功的推荐技术之一,但是数据稀疏性问题导致其推荐效率低,推荐准确度不高。针对数据稀疏问题,本文基于协同过滤算法和加权Slope one算法,提出了一种基于Mahout的改进的加权Slope one协同过滤推荐算法。算法首先根据用户-项目评分数据,计算用户与用户之间的评分相似度,找出每个用户的最近邻居集合,然后根据最近邻用户评分,使用改进的加权Slope one算法预测目标用户的未评分项目,最后进行推荐。实验部分采用MovieLens数据集作为测试数据。实验结果表明,和原算法相比,该算法提高了预测准确度,有效提高了推荐性能。简而言之,本论文针对现有推荐系统中常用的协同过滤推荐算法,对协同过滤推荐算法和Slope one算法进行了分析对比,在了解现今的研究状况和分析协同过滤算法的优劣基础上,提出基于加权Slope one算法的协同过滤算法作为本文的研究重点,并通过基础算法和改进算法的对比实验,验证算法优劣。

基于变分自编码器的个性化推荐方法研究与实现

这是一篇关于数据稀疏性,社交正则化,变分自编码器,互信息的论文, 主要内容为近年来,随着信息技术的发展,线上信息的数据量和生成速度都在迅速增加。网络数据虽然给用户带来了很多便利,但也带来了“信息超载”的问题。随着个性化推荐算法的兴起,用户可以从大量复杂的数据中快速地提取有效的信息。很多研究者将深度学习算法成功地应用在推荐算法中,然而推荐算法仍然存在许多挑战。变分自编码器模型(VAE)可以很好地挖掘用户和项目之间的关系,具有很好的拓展性,被广泛应用在推荐算法中。目前的算法研究大多考虑用户的社交关系,很少考虑项目间的社交关系。如何有效地结合项目间的社交关系等辅助信息提高推荐的效果,对于推荐算法仍是一个挑战。此外VAE在训练时,忽视了观察数据,导致隐变量和观察数据之间的相关性不强,从而对推荐结果产生影响。本文针对这两个问题,对VAE模型在推荐算法中的应用进行了研究和改进。主要工作如下:1.提出了融合项目社交正则化和VAE模型的推荐算法。研究VAE模型的相关理论和其在推荐算法中的应用,挖掘项目间的社交关系,对项目的社交关系进行处理。将用户-项目行为矩阵、项目内容信息和项目之间的社交关系集成到VAE模型中,有效利用项目关系中的辅助信息来缓解项目冷启动和数据过于稀疏的问题。通过贝叶斯生成模型学习数据中的隐含特征值和潜在的内容变量表示,利用特征学习和多层表示能力缓解协同过滤算法存在的数据稀疏性和推荐结果不准确。通过实验结果证明,改进的算法在结果预测方面更准确。2.提出了融合最大化互信息和VAE模型的推荐算法。VAE模型在训练过程中,过度的正则化忽视了对观察数据的考虑,使得隐变量和观察数据间的依赖性不强。本文采用互信息最大化的VAE来构建模型,在训练过程中引入互信息最大化项,推导出一个新的泛化证据下界对象,并引入参数来平衡重构损失、正则化损失和互信息损失,使模型中的原始输入数据和学习到的隐变量表示之间的互信息最大化。通过实验结果证明,提出的改进算法在预测方面具有更好的效果。3.设计并实现一个文章推荐系统,将上述提出的改进推荐算法应用到文章推荐系统中,为用户推荐可能感兴趣的文章信息。

基于矩阵分解的社交推荐研究

这是一篇关于推荐系统,数据稀疏性,矩阵分解,社交网络,协同推荐的论文, 主要内容为推荐系统是一种基于交互式评分数据的数据挖掘技术,通过深层次地挖掘显式评分数据和隐式反馈数据中具有潜在价值的信息,得到用户和物品的个性化偏好,从而预测用户对物品的喜好程度。然而,推荐技术在实际应用过程中遇到了一些瓶颈问题,比如数据冷启动,数据稀疏性和动态增量数据。众所周知,数据稀疏性是推荐系统最为常见的难题之一。推荐技术是从显式评分数据中深度挖掘出用户的兴趣偏好并进行有效合理的推荐。然而,由于评分数据的缺失,推荐模型不能最大化地学习用户的兴趣特征,导致评分预测值与真实值存在很大的偏差,从而降低了推荐准确率。针对数据稀疏性问题,本文开展了一系列的相关研究工作,主要内容如下:1.为了缓解数据稀疏性,本文除了对显式评分数据进行数据挖掘以外,还为推荐模型引入了隐式反馈信息,如社交信息。由于社交用户的兴趣共享性,模型能够深层次地学习用户的兴趣偏好。本文利用矩阵分解将显式评分信息和社交信息分别投影到相应的低维特征空间,生成了用户的兴趣偏好和物品的个性化特征并为用户进行推荐。2.针对模型的准确性,本文在显隐式信息的基础上提出了多种推荐策略,其中包括基于矩阵分解的推荐、基于用户的推荐和基于物品的推荐。这三种推荐策略分别从用户和物品的潜在因子、用户的社交因子、物品的特征因子的角度进行推荐。在对显隐式信息进行矩阵分解的同时,本文将这三种推荐策略融合成统一的预测评分机制,共同学习出用户的兴趣偏好和物品的特征。这种方法有利于改善推荐模型的预测准确性。3.为了充分地挖掘社交网络信息,本文基于用户行为的方法学习社交用户的个性化偏好并使用特征向量来表示。接着,利用社交用户的兴趣差异性衡量用户之间的社交关系度,其代表了社交用户之间的兴趣相似性。最后,将细粒度化的社交信息作为隐式信息嵌入到矩阵分解中,进一步地学习用户的个性化偏好,提高了预测准确性。

基于项目和消费者偏好视角的个性化推荐服务研究

这是一篇关于个性化推荐,协同过滤算法,数据稀疏性,类别偏好,项目流行度的论文, 主要内容为近年来,伴随着互联网技术的发展“信息过载”问题愈演愈烈,如何从海量信息中获取感兴趣信息就变得异常重要。个性化推荐服务系统以推荐算法为核心,通过挖掘历史数据以缓解“信息过载”、改善消费者体验。然而历史数据的稀疏性制约了其应用。此外,消费者兴趣和项目流行度会随着时间而改变,也会对推荐结果产生消极影响。机器学习算法具有较强的特征提取和拟合能力,文中将其与协同过滤算法相结合以期解决上述问题。具体研究内容如下:(1)提出了基于多重相似度和Cat Boost的个性化推荐模型。针对“消费者-项目”评分矩阵稀疏导致推荐系统精度低的问题,首先利用修正的余弦相似度函数求解项目元数据和评分数据的相似矩阵并进行融合,接着采用大规模信息嵌入网络对融合后的相似矩阵进行多阶相似性分析计算更精确的近邻集。然后,以此作为Cat Boost的输入预测项目评分并利用Top-N推荐项目。最后,以Movie Lens数据集为实例进行实证分析并与RBF-CF、XGB-CF、UCF和Cat Boost进行对比。结果表明,该方法具有更高的推荐精度、更强的稳定性,可解决历史数据稀疏性对推荐系统的影响。(2)提出了融合类别偏好与项目时效因素的混合推荐模型。针对类别偏好与项目时效因素对推荐算法性能的影响,首先采用哈夫曼编码融合类别偏好与项目时效因素的评分数据;接着求解消费者、项目相似度矩阵并由Deep Walk模型挖掘其潜在特征向量;然后融合消费者、项目特征向量并由极限学习机(ELM)预测项目评分。最后以Movie Lens数据集为实例,ICF、UCF、ELM、RBF-CF和XGB-RF为对比方法进行实证分析验证该方法在不同比例训练集下的推荐性能。结果表明,该方法可有效缓解类别偏好与项目时效因素对推荐结果的影响。以上算法不仅能缓解数据稀疏性、类别偏好及项目时效因素对个性化推荐的影响,深入挖掘消费者潜在偏好;且有利于商家分析消费者需求提供更加精准的个性化服务。

基于用户聚类的协同过滤推荐系统研究

这是一篇关于推荐系统,协同过滤,蚁群聚类,冷开始,数据稀疏性的论文, 主要内容为电子商务推荐系统现已成为很多企业进行广告宣传和商品销售的一个重要平台。然而,大量的商品信息充斥在网络之中,使得用户不能快速准确的搜索到其喜欢的商品。因此设计出更具个性化的电子商务推荐系统,以实现对用户更好的服务,就成为了很多企业研究的一个重要课题。目前,几乎所有著名的电子商务网站都在不同程度上采用了个性化的电子商务推荐系统,如易贝、淘宝网等。为了对用户进行快速而准确的推荐,研究人员已经提出了多种不同的推荐技术,如协同过滤推荐技术,贝叶斯网络技术,聚类技术,奇异值分解技术,关联挖掘技术等。其中,协同过滤推荐技术是在个性化的推荐系统中应用最广泛的,但随着其应用的深入,也暴露出了其中存在的一些问题,如“冷开始”问题、“数据稀疏性”问题等。本文也对协同过滤推荐技术进行研究,主要解决协同过滤推荐算法中存在的“冷开始”问题、“数据稀疏性”问题。本文主要做了以下研究工作： 1.对个性化推荐系统的发展历史及现状进行了综述,指出了协同过滤推荐算法中存在的“冷开始”和“数据稀疏性”两大瓶颈问题。 2.将蚁群聚类算法引入到协同过滤推荐技术的研究之中。 3.针对协同过滤算法中存在的“冷开始”问题,提出了一种改进的算法。新的算法除了考虑用户之间主观偏好的相似性之外,还考虑了用户之间客观特征的相似性：这使得系统能够对没有进行过主观评价的用户也能进行推荐。 4.采用蚁群聚类算法对用户进行聚类,然后在聚类簇中应用改进的协同过滤推荐算法搜寻邻居用户、进行预测评分。通过聚类,降低了邻居用户的搜寻范围,减少了系统的计算量,提高了系统的推荐质量,在一定程度上缓解了“数据稀疏性”的影响。 5.根据本文所提出的理论方法,进行了系统模拟。

基于评论和评分数据的推荐系统研究

这是一篇关于推荐系统,数据稀疏性,评论数据,情感特征,用户相似度的论文, 主要内容为信息技术的飞速发展,让人类真正迈入了大数据时代,这个时代在给我们提供巨大便利的同时,也带来了“信息过载”的问题。为了解决这一难题,研究人员提出诸多方案,其中,推荐系统是解决这一问题的重要方法。它可以将不同的用户和项目联系起来,不仅可以将项目高效推荐给用户,还可以使用户轻松发现自己感兴趣的物品。但是在推荐系统中,历史评分数据的缺失造成的数据稀疏性一直制约着推荐系统的发展。随着电子商务技术发展成熟,平台和用户的交互越来越多,用户开始对物品或服务等发表评论,而这些评论比评分更加能体现用户的个性化需求以及用户对物品的偏好。因此,本文提出了基于评论和评分数据的推荐系统研究方法。具体来说,可以分为以下两个工作:(1)提出了基于评论数据的社交矩阵分解模型ReTOMF,改善评分数据不足带来的稀疏性问题。缺少历史评分数据会造成冷启动问题,导致推荐质量不佳。本文使用丰富的评论数据,使用主题模型对文档建模,挖掘用户之间和项目之间的隐式邻居关系,并集成到社交推荐框架中。过去的推荐系统中,项目之间保持独立,但项目之间也应有相应联系,所以本文对项目之间也建立社交关系。当用户在购买不熟悉的物品时会选择查看评论等信息用来判断物品的价值,所以在模型中加入项目信誉,提高推荐的精确度。(2)提出了基于评论数据情感特征的推荐模型ReTFGM,用来挖掘用户对项目的情感特征。首先,利用主题模型计算每个文档的主题分布,并用评分数据建立用户评论态度,因为评分数据可以看做是评论文本所具有的情感的数值化体现,利用用户评论态度改进主题分布,形成新的用户偏好,用以计算用户之间的相似度,并称之为信任度。其次,为了弥补共同评论数据不足导致的信任度低的问题,提出了用户声誉的概念,利用用户和其朋友的相似度以及用户的评分偏差计算用户声誉,并作为信任值计算的一部分,通过信任值的大小为目标用户找到邻居集并集成到基于信任传播的矩阵分解技术中。最后,为了更好地改进模型提升推荐系统的准确性,在模型中加入了用户和项目的个性化特征即用户的评分偏好和项目信誉。

基于鲸鱼优化聚类的推荐算法的研究与应用

这是一篇关于推荐系统,协同过滤,数据稀疏性,鲸鱼优化,用户偏好的论文, 主要内容为目前,不少平台特别是社交和电商平台,都有成熟的推荐系统,比如腾讯、微博、天猫等,都能够根据用户的信息进行不同程度的推荐。当前推荐系统的相关算法主要有:基于邻域的算法、基于内容的算法、隐语义模型等。在诸多推荐算法中,基于邻域的算法是最基本的算法,基于邻域的算法也称为协同过滤算法,主要包括两大类,分别是基于用户的协同过滤和基于项目的协同过滤。虽然推荐系统在各领域有着广泛的应用,但随着用户及项目的急剧增加,推荐系统也面临诸如“冷启动”、“数据稀疏性”等不足。为了解决其传统协同过滤的一些不足,本课题对以下内容进行了讨论与研究:1.对推荐系统进行了介绍,主要介绍了其概念、类别及评测指标。其中,详细的介绍了协同过滤算法。2.为了提高推荐算法的准确率和效率,本课题在协同过滤算法的基础上,分析了数据稀疏性对推荐结果的影响,提出了基于鲸鱼优化聚类的协同过滤算法,详细介绍了基于鲸鱼优化聚类的协同过滤算法的原理及实现过程。3.在基于鲸鱼优化聚类的协同过滤算法基础上,结合用户的偏好,提出了基于鲸鱼优化聚类和用户偏好的推荐算法。该算法考虑了不同的偏好对推荐结果的影响,从而使得推荐系统的准确率进一步提高。本文在对以上内容进行讨论的基础上,为了验证所提出算法的有效性,进行了仿真实验。实验结果表明,基于鲸鱼优化聚类和用户偏好的推荐算法在推荐准确率上优于协同过滤算法,对协同过滤算法起到了改进作用。

基于随机游走的歌曲混合推荐算法研究

这是一篇关于推荐算法,协同过滤,随机游走,数据稀疏性,场论理论的论文, 主要内容为互联网技术的迅速发展,使得各种音乐网站和应用越来越多,充分满足了人们对于音乐的需求。但是随之产生的信息过载也带来了一个巨大挑战,即用户很难在海量的音乐中找到符合自己兴趣偏好的歌曲。推荐系统能够有效的解决这个问题,通过个性化推荐技术改善信息过载问题。然而系统中数据不平衡导致的数据稀疏性问题,严重影响了推荐结果的准确性。因此,本文通过计算歌曲综合相似度,建立歌曲偏好相关图,并融合场论理论构建转移概率矩阵,对随机游走推荐算法进行改进,具体工作如下:(1)融合协同过滤和内容特征,建立歌曲偏好相关图。根据用户的收听记录建立用户-歌曲二部图,基于收听次数计算歌曲评分相似度,再提取歌曲的内容特征,计算歌曲信息相似度。然后将两者融合得到综合相似度,降低歌曲相似度矩阵的稀疏性,并构建歌曲偏好相关图。(2)结合场论理论建立随机游走算法中的转移概率矩阵。在计算转移概率矩阵时,融合场论理论,由歌曲相关图建立歌曲场,结合歌曲的重要度与综合相似度得到转移概率矩阵,从而降低随机游走的时间复杂度。(3)混合推荐算法的验证。使用Million Song Dataset的子数据集,将融合场论理论的随机游走歌曲混合推荐算法和基于项目的协同过滤歌曲推荐算法、基于随机游走的歌曲推荐算法进行对比。选取推荐准确率和召回率作为评价指标,验证混合算法的有效性。实验结果表明,融合场论理论的随机游走歌曲混合推荐算法,在一定程度上改善了数据稀疏性问题,提高了推荐的准确性,表明本文对推荐算法的改进是合理且有效的。

本文内容包括但不限于文字、数据、图表及超链接等）均来源于该信息及资料的相关主题。发布者：源码客栈，原文地址：https://bishedaima.com/lunwen/47631.html