微博中智能化用户推荐系统的研究和应用
这是一篇关于推荐系统,协同过滤,社交关系,上下文信息,组合模型的论文, 主要内容为近年来,随着社交网站的快速发展,几乎每一个互联网用户每天都在使用不同的社交网站以及基于社交网站的服务。社交关系是社交网站最为核心的数据,也是其他所有服务的基础,因此社交网站中的用户推荐系统具有非常重要的研究意义和应用价值。本文基于国内著名社交网站腾讯微博的数据,深入研究了协同过滤算法的相关技术。具体的研究工作如下: (1)在数据分析的基础上提出了微博用户推荐系统所面临的主要问题,实现了三个基准预测模型,为后面对协同过滤算法进行改进提供了实验依据。 (2)利用社交关系和目录、关键词信息在效率和精度两个方面改进了传统的基于用户的邻居模型和基于项目的邻居模型。 (3)提出了融入社交关系的非对称因子模型,有效解决了冷启动问题,大大提高了预测精度,并在此模型基础上通过融入上下文信息,进一步提高了精度。 (4)实现了线性回归以及神经网络组合方法,组合多个单模型的预测评分,实验表明在模型中融入各类信息比通过组合模型来利用这些信息更能提高预测精度。
基于个性化的实时电影混合推荐系统设计与实现
这是一篇关于数据挖掘,推荐系统,实时推荐,组合模型的论文, 主要内容为现代社会随着数据的急剧增多,逐渐进入到大数据时代,人们对数据深度知识的挖掘也不断增多。电影是人们必不可少的娱乐项目,对用户进行个性化的电影推荐也越来越重要。但是单模型推荐对推荐效果具有很强的局限性,根据环境的不同而采用统一的模型处理则会降低推荐效果,而且在数据飞快演变的快节奏中,对用户的实时推荐也变的尤为重要。因此,如果在尽可能短的时间内,根据用户的不同场景,对用户进行精准而实时的推荐是当前数据挖掘领域比较热门的研究话题。本文对推荐领域的算法和模型进行了研究,针对不同情景设计实现了混合推荐的实时推荐系统,主要对历史热门推荐、基于内容推荐、基于交替最小二乘法模型离线推荐、实时推荐进行了整合。实时推荐系统要求对用户的反应进行及时的回馈,使用了已有的简单推荐模型,目的在于使得推荐简单而有效。为了使推荐更能捕捉用户最近观影的兴趣偏好,对该模型进行了改进,在最近的评分较高的电影参与计算预测评分时增加权重因子,以得到满足用户需求的电影推荐列表。同时使用不同的选择策略优化了推荐电影的候选池内容,可以提高实时推荐的准确度。系统所使用的数据集是Movie Lens电影数据集,在实验部分对电影的推荐效果进行了研究和分析。系统包含前台业务系统、后台管理系统两大主体部分,并且在前台业务系统中嵌入推荐系统模块,并对所有系统设计了可视化页面,给予用户良好的操作体验。前台业务系统中增设积分功能,通过积分可以观看当前热门且需要付费的电影,旨在吸引并留住用户,增多用户行为记录并进行更准确的电影推荐。
微博中智能化用户推荐系统的研究和应用
这是一篇关于推荐系统,协同过滤,社交关系,上下文信息,组合模型的论文, 主要内容为近年来,随着社交网站的快速发展,几乎每一个互联网用户每天都在使用不同的社交网站以及基于社交网站的服务。社交关系是社交网站最为核心的数据,也是其他所有服务的基础,因此社交网站中的用户推荐系统具有非常重要的研究意义和应用价值。本文基于国内著名社交网站腾讯微博的数据,深入研究了协同过滤算法的相关技术。具体的研究工作如下: (1)在数据分析的基础上提出了微博用户推荐系统所面临的主要问题,实现了三个基准预测模型,为后面对协同过滤算法进行改进提供了实验依据。 (2)利用社交关系和目录、关键词信息在效率和精度两个方面改进了传统的基于用户的邻居模型和基于项目的邻居模型。 (3)提出了融入社交关系的非对称因子模型,有效解决了冷启动问题,大大提高了预测精度,并在此模型基础上通过融入上下文信息,进一步提高了精度。 (4)实现了线性回归以及神经网络组合方法,组合多个单模型的预测评分,实验表明在模型中融入各类信息比通过组合模型来利用这些信息更能提高预测精度。
基于Spark环境下的机器学习在商品推荐中的应用研究
这是一篇关于推荐系统,Spark,逻辑回归,梯度提升决策树,深度森林,组合模型的论文, 主要内容为随着各大电商平台的产生和在线购物用户数量的不断增长,用户面对种类繁多的商品信息时会出现选择困难的情况,同时各个购物平台面对海量的用户群体也尝试各种营销方法对用户的购买意愿进行正向刺激以此来提升销售额。基于上述需求,推荐系统在当今社会中发挥着不可或缺的作用,它借助算法能够从海量的数据中为用户挑选用户想要的信息或者商品。本文采用阿里巴巴移动电商平台的真实用户行为数据,经选取后得到2014年11月22日至2014年12月5日的用户-商品交互行为数据,时间跨度为两周,该数据包含约1000万条样本数据,第一周的用户行为数据作为训练集,第二周的数据作为测试集,预测目标是用户在每周的周五是否购买用户在上周六至本周四发生过交互行为的商品,购买为正类,未购买为负类。首先训练集和测试集中分别通过用户、商品和商品类别三个角度进行特征提取,由于发生购买行为的样本占总样本的比例很小,数据的不平衡会导致模型性能的失效,因此对未发生购买行为的样本进行基于K均值聚类的下采样处理。采样过后的数据作为本文最终的建模数据。其次考虑到数据量很大,因此本文从Spark分布式环境出发,先分别单独使用逻辑回归(LR)、梯度提升决策树(GBDT)和随机森林(RF)进行建模分析,实验结果表明无论在训练集还是测试集中GBDT的效果最好,为进一步提高模型预测效果,融合Stacking和深度森林的思想,构造GBDT-RF-LR组合模型,使用并联的方式组合GBDT和RF并输出增强特征矩阵,与训练数据合并成新数据集,再使用逻辑回归进行训练,结果表明组合模型的拟合效果和泛化能力都要优于单个模型;在单机模式下,使用Spark环境下相同的模型和深度森林进行建模分析,最后对比两种环境下的结果,Spark分布式环境下的模型预测精度更高。因此,本文认为在商品推荐中应用Spark环境下组合模型的效果最好。
基于麻雀搜索算法与门控循环单元神经网络的风电功率预测研究
这是一篇关于风电功率,门控循环单元神经网络,麻雀搜索算法,组合模型的论文, 主要内容为随着传统化石能源的快速消耗与环境的急速恶化,越来越多的国家开始推进可再生能源的研究与开发。风能作为一种清洁、成本低廉且储量巨大的能源,成为了学界的研究热点。但风能同时也具有间歇性、波动性与不稳定性等缺点,这给风力发电带来了很大的困难。因此对风电功率进行精确预测变得不可或缺。现有的风电场通常由多个风力发电机构成,通过对单个风机功率进行预测,可以计算出整个风电场的输出功率,从而为风电的消纳提供重要参考。本文正是在此研究背景下,针对风力发电机提出了一种基于麻雀搜索算法与门控循环单元神经网络的风电功率预测模型。本文的研究内容有以下几点:(1)基于组合模型的思想,本文提出了一种基于麻雀搜索算法与门控循环单元神经网络的风电功率预测模型(SSA-Combination)。本文提出的模型由SSA-CNN-GRU、SSA-Attention-GRU与SSA-AR三种子模型组合而成。SSACNN-GRU子模型主要基于卷积神经网络与门控循环单元神经网络构建而成。SSA-Attention-GRU子模型主要基于外部注意力算法与门控循环单元神经网络构建而成。SSA-AR子模型基于自回归算法构建而成。在该组合模型中,三种子模型分别对未来的风电功率进行预测,然后三项预测结果以一定权重进行加和,最终得到全局预测结果。(2)为了进一步优化模型的预测性能,本文引入了麻雀搜索算法对SSACNN-GRU、SSA-Attention-GRU与SSA-AR子模型的超参数进行了优化,以确保各子模型获得最佳的预测性能。同时本文使用麻雀搜索算法对组合模型的组合权重进行了优化,进一步提升了组合模型整体的预测能力。(3)为了对模型的预测性能进行评估,本文基于真实的风电数据集设计了单步预测实验与多步预测实验,并在此基础上对本文提出的组合模型进行了全面的测试。在各项实验中本文提出的模型均展现出了较好的预测精度,表现优于其他参与实验的对照模型。各项实验的结果验证了本文提出的模型设计的合理性与性能的优越性。(4)结合风电功率预测模型的研究结果,本文构建了一套基于Spring Boot框架、微服务架构以及My SQL数据库的风电功率预测系统。该系统集成了数据预处理、模型训练、数据预测以及历史预测记录查看功能,在软件测试中表现出了稳定可靠的性能。
微博中智能化用户推荐系统的研究和应用
这是一篇关于推荐系统,协同过滤,社交关系,上下文信息,组合模型的论文, 主要内容为近年来,随着社交网站的快速发展,几乎每一个互联网用户每天都在使用不同的社交网站以及基于社交网站的服务。社交关系是社交网站最为核心的数据,也是其他所有服务的基础,因此社交网站中的用户推荐系统具有非常重要的研究意义和应用价值。本文基于国内著名社交网站腾讯微博的数据,深入研究了协同过滤算法的相关技术。具体的研究工作如下: (1)在数据分析的基础上提出了微博用户推荐系统所面临的主要问题,实现了三个基准预测模型,为后面对协同过滤算法进行改进提供了实验依据。 (2)利用社交关系和目录、关键词信息在效率和精度两个方面改进了传统的基于用户的邻居模型和基于项目的邻居模型。 (3)提出了融入社交关系的非对称因子模型,有效解决了冷启动问题,大大提高了预测精度,并在此模型基础上通过融入上下文信息,进一步提高了精度。 (4)实现了线性回归以及神经网络组合方法,组合多个单模型的预测评分,实验表明在模型中融入各类信息比通过组合模型来利用这些信息更能提高预测精度。
基于组合模型的农产品物价预测系统设计与实现
这是一篇关于物价预测,BP神经网络,SVR预测,组合模型的论文, 主要内容为现如今,随着科学技术的发展,各行各业的数据被及时保存,数据信息量大,维数高,数据类型多,人们想从大量数据中获取有价值的信息变得更加困难。但是随着科技的进步,很多的智能算法理论被科学研究者们提出,利用智能算法能够从大量数据中挖掘有意义且有价值的信息。我国地源辽阔,农业信息相对较为闭塞,人们无法及时获得农产品价格信息以及预测未来一段时间内农产品物价走势,现迫切需要一种可以及时获取农产品价格信息和能够对未来一段时间内的农产品价格进行预测的系统。所以本文旨在实现一种基于组合模型的农产品物价预测系统,用户可以查询农产品物价信息,同时可以对未来一段时间内某种农产品物价进行预测与分析,极大方便农户和消费者掌握农产品信息。为实现农产品物价预测系统,本文深入研究了常用的预测算法,提出优化预测算法,结合多种算法特点,设计一种基于组合模型的农产品物价预测算法,使得预测准确率进一步提高,算法更加稳定;同时研究了Web开发框架,以及如何保证Web系统平稳高效正常运行;后台数据库采用读写分离和主从备份技术,从而保证系统的可靠性和数据的完整性。本文首先阐述了农产品物价预测系统和预测模型的国内外研究现状,介绍了数据挖掘、JavaEE Web开发框架和常用的预测算法模型,基于此详细介绍了系统的核心模块BP-SVR-BP组合模型。紧接着从系统需求分析着手,设计农产品物价预测系统的结构和功能,最后依托实验室“贵安智慧城市运管中心可视化平台”的项目,以平台提供的数据作为支撑,利用实验室设备实现了基于组合模型的农产品物价预测系统。通过实现农产品物价预测系统,证实了BP-SVR-BP组合模型在农产品价格预测应用的可行性。同时本文的农产品物价预测系统预测准确率更高,提供服务更加全面。文章最后对整个系统运行进行了测试,测试结果表明,该系统对农产品物价预测准确率更高,可提供对农产品物价走势的分析,其他功能都可正常运行,完成了预测设定的目标和项目需求。
基于Spark环境下的机器学习在商品推荐中的应用研究
这是一篇关于推荐系统,Spark,逻辑回归,梯度提升决策树,深度森林,组合模型的论文, 主要内容为随着各大电商平台的产生和在线购物用户数量的不断增长,用户面对种类繁多的商品信息时会出现选择困难的情况,同时各个购物平台面对海量的用户群体也尝试各种营销方法对用户的购买意愿进行正向刺激以此来提升销售额。基于上述需求,推荐系统在当今社会中发挥着不可或缺的作用,它借助算法能够从海量的数据中为用户挑选用户想要的信息或者商品。本文采用阿里巴巴移动电商平台的真实用户行为数据,经选取后得到2014年11月22日至2014年12月5日的用户-商品交互行为数据,时间跨度为两周,该数据包含约1000万条样本数据,第一周的用户行为数据作为训练集,第二周的数据作为测试集,预测目标是用户在每周的周五是否购买用户在上周六至本周四发生过交互行为的商品,购买为正类,未购买为负类。首先训练集和测试集中分别通过用户、商品和商品类别三个角度进行特征提取,由于发生购买行为的样本占总样本的比例很小,数据的不平衡会导致模型性能的失效,因此对未发生购买行为的样本进行基于K均值聚类的下采样处理。采样过后的数据作为本文最终的建模数据。其次考虑到数据量很大,因此本文从Spark分布式环境出发,先分别单独使用逻辑回归(LR)、梯度提升决策树(GBDT)和随机森林(RF)进行建模分析,实验结果表明无论在训练集还是测试集中GBDT的效果最好,为进一步提高模型预测效果,融合Stacking和深度森林的思想,构造GBDT-RF-LR组合模型,使用并联的方式组合GBDT和RF并输出增强特征矩阵,与训练数据合并成新数据集,再使用逻辑回归进行训练,结果表明组合模型的拟合效果和泛化能力都要优于单个模型;在单机模式下,使用Spark环境下相同的模型和深度森林进行建模分析,最后对比两种环境下的结果,Spark分布式环境下的模型预测精度更高。因此,本文认为在商品推荐中应用Spark环境下组合模型的效果最好。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码助手 ,原文地址:https://bishedaima.com/lunwen/47821.html