基于混合模型的推荐系统的研究
这是一篇关于个性化推荐,矩阵分解,多模型融合,机器学习的论文, 主要内容为随着互联网技术的不断发展,互联网上信息正在以爆炸式的速度增长,尽管人们可以获得信息的方式越来越多,但是也不得不面对信息过载这一问题即在海量的信息中寻找出有价值的信息越来越困难这一问题,为了解决信息过载问题,个性化的推荐系统应运而生并且已经成为人们解决信息过载问题的主要手段。因此对推荐系统的研究与对推荐系统性能的改善具有很大的社会价值。本文首先介绍了推荐系统中常见的算法,重点对矩阵分解算法进行了研究,并对矩阵分解算法提出了改进,同时提出了通过多种分类器模型进行融合的方案来构建推荐结果集,最后通过实验分析和比较验证了方案有助于推荐效果的提高。具体来说,本论文主要工作包括以下的三个方面:1)对推荐系统中的矩阵分解算法进行了研究,通常在实际中用户接受推荐时除了会受到其自身兴趣的因素影响外还会受到与其好友的社交因素的影响,由于矩阵分解算法通常主要是仅从用户和项目这两个方面的评分来考虑推荐而没有考虑与其好友的社交因素对评分的产生的影响。因此,本文对矩阵分解算法SVD++算法进行了改进,即将近邻的社交因子加入模型中。通过对比实验表明相比传统的矩阵分解算法,经过改进后算法有助于推荐效果的提升同时也缓解了推荐系统的稀疏性问题。2)相对于使用单一算法进行推荐而言通过对模型进行融合能够更好地提高推荐的性能。因此本文提出来对分类算法进行多模型融合的方案来产生推荐结果,其中分类算法选取的是逻辑回归算法(LR)和梯度提升树算法(GBDT)和随机森林算法(RF)。通过梯度提升树算法产生组合特征作为LR的特征进行训练,之后对模型通过Stacking的方式进行融合。通过对比实验表明通过对模型进行融合可以显著地提升推荐的性能。3)选取了两个数据集进行了实验对比分析,第一个实验是对矩阵分解改进算法的验证,主要通过带有社交关系的数据集有Epinions数据集来进行实验,通过将改进的算法与原有的矩阵分解算法进行对比RMSE有所下降。第二个实验是基于机器学习中的分类算法相融合的对比实验,使用的数据集是天猫数据集,对所提供的数据使用特征工程的方法对特征进行提取,并通过Stacking的方式进行模型融合,以F1和AUC作为测评指标,经实验验证表明相较于单一的模型,进行多模型融合的方案下的F1和AUC值得到了提升。
基于多模型融合的在线广告转化率预测方法研究
这是一篇关于在线广告,转化率,多模型融合,特征编码,购物节的论文, 主要内容为随着互联网技术的不断发展,许多传统行业逐渐从线下转移到线上,在线广告作为互联网的重要组成部分,越来越多地出现在人们的视野中。如何通过给定的用户行为数据,既找到满足用户需求的广告,又为广告平台和广告商带来收益,是在线广告领域需要解决的核心问题。要做到精准匹配,关键在于准确预测广告的点击率或转化率,量化广告投放的效果。此外,比起点击率,转化率更接近广告营销链条的终端,具有更强的现实意义。在线广告形式和场景多样,同一种方法无法面面俱到,因此本文选取电子商务平台搜索广告作为研究对象。电商平台是一个集广告平台与广告商于一体的系统,结构较为复杂,容易受到各种因素的影响。最为明显的,在诸如“双十一”、“618”等大型购物节到来时,平台和商家的各类活动会导致用户流量的急剧变化,即日常时期和购物节时期的数据分布存在较大的差异,通过日常时期数据学习到的模型很难有效预测购物节的转化率。基于此,本文通过对日常时期预测方法的各个环节进行重新评估和改良,旨在提出一种能够更高效准确预测购物节广告转化率的方法,主要工作包括:(1)概述常用的机器学习算法并进行比较,分析各个算法对在线广告转化场景的适应性,并进行一定的优选,为后续进行算法的多模型融合提供理论基础。(2)借助电商平台在购物节时期的搜索广告转化相关数据,进行相应的分析和处理。其中,在特征编码环节,提出一种基于信息熵原理的分层编码方法,用量化方式划分编码区间,对可用的高基数特征,结合均值编码和Word2vec编码进行处理。(3)根据数据分析结果,设计新的预测方法。首先设计针对购物节的数据集划分法;其次构建相应的特征工程,其中着重处理转化率特征;最后提出一种加权平均融合模型,其中各个单模型均采用梯度提升树一类算法处理输入数据,整个模型仅需构建一次特征工程,优化了时间效率。(4)从衡量误差的评价指标入手,对新方法改良的各个环节进行预测结果的对比评估,证明这些修改的有效性和必要性。实验结果证明,本文提出的在线广告转化率预测方法预测准确度高,能够有效应对不同类型的特征,提高数据利用率,比现有方法更准确地预测用户的购买意向,是一种非常适合电商平台搜索广告在购物节时期进行转化率预测的方法。
基于模型融合的群组推荐多层集成框架
这是一篇关于矩阵分解,主题模型,群组推荐,社会选择,多模型融合的论文, 主要内容为推荐是一种古老的筛选检索方式,汉代有汉武帝令郡国举孝廉,隋朝有科举推荐选拔人才,都凸显着推荐的作用。在现代社会,爆炸式的信息充斥着生活的方方面面,如何从纷繁复杂的信息中获取对自身有价值的信息变得愈发重要,推荐系统的出现为处在不知所措中的人们提供极大的便利,也为引入推荐系统的企业带来了丰厚的回报。但是,目前大部分推荐系统着眼于对单个用户的推荐,而忽视了对群组的推荐。在生活中,经常遇到集体外出就餐、郊游、聚会等,对于这类场景,决策需要综合考虑群组中各个成员的意见做出决定。同时,在人工智能发展还不完善的今天,模型或多或少都存在一些问题,通过多模型融合弥补各个模型的不足,提升性能,是一种普遍采用的手段。针对个性化推荐系统,为了解决传统矩阵分解算法存在数据稀疏性等问题,论文将评论数据引入训练。通过主题分析手段挖掘评论信息,改进了现有的矩阵分解算法与主题分析算法融合模型,提出了Dual-HFT(Dual Hidden Factors as Topic)改进算法。同时,通过理论推导与实验分析证明该算法的有效性。在群组推荐系统中,基于社会选择理论,论文选用Med Rank(Median Rank)算法代替传统排序融合算法,避免了传统算法中存在的诸多问题。同时,针对现有的基于社会选择的群组推荐算法存在忽略成员权重的问题,论文提出一种加权的群组推荐融合策略WRank(Weighted Med Rank),使推荐结果更加贴合真实情况。通过仿真实验证明,WRank满足群组推荐的合理性与真实性。。在传统推荐系统框架的基础上,论文提出了一个基于模型融合的多层的集成推荐框架,该框架具有多步融合过程(包括个性化推荐、群组推荐与模型融合)。在不同的粒度推荐过程中,论文通过融合了子算法的结果以弥补其各自的缺点。特别地,针对现有模型融合方法无法应用于排序融合算法的问题,文章采用新的衡量指标与计算技巧实现模型的融合。最后,实验结果表明,该推荐框架的在进行Top-N推荐时,框架的准确性优于其他对比方法。
基于多粒度分析的外卖平台数据用户情感分析
这是一篇关于情感分析,注意力机制,长短时记忆网络,用户评论数据,多模型融合的论文, 主要内容为随着外卖软件的不断发展和成熟,越来越多的人开始选择在网上订餐。而外卖平台为了让更多用户从外卖商品的品质、口感、质量甚至是服务等方面进行评价,开通了点评功能。这一功能也逐步成为用户用来决定是否下单的重要依据,因此对外卖用户的评论进行情感分析来帮助用户更好地获取外卖平台的信息,成为当下学者广泛关注和研究的热点课题。本文通过对获取自美团外卖平台的真实数据开展研究,采用双向长短时记忆网络(Long Short-Term Memory,LSTM)提取外卖评论数据中的时序特征,并结合自注意力模型对外卖评论语句中前后文的语义关系进行充分提取;在此基础上对外卖评论数据进行多模型训练,发挥不同网络模型的优势从而取得更优效果;最后基于上述算法开发了外卖评论数据情感分析原型系统,从而为外卖商家、消费者及运营平台提供借鉴。本文方法经过大规模数据测试,能够对绝大多数外卖评论数据实现较为准确的情感分类。本文的主要研究内容有以下几个方面:1.提出了基于自注意力机制的双向LSTM外卖评论数据情感分类模型双向LSTM可以充分获取文本前后的逻辑关系而被广泛应用于自然语言处理等领域。本文为充分获取外卖评论数据前后文特征,首先提出双向LSTM外卖评论数据情感分类网络,并在此基础上引入自注意力机制充分发掘和学习外卖评论数据中的相关规律,使得外卖情感分类结果更加准确可靠。2.提出了基于多模型融合的外卖评论数据情感分类模型在双向LSTM网络对数据进行特征提取的基础上,采用操作简单、训练迅速、广泛应用的端到端的模型对外卖评论数据进行学习训练。随后分别利用fast Text模型、BERT-MRC模型等模型对外卖评论数据展开训练。在这一过程中,充分利用fast Text模型网络简单但性能优异、BERT-MRC模型性能更优的优点,强化对外卖评论数据的特征提取工作,使得外卖评论数据情感分类结果有明显提升,并最终实现对外卖评论数据情感倾向的多粒度识别分类。3.设计并实现了自动情感分析原型系统为应用本文提出的外卖平台数据情感分析方法,本文设计并实现了基于B/S架构的自动情感分析原型系统。该系统包括外卖评论数据采集、原始数据预处理、外卖评论数据情感特征的提取、训练及外卖评论数据的情感分析等功能,给用户提供了一个便捷、简单、易于操作的自动情感分析方案。通过多种应用示例进行展示,验证本文算法和本系统的有效性和实用性。
基于混合模型的推荐系统的研究
这是一篇关于个性化推荐,矩阵分解,多模型融合,机器学习的论文, 主要内容为随着互联网技术的不断发展,互联网上信息正在以爆炸式的速度增长,尽管人们可以获得信息的方式越来越多,但是也不得不面对信息过载这一问题即在海量的信息中寻找出有价值的信息越来越困难这一问题,为了解决信息过载问题,个性化的推荐系统应运而生并且已经成为人们解决信息过载问题的主要手段。因此对推荐系统的研究与对推荐系统性能的改善具有很大的社会价值。本文首先介绍了推荐系统中常见的算法,重点对矩阵分解算法进行了研究,并对矩阵分解算法提出了改进,同时提出了通过多种分类器模型进行融合的方案来构建推荐结果集,最后通过实验分析和比较验证了方案有助于推荐效果的提高。具体来说,本论文主要工作包括以下的三个方面:1)对推荐系统中的矩阵分解算法进行了研究,通常在实际中用户接受推荐时除了会受到其自身兴趣的因素影响外还会受到与其好友的社交因素的影响,由于矩阵分解算法通常主要是仅从用户和项目这两个方面的评分来考虑推荐而没有考虑与其好友的社交因素对评分的产生的影响。因此,本文对矩阵分解算法SVD++算法进行了改进,即将近邻的社交因子加入模型中。通过对比实验表明相比传统的矩阵分解算法,经过改进后算法有助于推荐效果的提升同时也缓解了推荐系统的稀疏性问题。2)相对于使用单一算法进行推荐而言通过对模型进行融合能够更好地提高推荐的性能。因此本文提出来对分类算法进行多模型融合的方案来产生推荐结果,其中分类算法选取的是逻辑回归算法(LR)和梯度提升树算法(GBDT)和随机森林算法(RF)。通过梯度提升树算法产生组合特征作为LR的特征进行训练,之后对模型通过Stacking的方式进行融合。通过对比实验表明通过对模型进行融合可以显著地提升推荐的性能。3)选取了两个数据集进行了实验对比分析,第一个实验是对矩阵分解改进算法的验证,主要通过带有社交关系的数据集有Epinions数据集来进行实验,通过将改进的算法与原有的矩阵分解算法进行对比RMSE有所下降。第二个实验是基于机器学习中的分类算法相融合的对比实验,使用的数据集是天猫数据集,对所提供的数据使用特征工程的方法对特征进行提取,并通过Stacking的方式进行模型融合,以F1和AUC作为测评指标,经实验验证表明相较于单一的模型,进行多模型融合的方案下的F1和AUC值得到了提升。
基于多模型融合的BGA焊点故障诊断及溯源方法研究
这是一篇关于故障诊断,多模型融合,工艺分析,故障溯源的论文, 主要内容为随着电子产品逐渐面向高集成化及小型化的发展趋势,传统的封装形式已经无法满足高可靠性、高质量以及小轻薄的封装需求,故而寻求高质量的封装技术和焊接工艺已经成为业界的发展重点。BGA封装芯片为倒装焊器件,具有体积小、引脚数多且间距大及电气性能更佳等优点,而BGA焊点质量取决于焊接工艺调控且直接影响元器件的机械电气性能。因此将对焊点故障诊断与工艺故障溯源技术结合,是优化焊接工艺、保证焊点质量良好的重中之重。本文主要将多种机器学习算法进行概率融合实现焊点故障诊断,并对造成焊点故障的主要工艺原因溯源,即工艺故障溯源方法进行研究。本文首先针对焊点连桥、焊点空洞、焊点过大以及焊点过小等故障类型,依据IPC-7095D和IPC-A-610G标准对其进行定义,并通过对回流焊接工艺的深入探究设计了BGA焊接试验方案,利用X-ray检测设备对焊后的BGA焊点采集了50000条几何参数信息与40068条温度参数集。为了使数据中每个特征都处于相同的范围内且在同一量级,在故障诊断模型中采用随机划分的方式将数据划分为30000条训练数据和2000条测试数据,而在工艺故障溯源模型中通过聚类分析的方式将数据划分为75%作为训练集和25%作为测试集,并在数据输入模型之前进行润色,以便更好的实现模型训练及测试。其次,设计了焊点故障诊断模型与工艺故障溯源模型,并分别对它们进行了模型性能分析。通过融合20%权重的SVM分类器、50%权重的RF分类器及30%权重的二维CNN网络结构进行BGA焊点故障诊断,即所提的多模型融合故障诊断方法(MMF),并分别与SVM和RF分类器的诊断结果进行比较验证,实验结果表明,MMF诊断模型将精度提高至98.36%,既兼顾了可解释性,又使模型具有良好的稳定性。进一步的,针对回流焊接过程中温度特征参数包括升温速率(Kp)、降温速率(Kc)、预热时间(Tp)、保温时间(sT)、液相线时间(rT)以及峰值温度(R)的不合理设置,基于MMF诊断模型对焊接工艺故障进行溯源,但为了提高模型性能使用SENe T网络对模型进行改进,并与MMF模型进行对比分析。结果表明:改进后模型的溯源结果为Kp(29)Tp(29)R(29)Tr,它们的故障率占比高达88.21%,并达到了97%的溯源精度,提高了3.8%。最后,基于PyQt5跨平台工具库、Django框架和Vue框架开发云端可视化系统。为了增强故障诊断模型与故障溯源模型的集成性和实际应用可行性,使用Django搭建后端框架来提升安全性且数据库选择了mysql,采用Py Qt5可以避免在进行数据预测时会发生主线程卡死;而云端系统的前端框架采用了Vue,为工程师周期性调控模型提供便利。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕业设计货栈 ,原文地址:https://bishedaima.com/lunwen/52264.html