基于聚类协同过滤和图自编码器的个性化推荐系统研究
这是一篇关于推荐算法,协同过滤,麻雀搜索算法,图自编码器,随机游走的论文, 主要内容为随着机器学习和人工智能技术的迅速发展,互联网上的信息爆炸式增长,导致了信息量大、质量差、价值低等问题。为了更好地获取高质量信息,推荐系统应运而生,该系统通过将用户的历史行为、兴趣爱好、人口统计信息等作为输入,并采用这些数据对模型进行训练,生成能够最大化用户兴趣和满意度的推荐列表。本文分别从传统机器学习推荐算法和深度学习推荐算法两个角度进行了研究,并且对以下两个部分进行探讨:第一部分,对基于改进麻雀搜索与聚类协同过滤的推荐系统进行研究。在传统机器学习推荐算法领域,本文首先采用了K-means聚类算法和协同过滤算法相结合的方式,来解决数据稀疏性的问题。接着,针对K-means聚类算法中心点寻优等问题,又引入了一种新型的群智能优化策略——麻雀搜索算法,并通过加入Chebyshev混沌初始化种群、惯性权值和自适应的选择变异策略对该算法进行了改进。实验结果表明,与基于K-means的协同过滤算法相比,本文提出的基于改进的麻雀搜索与聚类协同过滤的推荐算法,有效地缓解了由于初始聚类中心点的选取过于集中而导致陷入局部最优的问题。同时,该方法也可以较好地确定聚类个数,在推荐的精度上有着较大的提升。第二部分,对基于概率的随机游走图自编码器模型进行研究。在深度学习推荐算法领域,本文针对现有的图自编码器无法很好捕捉图数据结构中节点之间的信息关联性问题,提出了基于概率的随机游走图自编码器模型。本模型首先对随机游走算法进行改进,采用节点的邻居数目来为当前节点赋予权值,进而优化转移概率。其次,为了更好地结合图卷积网络和随机游走网络,提出了自适应结合的方法,通过损失函数优化权重。为了证明该方法的有效性,本文将图网络最终的表示应用于链路预测任务。实验结果表明,与原图自编码器相比,本文提出的方法实现了优异的推荐效果。其中,在Cora、Citeseer和Pub Med数据集上的AUC分别提升了3.07%、6.7%和12.6%,AP值分别提升了3.15%、6.45%和1.13%。
水面异物收集机器人系统研发及路径规划技术研究
这是一篇关于水面异物,收集机器人,路径规划,麻雀搜索算法,远程遥控的论文, 主要内容为随着我国近海沿岸经济不断快速发展,近海水面异物垃圾污染情况日益严重,对海洋生态环境造成很大影响,如何快速高效收集水面异物成为当今社会急需解决的问题。当前,人工清理水面异物操作灵活简单,但劳动强度大、效率低。而大型清理船技术成熟,工作效率高、清理量大,但结构制造复杂,经济成本高,也不适用于近海水域。本文以省级课题“深远海大型智能渔业养殖装备技术研究”(ZJW-2019-01)为项目背景,以实现近海水面异物高效清理为目的,对收集机器人的系统和路径规划技术进行了深入研究,从而研发了一款适用于近海水域的水面异物收集机器人。本文的主要研究工作如下:(1)首先通过对本课题具体的应用场景与功能需求进行研究分析,提出了基于近海水域的水面异物收集机器人的整体系统设计方案。然后根据机器人的总体系统设计方案完成了机器人的机械系统结构和控制系统的设计。接着对水面异物收集机器人的航行运动特点进行分析,建立了机器人的运动学数学模型。最后对机器人的船体结构进行静力学受力分析仿真,验证了其功能的有效性。(2)提出了一种基于改进的麻雀搜索算法应用于水面异物收集机器人的路径规划。其中利用多种策略改进麻雀搜索算法的具体步骤如下:在算法初始阶段引入自适应权重,减弱随机初始化的影响并提高算法收敛速度;采用黄金正弦算法优化发现者的位置更新公式,增强算法搜索的稳定性;结合鲸鱼气泡网捕食策略改进加入者的位置更新公式,保证种群的多样性,增强跳出局部最优的能力;将生成的路径通过简化算子路径平滑策略去除多余拐点,平滑后得到最优的路径。本文利用MATLAB仿真平台做对比实验,分析得出本文改进的路径规划算法具有更好的优异性能。(3)根据水面异物收集机器人的系统设计方案和实际应用需求,对远程遥控系统的各个硬件模块进行分析与选型,同时基于远程遥控机器人对完成收集清理工作的控制要求,并根据相关的硬件模块特点,对机器人的软件系统进行了设计,实现了基于Lo Ra无线远距离通讯控制设计,完成了机器人的人机交互操控界面设计。(4)完成机器人实物样机研制,搭建开发了远程遥控系统的硬软件实验测试平台,在近海海面实际场景中对水面异物收集机器人进行以下实验测试:水面异物收集机器人相关技术参数测试,远程操控性能测试,水面异物垃圾收集测试和航行路径测试。由实验测试结果可知:在近海水域环境中,机器人上位机与下位机远程通讯可靠,操控性能良好,达到远程遥控收集水面异物垃圾的良好效果。
基于分布式集群的电商用户画像的研究
这是一篇关于用户画像,价值分类,RFM模型,聚类算法,流失预测,麻雀搜索算法的论文, 主要内容为随着互联网技术的飞速发展,网络资源和用户相关数据呈现爆炸式增长,并且越来越多的互联网产品由传统的买断制向订阅制转变,这也推动了用户画像研究的发展。构建出精准的用户画像系统对于每一个互联网企业来说都非常重要,能够更加准确地洞察用户的需求,从而完善自己的产品。然而,传统的机器学习算法不适用于海量数据的计算,目前的一些分类预测的研究难以满足需求。本文结合数据仓库对海量用户数据进行分层梳理,并针对用户进行价值分类和流失预测的研究,从不同的角度做出了相应的改进。主要研究内容如下:(1)基于改进的RFM模型的用户价值分类方法研究:由于传统RFM模型的分析指标较少,且最近一次消费时间存在一定的概率问题、消费频率和消费金额之间存在较强的正相关性等,因此本文提出了一种改进的RFM模型的电商用户价值分类方法。首先增加了对用户分析的指标,将用户在电商平台的所有交互次数,整合为用户活跃度的属性特征。然后对各个指标的数值进行分箱操作,把连续的指标数值离散化,并通过数据标准化减少取值偏差对距离计算产生的影响。接着利用层次分析法构造判断矩阵,计算出各个指标的权重值。最后采用适用于海量数据并行计算的K-Means||算法对用户进行聚类分析,并根据肘部法则和轮廓系数选出聚类模型效果最佳的K值。通过对比实验结果表明,该RFME模型与传统的RFM模型和一些改进的RFM模型相比轮廓系数更高,价值分类体系更加客观,具有更精确、更快速的用户分类效果。(2)基于Tent-SSA-CatBoost算法的用户流失预测方法研究:由于传统的机器学习算法存在着难以应对大规模训练样本、对输入数据表达形式敏感、难以处理不平衡数据等问题,因此本文提出了一种基于改进的Tent-SSA-CatBoost算法的用户流失预测模型。首先使用改进的Borderline-SMOTE算法处理数据集数据不平衡的问题,降低样本分布不平衡带来的影响。然后Tent混沌映射具有均匀的分布函数,考虑到麻雀搜索算法是随机生成初始种群,容易导致分布不均匀和陷入局部最优的问题,采用Tent混沌映射生成初始种群,提升种群多样性,增强算法的全局搜索能力。最后采用改进后的麻雀搜索算法对CatBoost进行超参数优化,保证收敛速度的同时还可以快速找到最优的超参数组合。在两个用户流失数据集进行测试之后,结果表明Tent-SSA-CatBoost算法比单一的XGBoost、Light GBM和CatBoost算法具有更高的预测准确率。(3)最后针对用户画像管理系统的需求,结合Hadoop+Hive分布式集群的数据仓库和Springboot+Vue等技术框架,开发了用户画像系统的系统管理、数据管理、消息管理、数据展示等模块,实现了各种功能的可视化展示,更直观的了解用户价值分类与流失预测的结果。
基于LPWAN的甘蔗园监控系统研究与设计
这是一篇关于甘蔗园监控,LoRa,NB-IoT,云平台,BP神经网络,麻雀搜索算法的论文, 主要内容为随着信息技术和物联网技术的发展,智慧农业逐渐成为未来农业发展的趋势之一。智慧农业依托物联网技术实现对农田等种植场地的实时监测,提高作物产量和质量,降低农业生产成本,为农业的可持续发展提供了有力支撑。甘蔗是我国重要的经济作物,对甘蔗种植区域的监测和管理显得十分重要。广西是中国最大的甘蔗种植区,甘蔗物联网监控系统在广西甘蔗生产中的应用备受关注,有利于甘蔗产业的发展。针对目前的甘蔗园监控系统存在传输距离受限、能耗高等缺点,本文对甘蔗种植园监控系统这一领域进行了深入研究,利用传感器技术、低功耗广域物联网(LPWAN)技术、云平台技术、光伏发电等技术,提出了一种基于LPWAN的甘蔗种植园监控系统。系统以太阳能为能源,通过光电转换技术将太阳能转化为电能,供给系统的各种设备和传感器使用。系统通过LoRa无线传输技术,将甘蔗园间传感器采集的数据上传至网关节点,网关节点收集数据后,利用MQTT协议将数据上传至云服务器,实现数据的存储和管理。云平台利用机器学习算法对采集到的数据进行处理和分析,以提供实时的环境监测数据和提高生产效率的建议,同时系统利用云平台提供的API接口,实现对数据的调用和推送。在监控系统架构方面,系统采用了基于SSM框架的开发模式,Tomcat作为容器,MySQL为数据库,实现了前端页面的展示和用户交互等功能,在灌溉控制方面,系统采用了改进后的麻雀搜索算法,构建了CGSSA-BP甘蔗需水量预测模型。为了提高灌溉控制精度,采取改进的麻雀搜索算法对模糊PID控制器的参数进行优化。在MATLAB仿真中,优化后的模型展现出了更好的效果。本文于广西扶绥县甘蔗园基地对系统进行了实验验证,测试结果表明该系统具有低功耗、可靠性高、成本低的优点,可以为甘蔗园的监测和灌溉控制提供有效的解决方案。该系统的设计和实现,具有一定的实践意义和应用价值。
基于超声信号多域分析及模型自优化的焊缝缺陷辅助识别方法研究
这是一篇关于焊缝缺陷,超声识别,多域多尺度分析,麻雀搜索算法,模型自优化的论文, 主要内容为焊接缺陷识别对于特种设备压力容器和压力管道等工业活动至关重要,是工业生产中的重要任务。奥氏体不锈钢材作为一种国家资源,对其焊缝进行缺陷识别更是焊接缺陷识别中的一项重要任务。因此,快速及时地构建奥氏体不锈钢焊缝缺陷是亟待解决的工程实践问题。目前的焊缝缺陷识别过程虽已达到了一定的机械化水平,但仍存在以下问题:1)现有的焊缝机械化识别方法对缺陷识别和缺陷性质的判定仍依靠专业领域人员分析缺陷严重程度并对缺陷进行定性,主观性较强,既耗时又费力,识别成本相对较高;2)针对焊缝缺陷识别开展的深度学习方法研究中存在着识别信号特征信息丰富度低、卷积网络特征提取不充分、判别性有限等问题以及深度网络架构人工专业领域依赖性强、网络冗余度高、缺乏自适应能力等难点。针对以上问题和难点,本文开展的主要研究如下:(1)基于超声时域信号的信息多空间域转化。将采集到的超声时域信号衍生至时频域、格拉姆角场域、马尔可夫转移场域等空间域中,通过多域的形式,给出更丰富的信号表征信息,将识别信号特征提取聚类问题转化为不同空间域的二维图像处理问题,更适应卷积神经网络对二维图像的处理。(2)基于轻量化多尺度深度可分离卷积模型构建。提出了多尺度深度可分离卷积,将深度卷积中单一卷积核替换为多尺度不同大小的卷积核,扩大卷积感受野,通过提取不同尺度下的焊缝缺陷信息,有效提升特征信息提取的丰富度。(3)基于麻雀搜索算法的识别模型自优化。将麻雀搜索算法应用于所构建的基于时频特征融合的焊缝缺陷识别模型和基于多域分析的深度多尺度轻量化识别模型,开展基于麻雀搜索算法的模型结构自压缩及多维度超参数单目标优化研究。以识别准确率为适应度函数,分别对支持向量机的核函数类型、核参数和惩罚因子,Mobile Net V3网络结构以及构建的LM-Mobile Net V3网络的多尺度卷积核大小、多尺度卷积核比例、学习率、优化器、网络每一层通道扩张数等多维超参数进行了自适应优化。基于上述研究内容,设计了不锈钢焊缝缺陷识别管理系统,实现了数据处理、数据查询和用户管理等功能,满足了焊缝缺陷识别实际应用的需求。本文的研究有助于提升焊缝缺陷识别自动化水平,对降低因焊接质量造成的经济损失,减少安全责任事故的发生具有极其重要的意义。
Spark平台下基于LightGBM的网络贷款风险预测研究
这是一篇关于网络贷款,风险预测,过采样方法,麻雀搜索算法,LightGBM的论文, 主要内容为网络贷款不仅能满足居民和企业的多样化贷款需求,还能促进社会经济的发展和金融的普惠性。然而,网络贷款存在的大量违约风险问题给贷款平台和借贷人带来了巨大的损失和困扰。随着用户贷款信息的海量增加,如何有效且快速地预测用户违约风险和评估用户信用等级,是当前网络贷款领域面临的一个重要而紧迫的问题。为了解决上述问题,本学位论文利用大数据技术和机器学习技术,构建Spark平台下基于Light GBM的网络贷款风险预测系统,为网络贷款平台提供一个高效、准确、稳定的用户风险评估和信用评分工具。论文的主要贡献和创新点如下:(1)针对网贷数据的标签不平衡特点,提出了一种改进的过采样算法。将样本密度的概念引入到Borderline SMOTE算法,改进了合成新样本的方法,利用K近邻算法筛选合成的少数类样本,进一步优化数据集。在Spark平台下设计了网贷数据的过采样方法,并使用基于混合溢出树的近似K近邻算法实现了过采样算法的并行化。(2)利用麻雀搜索算法优化LightGBM模型超参数,设计了适应度函数和离散策略。在Spark平台下,分析了Light GBM模型的三种并行方式,设计了集群上模型参数搜索的流程,并根据模型的违约预测结果建立了信用评分转换方法。(3)构建了网络贷款风险预测原型系统,该系统采用浏览器、服务器、分布式系统和分布式存储的四层结构,兼顾可维护性、安全性和稳定性,完成信息管理、风险预测、数据管理、模型管理、集群管理五大功能,并使用Flask服务器框架进行了实现。本学位论文通过多个实验验证了提出方法的有效性和创新性。实验结果表明,改进的过采样算法多数情况下在AUC值和KS统计量上具有优势;麻雀搜索算法优化的Light GBM模型在Lending Club数据集上预测性能高于随机森林等机器学习模型,AUC值达到0.935,KS统计量达到0.740;Spark平台能一定程度上加速算法,减少运行时间;信用评分转换方法符合网贷信用评分的要求,能够区分不同信用等级的用户。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设客栈 ,原文地址:https://bishedaima.com/lunwen/46187.html