基于深度学习的混合协同过滤算法
这是一篇关于推荐系统,长短期记忆网络,增量算法,概率矩阵分解的论文, 主要内容为随着互联网的应用与信息技术的普及,整个社会进入了数据爆炸,信息冗余的时代。海量非结构化信息过载,使得用户经常需要消耗大量的时间和精力来找出他们所需要的东西。推荐系统是解决这一问题不可或缺的重要工具。现如今,主流的推荐系统主要有三类:一是基于内容的推荐,二是协同过滤推荐,三是混合推荐。基于内容的推荐能准确学习到用户特征,解释性强,却面临分析内容有限,过度特殊化及冷启动问题;协同过滤不需要太多对应数据领域的专业知识,但其仍然不能有效避免用户冷启动、数据稀疏性等问题;混合推荐系统是基于多种不同的推荐技术,进行整合,实现其优势互补,来获得更好的效果。本文主要工作如下:1)针对推荐系统冷启动问题和传统推荐算法寻优速率过慢的问题,提出一种带增量的矩阵分解模型。该模型在矩阵分解算法的基础上,融入了用户和项目的偏执因子,并且在迭代计算过程中,使用带增量的批量学习算法加速训练过程。基于数据集Movie Lens-100k和Movie Lens-1M的实验表明,相较于传统的矩阵分解算法,带增量的矩阵分解模型的均方根误差(Root Mean Square Error,RMSE)比矩阵分解算法降低约0.3%-0.7%,训练效率上提升约18%-21%;2)针对推荐系统冷启动和稀疏性问题,提出一种融合长短期记忆网络和概率矩阵分解的推荐模型,深度概率矩阵分解模型。该模型基于概率矩阵分解结构分解用户-项目评分矩阵,获取用户特征;并利用长短期记忆网络强大的学习能力,深度挖掘项目辅助信息,获取项目特征;最后将二者有机结合,有效提升了算法的性能。实验表明,该模型相较于其它基于深度学习的推荐模型,均方根误差有效降低了2%-4%;3)将带增量的矩阵分解模型和深度概率矩阵分解模型进行融合,提出带增量的深度概率矩阵分解模型。该模型基于二者优势互补,利用前者提升算法的学习效率,利用后者提升算法的学习能力,拟合能力和抗干扰能力。实验证明带增量的深度协同过滤模型的RMSE相较于其他算法降低了约1%-7%,训练效率提升了约15%-25%。
基于网购商品评价的情感分析系统设计与实现
这是一篇关于文本情感分析,BERT模型,长短期记忆网络,深度学习,LDA主题模型的论文, 主要内容为文本情感分析是自然语言处理(Natural Language Processing,NLP)最重要的研究内容之一,吸引了众多学者的关注。早期研究多采用构造文本词典以及贝叶斯等传统学习算法,工作量大、准确率低,近来有文献采用卷积神经网络CNN(Convolutional Neural Networks)等深度学习算法来解决文本情感分析的准确性和速度问题。本文研究基于网购商品评价的情感分析问题,采用BERT(Bidirectional Encoder Representation from Transformers)与LSTM(Long Short-Term Memory)建立文本情感分类模型,结合LDA(Latent Dirichlet Allocation)技术对评价内容提取主题,从而进一步挖掘文本中隐含的信息。本论文分析国内外文本分类的研究现状,依托著名平台京东电商中的手机文本评价数据进行算法模型研究,结合项目实际进行系统需求分析与设计,实现了基于网购商品评价的情感分析系统,本文的主要研究内容及工作创新如下:(1)理论技术研究。本文结合文本分类、LDA主题模型等技术的国内外研究现状,对近年来文献中出现的长短期记忆网络LSTM、BERT预训练语言模型等深度学习理论和用于主题提取的LDA模型进行研究,最后讨论目前主流的前端框架。(2)数据获取与预处理。课题研究的数据是通过数据采集器对京东电商平台中的手机文本评价进行抓取,并对获取到的数据进行预处理,删除多余列和重复数据。(3)文本情感分类模型构建。文本情感分类模型采用两种方式构建,一种是基于BERT的文本情感分类模型,另外一种是基于BERT与LSTM结合的文本情感分类模型。论文分别对两种情感分类模型进行实验,结果表明,两种方式在情感分类的准确率方面基本持平,但是基于BERT与LSTM结合的文本情感分类模型具有更快的运行速度,因此,选择BERT与LSTM结合的模型来实现本系统文本情感分类功能。(4)主题模型构建。通过jieba组件对分类后的评价内容进行中文分词,结合哈工大停用词表过滤停用词,最后运用LDA主题提取技术挖掘出评价文本中的关键主题。(5)系统设计与实现。结合项目需求分析,设计功能模块和My SQL数据库以及相关数据库表,采用主流前端框架Vue.js和Python语言实现基于网购商品评价的情感分析系统,并进行系统功能测试以满足用户需求,具有良好的交互性和实用性。
在线学习路径推荐算法研究
这是一篇关于在线学习,长短期记忆网络,学习路径推荐,聚类的论文, 主要内容为“互联网+教育”正不断变革在线教育的教学模式,个性化学习被认为是未来教育的一种重要学习方式。但由于互联网中各种学习资源同质化与优质资源的供给不足并存的现象,导致学习者在学习过程中面临着选择什么样的资源进行学习以获得最佳效果等问题,有必要研究适合不同学习者自我调节的适应性学习策略,以根据学习者的学习特征与偏好推荐合适的学习资源,进而满足学习者的个性化学习需求,这些已成为当前在线学习领域研究的热点问题。论文以大规模在线学习环境为背景,构建学习路径模型和学习者模型,并利用长短期记忆网络(LSTM)构建一种新颖学习路径推荐方法,为学生在线个性化学习提供导航,以帮助其提高学习效率。主要工作主要包括两个方面:提出了基于聚类的学习路径生成算法(Clustering-based learning path generation algorithm)。该方法基于学习者的基本特征计算学习者之间的相似度,将相似度较高的学习者划分到同一个聚类簇中,然后在同一个簇里寻找与目标用户相似的学习者的学习路径,根据聚类结果生成目标用户的推荐学习路径。该方法通过对学习者和学习路径进行初始推荐,可进一步为LSTM训练提供输入。提出了基于长短期记忆网络的学习路径推荐改进算法(Learning path recommendation based on Long Short-Term Memory Network)。该方法通过训练一个扩展的长短期记忆网络模型,将最近的学习路径推荐给学习者并利用该模型预测学习者的学习效果,根据预测结果选择合适的学习路径推荐给学习者。实验结果表明,所提出的模型与其他传统推荐模型相比较具有更好的适配性和准确性。
轨道交通电气设备监测系统的设计与实现
这是一篇关于轨道交通,电气设备监测,边缘计算,长短期记忆网络的论文, 主要内容为随着轨道交通规模的不断扩大,牵引变电所的数量也不断增加,而在电力网络中,电力设备使用的零部件会有材料老化和质量缺陷等多种问题,导致故障产生。在轨道交通的供电中安全要求更高,一旦出现电力故障,将对人们的出行和轨道交通产生巨大影响。本文从电气设备安全的角度,设计构建了一个基于边缘计算的电气设备监测系统,通过边缘计算技术、物联网技术和通信技术等,提升了牵引变电所对电气设备的监管能力。本系统将实现电气设备运行参数的采集、电气设备状态在线监测、故障预测等功能,同时可对电气设备信息、传感设备信息、预警记录、维保记录等数据进行信息化管理。本文的主要工作如下:(1)首先,论文对当前电气设备监测的发展情况和新技术的应用进行了分析。在此基础上,介绍了本系统开发用到的相关技术与框架。通过用例图、用例表对用户的具体功能需求进行分析。(2)论文根据需求对系统进行整体架构设计,设计内容包含系统物理架构、技术架构、功能模块组成和数据库设计等。(3)论文最后对系统的详细设计与实现进行了阐述,在该部分,对每个功能模块的业务流程进行设计,绘制流程图。通过设计类图、时序图,编写代码实现系统各模块功能。并且对系统进行了功能测试和非功能测试。本系统的开发采用的是B/S架构,使用Java语言进行编程,Web框架采用的是Spring Boot框架,前端使用Layui框架,数据存储选用Mongo DB作为数据库。数据采集模块使用Edge XFoundry框架,故障预测模块使用长短期记忆(Long Short-Term Memory,LSTM)网络。本系统已经完成相关功能的开发,经过功能测试、性能测试,系统功能实现良好,成功上线并投入使用。
基于深度学习的作物病虫害知识图谱问答系统的研究与应用
这是一篇关于作物病虫害,知识图谱,关系抽取,相似度计算模型,长短期记忆网络的论文, 主要内容为作物生产对我国具有重要的意义,在实际生产环境中,病虫害问题对于作物产量和质量的影响很大。因此,建立作物病虫害知识库,分析影响作物生产的因素,对作物生产质量的提高,具有研究意义。知识图谱技术是一种能够以更接近人类认知世界形式表达信息的方式,可以更好的对作物病虫害领域信息进行表达,帮助我们理解、组织和查询相关信息。构建一个具有知识问答功能的作物病虫害知识图谱系统,分析农作物种植过程中农户遇到的病虫害问题,直接返回对应的答案,将很大程度上简化农民获取信息的复杂性,可为农民的作物生产提供重要的指导作用。本文研究了知识图谱关系抽取的方法,提出了基于注意力机制的Bi-LSTM作物病虫害关系抽取模型,促进了最终作物病虫害知识图谱的构建。问答系统的研究中,相似度计算问题是很重要的部分,它为系统理解用户提问起到关键作用,其准确率直接决定了系统的可靠性。本文引入了词向量和LSTM网络,该方法以词向量作为输入,构建句子相似度模型,并将该模型应用到知识图谱系统的知识问答模块中。本文从作物病虫害知识库构建与数据处理、关系抽取模型构建及实验分析、句子相似度模型构建及实验分析、领域知识图谱系统构建和功能实现三个方面展开研究和讨论,具体内容如下:(1)作物病虫害知识库构建与数据处理。主要基于Scrapy设计网络爬虫,本文采用的作物病虫害数据爬取自“国家农业科学数据共享中心”等专业农事网站。对获取的作物病虫害源数据进行预处理,对其中的数据实体进行人工分类、标注。最终生成作物病虫害数据集、标注的问答集及实体识别筛选出的实体集,其中所有问句划分为了 637类,关系种类预设为5类,最终获得关系总数13182条。(2)关系抽取模型构建及实验分析。为解决传统关系抽取方法的时间复杂性和低效率的问题,提出了基于注意力机制的Bi-LSTM作物病虫害关系抽取模型,包括输入层、嵌入层、网络层和分类层。注意力机制能够帮助模型关注文本中的重要部分,用以增加有效样本的权重。将CNN、RNN、LSTM、BI-LSTM等与本文提出的关系抽取模型进行了对比实验,本文模型综合F1值达到77.60%,相对于其他几种模型,平均提高了近7个百分点。(3)句子相似度模型构建及实验分析。构建了一个基于LSTM的句子相似度模型,包括输入层、嵌入层、LSTM层、全连接层和输出层。首先采集了大量作物病虫害的相关语料,在通用语料和病虫害语料结合的基础上训练了词向量。然后用得到的词向量模型对训练数据向量化后作为输入,训练句子相似度模型。通过调参以得到最好的相似度模型计算结果。对照两种基线方法进行了实验对比,最后从相似度计算值和准确率两个方面分析了结果。结果表明,本文中使用的基于词向量和LSTM的相似度计算方法优于其他两种基线方法,证明本文的研究模型在句子相似度计算上有更好的表现。(4)作物病虫害知识图谱系统功能实现。基于以上研究开发了面向农民及农业推广人员的病虫害知识图谱系统。系统使用Django框架进行了开发,使用Neo4j图数据库对作物病虫害领域的三元组关系进行了存储;在知识问答模块建立了问答库,使用MongoDB存储了三万余条领域问答对。实现的作物病虫害知识图谱系统具有实体识别、实体关系查询、知识概览、知识问答四个功能。最后针对本系统的知识问答模块,与两种领域内的问答系统做了对比实验,证明了该模块功能的实用性。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码工厂 ,原文地址:https://bishedaima.com/lunwen/46633.html