基于知识图谱的麦类作物病虫害问答系统
这是一篇关于麦类作物病虫害,知识图谱,问答系统,BiLSTM-CRF,朴素贝叶斯的论文, 主要内容为我国的麦类作物具有播种面积广,产量高的特点,但由于容易受到病虫害的影响,导致大大降低了其品质和产量。一直以来,关于麦类作物病虫害的相关知识,只能在一些书籍文献或者一些比较零散的数据库中查询,没有一个快捷的查询方式。为了解决这个问题,实现麦类作物病虫害相关信息的快速和高效地获取,本研究对知识图谱进行充分研究和利用,将其与麦类作物病虫害领域的相关知识进行充分的整合,设计实现了一个基于知识图谱的麦类作物问答系统。本研究所构建的系统,能够进一步推动麦类作物产业向智能化发展。本研究的主要内容及成果如下:(1)依据自顶向下和自底向上相结合的思想,对麦类作物病虫害知识图谱的概念模式进行了构建。本研究借助Bi LSTM-CRF模型,实现对麦类作物病虫害知识图谱数据层的构建。(2)以知识图谱为基础,对麦类作物病虫害的问答方法进行了设计。本研究应用word2vec训练字向量来学习问句文本语义相关性,通过朴素贝叶斯为基础的分类算法,对用户的意图进行识别获取三元组,然后通过对Neo4j数据库的查询,得到问题相应的结果。(3)设计并实现了麦类作物病虫害的问答系统。将构建好的麦类作物病虫害知识图谱使用Neo4j进行数据存储,并以此为数据基础设计实现了麦类作物病虫害的问答系统。该系统可以对麦类作物病虫害进行在线问答、图谱可视化、图谱更新、以及知识查询等功能,促进了麦类作物产业的智能化发展。
基于深度学习的电力设备缺陷文本命名实体识别模型研究
这是一篇关于电力设备缺陷文本,深度学习,命名实体识别,BiLSTM-CRF,注意力机制的论文, 主要内容为电网智能信息化的不断建设使电力领域的数据呈爆发式增长,深入挖掘其中有价值的数据信息对电力行业市场经济、社会管理等发展有积极重要的意义。电力系统中集中存储管理了电网生产过程中的众多信息,其中电力设备缺陷文本中记录着大量的基本信息及生产过程信息,然而现场工作人员在记录过程中会出现重复表达、逻辑表述不清、口语化等现象,使现场运维、巡检人员不能准确、高效的结构化管理缺陷文本内容之间的逻辑关系。同时,电力设备在运行过程中,如果无法及时有效的判断设备的缺陷程度,会使发生危急缺陷的设备因无法及时处理而引发一系列的级联故障,影响电力生产效率。针对上述情况,本文从缺陷文本无法结构化管理和缺陷级别无法及时判断处理两个方面进行电力设备缺陷文本的命名实体识别研究。本文研究内容如下:(1)基于深度学习提出一种可选择词向量的BiLSTM-CRF电力缺陷文本命名实体识别模型。利用BiLSTM学习文本的全局语义特征;针对文本中的数字信息增加可选择的位置信息训练新的数字词向量,提升数字信息特征;利用CRF的转移特征,解决输出标签之间的顺序性问题。实验表明该模型可以从大量电力缺陷文本中识别出实体类别信息,从而将海量的电力缺陷文本进行结构化管理。(2)提出一种电力缺陷分析框架来及时响应不同级别的缺陷设备。基于该框架首先增加注意力机制和强化编码方式改进命名实体识别模型以提高实体识别准确度。再结合知识图谱技术,实现给定一定结构的电力缺陷文本描述,快速判断出缺陷程度的任务,以此达到一种端到端的电力设备缺陷程度分析效果。实验结果表明改进后的模型能有效提高缺陷文本中命名实体信息的识别准确度。(3)为了验证本文设计模型在实际电力工程场景应用中能否为电力领域带来社会和经济效益。本文基于电力缺陷分析框架考虑设计并实现一个界面友好的电力缺陷文本命名实体识别原型系统。通过这种界面交互的方式帮助现场工作人员更好的理解与利用电力领域中的命名实体信息。通过这项研究工作可以帮助现场人员结构化处理杂乱无序的文本数据,并从具有一定逻辑关系的缺陷文本记录中快速准确定位、理解并判断电力设备缺陷级别,帮助检修人员根据设备的不同缺陷级别给出合理的处理、防范决策。同时,本研究可以为后续电力领域的智能分析、智能辅助决策推荐等研究奠定基础。
基于BiLSTM-CRF模型的中文命名实体识别算法研究
这是一篇关于中文命名实体识别,新闻文本,BiLSTM-CRF,加权投票,软件实现的论文, 主要内容为近几年来,深度学习在计算机视觉、语音识别等领域取得了巨大成功,此外在自然语言处理(Natural Language Processing,NLP)领域也取得了不少进展。在对NLP领域中关键的基础任务—命名实体识别(Named Entity Recognition,NER)的研究中,深度学习也获得了不错的效果。在如今的信息科技时代,每天产生的海量文本信息出现在人们面前,NER作为一项能够从非结构化文本数据中识别出关键有效信息,比如人名、地名、组织机构名及其他专名等命名实体的任务恰恰满足了人们迅速抓取文本中重要信息的需求。NER是关系抽取、知识图谱、智能查询、问答系统、军事指挥决策、辅助推理等众多应用领域的重要基础工具,对NER的有效研究,会为众多领域的应用打好坚实的基础,有利于这些领域的后续研究开展。本文使用深度学习方法,以双向长短期记忆网络(Long-Short Term Memory,LSTM)模型为基准模型,构建一个双向长短期记忆网络-条件随机场(Bidirectional Long-Short Term Memory-Conditional Random Field,Bi LSTM-CRF)中文NER算法模型,以人名、地名、组织机构名和其他专名作为NER的识别目标,同时将本文提出的NER模型利用算法进行模型集成,最后将NER模型成功应用在实践中。本文的工作为以下三点。(1)爬取《人民日报》2020年2月份的新闻文本数据,对爬取的非结构化新闻文本进行分词、词性标注、去停用词和字标注后作为实验数据集。提出Bi LSTM-CRF中文命名实体识别模型,与基准模型Bi LSTM相比,CRF层可以加入一些特征约束来保证Bi LSTM层的预测结果有效。通过实验证明,新闻数据集在Bi LSTM-CRF模型上的F1值比基准模型提升7.03%,得到最佳识别结果,即NER效果最优。(2)提出基于加权投票的多模型融合方法(Multi-Model Fusion of Weighted Voting,MMFWV),设计权重投票算法计算基模型的权重值,结合多个NER方法的优点。本文加权投票的基模型分别为CRF,Bi LSTM,Bi LSTM-CRF,同时实验证明MMFWV方法比基于多数投票的多模型融合方法(Multi-Model Fusion of Majority Voting,MMFMV)的F1值提升6.25%,实体识别效果更佳。(3)为了使中文NER技术更贴近人们生活,同时为人们节省大量时间,为社会创造更多维的价值和应用,本文将前面提出的NER模型在软件中全部进行界面可视化展示。通过整体设计、代码编写、缜密测试搭建出中文NER软件。该软件采用浏览器和服务器结构(Browser/Server,B/S)架构,包括前端展示、后端实现和前后端交互,分为模型训练与测试、模型使用等模块。软件对用户输入的非结构化文本进行NER,选择NER模型中的任意一种进行实体识别,从而识别出待识别文本中的人名、地名、组织机构名和其他专名。
小家电众包设计文本知识建模与共享
这是一篇关于小家电,众包设计,BiLSTM-CRF,文本知识建模,知识共享的论文, 主要内容为随着互联网技术的飞速发展,以及知识经济时代的到来,传统封闭的创新模式难以满足企业激烈竞争的需求,企业正着力寻求新的创新模式。众包设计模式已被实践证明是获取外部群体知识资源达到创新目标的有效模式。企业采用众包设计模式能够有效补充内部创新资源,降低创新成本,增加创新成果。作为无形资源的知识正逐渐成为推动社会发展的着力点,知识的开放与共享已经成为人们的迫切需求。本文以小家电众包设计文本为研究对象,开展知识建模、知识识别和知识共享等研究,并开发小家电众包设计文本知识共享平台。首先,分析小家电众包设计相关内容,收集小家电众包设计相关文本并进行处理。结合小家电众包设计的特点,运用自然语言处理相关技术建立了小家电众包设计领域语料库。构建Bi LSTM-CRF算法模型并应用在小家电众包设计领域,有效提取了小家电众包设计领域相关实体。其次,提出一种基于元知识与依存关系模型的实体关系提取方法。将语句输入句法依存分析模型,构建候选三元组数据和实体链数据,以候选三元组数据经过种子模板泛化匹配抽取三元组,同时使用元知识模版处理实体链数据来补充三元组。基于实体-关系-实体三元组构建知识图谱并进行展示,使用图注意力神经网络对知识图谱补全,使知识图谱更完整。最后,对小家电众包设计文本知识共享平台进行了分析,设计和开发了小家电众包设计文本知识共享平台,该平台具有小家电众包设计文本实体识别功能、实体关系抽取功能和知识图谱展示功能等,能够帮助用户快速了解小家电设计相关文档知识内容,并开展了相关应用。
基于知识图谱的葡萄病虫害自动问答系统
这是一篇关于葡萄病虫害,问答系统,知识图谱,BiLSTM-CRF,CNN的论文, 主要内容为近年来,我国高度重视农业信息化发展。我国葡萄种植面积大、产量高。葡萄病虫害的发生将直接影响葡萄的产量和品质。葡萄病虫害知识以书籍文献形式存在,葡萄种植人员无法快速获取到葡萄病虫害知识。为解决以上问题,帮助葡萄种植从业者高效准确地获取到有价值的信息,本研究利用知识图谱组织葡萄病虫害领域知识,利用深度学习模型理解自然语言问句语义信息,设计实现基于知识图谱的葡萄病虫害自动问答系统。因目前我国葡萄产业知识服务尚不完善,本研究对促进葡萄产业智能化发展有重要意义。主要研究内容及成果如下:(1)葡萄病虫害知识图谱构建方法研究。针对葡萄病虫害领域缺乏开源知识图谱数据,根据自顶向下和自底向上相结合的思想,构建了葡萄病虫害知识图谱概念模式。即自顶向下梳理葡萄病虫害领域模式,自底向上补充模式概念。针对知识图谱人工构建代价大的问题,提出了基于Bi LSTM-CRF的葡萄病虫害知识图谱数据层构建方法。该方法基于BIOES标注策略,采用Bi LSTM网络模型自动提取文本信息,采用CRF模型约束标签在句子层面的合理性,完成葡萄病虫害实体识别,根据标签类别抽取葡萄病虫害三元组数据。针对知识图谱数据存储问题,采用Neo4j图数据库存储与展示葡萄病虫害知识图谱。通过实验调节模型参数,与传统的HMM、CRF实体识别模型进行对比,命名实体识别方法在F1值上分别提高了7.86%、7.82%,达到了84.69%,葡萄病虫害三元组数据抽取精确率为89.87%。(2)基于知识图谱的葡萄病虫害自动问答方法设计。针对传统问答方法因分词结果不准确造成问句语义出现偏差的问题,设计了基于深度学习的葡萄病虫害自动问答方法。针对问句短文本包含特征较少、表达形式多样及葡萄病虫害领域特殊性问题,采用word2vec模型对葡萄病虫害文本进行字符级别特征向量表示,采用CNN模型提取问句特征,完成问句意图理解;针对问句实体识别问题,采用Bi LSTM-CRF模型识别问句候选实体,采用余弦相似度计算完成问句实体识别。针对答案查询问题,采用Cypher语句查询知识图谱。实验表明,问句意图自动理解方法的F1值达到了99.92%,问句实体识别召回率为77.86%,答案查询精确率为64.58%。(3)基于知识图谱的葡萄病虫害自动问答系统设计与实现。设计实现了基于知识图谱的葡萄病虫害自动问答系统。系统以葡萄病虫害知识图谱为数据基础,以Django为开发框架,采用深度学习模型实现葡萄病虫害实体识别和知识问答功能,节省用户获取信息的时间,促进了葡萄产业智能化发展。
基于知识图谱的电影知识问答系统研究与实现
这是一篇关于问答系统,知识图谱,电影,朴素贝叶斯,BiLSTM-CRF的论文, 主要内容为随着互联网的发展,网络数据内容呈现爆炸式增长的态势。由于互联网内容的数据量大、信息类型多元、结构不统一的特点,给人们有效获取信息和知识提出了挑战。知识图谱(Knowledge Graph)以其强大的语义处理能力和开放组织能力,为互联网时代的知识化组织和智能应用奠定了基础。知识图谱作为近两年在大数据时代下新颖的知识组织与检索技术,其知识组织和展示的优势逐渐体现出来,受到众多行业的重视。知识图谱被用来表示现实世界中存在的实体和实体间的关系。随着人工智能的技术发展和应用,知识图谱已成为智能搜索、自动问答、个性化产品推荐等领域的关键技术之一。目前,我国电影行业发展迅速,观影需求持续扩大。但是用户主动了解电影信息的途径还是搜索引擎和专业的电影网站,对于想要快速知道电影相关信息或者根据条件个性化查找电影的用户不够友好,因此,本文构建了信息较全的电影领域知识图谱,并实现了基于模板匹配的电影知识自动问答系统。本文的具体研究工作如下:⑴利用浏览器开发工具抓包测试,找到豆瓣电影数据json网页链接,采用requests、bs4和正则表达式相结合的方法抓取豆瓣电影数据存入Mysql数据库。使用IP池和随机user-Agent规避网站的反爬虫限制并构建多线程网络爬虫工具提高爬虫效率。根据抓取的豆瓣电影数据设计电影知识图谱的实体、关系和属性,将抓取的数据处理之后导入图数据库Neo4j,构建了信息较全面的电影领域知识图谱。⑵设计电影知识查询模板并构建用户问句训练集,采用TF-IDF算法提取文本特征,训练朴素贝叶斯问句分类模型;爬取电影类新闻数据,标注电影名称命名实体语料数据集,在基于BiLSTM-CRF的命名实体识别模型中加入预训练的Word2Vec字向量语言模型,提高了命名实体识别模型的识别效果。⑶在最终的答案查询任务中针对用户输入问句可能存在错别字、命名实体识别可能存在识别错误的问题,采用基于双向最大匹配的模糊查询,并通过计算余弦相似度排序输出结果,提高了系统的实用性。最后实现了基于微型网站开发框架Flask的web系统展示平台。
基于BiLSTM-CRF模型的观赏植物命名实体识别研究
这是一篇关于观赏植物实体识别,CRF,BiLSTM,BiLSTM-CRF的论文, 主要内容为农作物植物文本记录中涵盖的命名实体包含着大量与观赏植物密切相关的文本信息,快速准确的识别出植物文本数据中观赏植物的特征命名实体,是推动农业智能化中知识图谱发展的重要条件。命名实体识别作为自然语言处理的一项重要子任务,是文本信息识别的关键。目前,在观赏植物领域,文本命名实体识别还属于空白,对观赏植物进行命名实体识别这项研究对后续的农业问答系统的建立、农业知识图谱的构建等研究有着推动意义。本文面向观赏植物文本,利用相关的命名实体识别技术,主要进行了如下研究工作:(1)对与本课题研究过程中相关的实体识别模型CRF、BiLSTM以及BiLSTM-CRF进行探究,分析将三种算法运用于观赏植物实体识别中的结果,对比了几种算法的优缺点;(2)构建观赏植物命名实体识别数据集,包括原始数据的采集、清洗、标签设定及标注工作等;(3)对于模型CRF、BiLSTM以及BiLSTM-CRF分别在所构建的观赏植物命名实体识别数据集中的精确率、召回率及F1值都进行了对比分析,得出了BiLSTM-CRF模型的表现最突出的结论,其中精确率达到了94.09%,召回率为94.18%,F1值为94.00%。;(4)构建了一个基于BiLSTM-CRF模型的观赏植物命名实体识别系统,并设置了相关的主要功能模块。
基于深度学习的电力设备缺陷文本命名实体识别模型研究
这是一篇关于电力设备缺陷文本,深度学习,命名实体识别,BiLSTM-CRF,注意力机制的论文, 主要内容为电网智能信息化的不断建设使电力领域的数据呈爆发式增长,深入挖掘其中有价值的数据信息对电力行业市场经济、社会管理等发展有积极重要的意义。电力系统中集中存储管理了电网生产过程中的众多信息,其中电力设备缺陷文本中记录着大量的基本信息及生产过程信息,然而现场工作人员在记录过程中会出现重复表达、逻辑表述不清、口语化等现象,使现场运维、巡检人员不能准确、高效的结构化管理缺陷文本内容之间的逻辑关系。同时,电力设备在运行过程中,如果无法及时有效的判断设备的缺陷程度,会使发生危急缺陷的设备因无法及时处理而引发一系列的级联故障,影响电力生产效率。针对上述情况,本文从缺陷文本无法结构化管理和缺陷级别无法及时判断处理两个方面进行电力设备缺陷文本的命名实体识别研究。本文研究内容如下:(1)基于深度学习提出一种可选择词向量的BiLSTM-CRF电力缺陷文本命名实体识别模型。利用BiLSTM学习文本的全局语义特征;针对文本中的数字信息增加可选择的位置信息训练新的数字词向量,提升数字信息特征;利用CRF的转移特征,解决输出标签之间的顺序性问题。实验表明该模型可以从大量电力缺陷文本中识别出实体类别信息,从而将海量的电力缺陷文本进行结构化管理。(2)提出一种电力缺陷分析框架来及时响应不同级别的缺陷设备。基于该框架首先增加注意力机制和强化编码方式改进命名实体识别模型以提高实体识别准确度。再结合知识图谱技术,实现给定一定结构的电力缺陷文本描述,快速判断出缺陷程度的任务,以此达到一种端到端的电力设备缺陷程度分析效果。实验结果表明改进后的模型能有效提高缺陷文本中命名实体信息的识别准确度。(3)为了验证本文设计模型在实际电力工程场景应用中能否为电力领域带来社会和经济效益。本文基于电力缺陷分析框架考虑设计并实现一个界面友好的电力缺陷文本命名实体识别原型系统。通过这种界面交互的方式帮助现场工作人员更好的理解与利用电力领域中的命名实体信息。通过这项研究工作可以帮助现场人员结构化处理杂乱无序的文本数据,并从具有一定逻辑关系的缺陷文本记录中快速准确定位、理解并判断电力设备缺陷级别,帮助检修人员根据设备的不同缺陷级别给出合理的处理、防范决策。同时,本研究可以为后续电力领域的智能分析、智能辅助决策推荐等研究奠定基础。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码向导 ,原文地址:https://bishedaima.com/lunwen/49200.html