面向校园领域的自动问答系统的研究与实现
这是一篇关于自动问答系统,数据库自然语言接口,知识图谱,知识库问答的论文, 主要内容为随着互联网数据的爆炸式增长,人们每天都能接触到海量的信息。但是通过搜索引擎搜索信息的方式是低效的。自动问答系统允许用户通过自然语言提问,直接向用户返回准确的答案。这样的信息获取方式相较于搜索引擎,更加贴近人类的生活习惯。自动问答系统根据知识领域的不同可以分为面向开放领域的自动问答系统和面向特定领域的自动问答系统。面向开放领域的自动问答系统是没有针对性的,已经有很多大型的公司和科研机构对其进行了研究。而面向特定领域的自动问答系统可以针对性地解答用户在该领域的问题,更加具有研究意义和实用性。为了更好地服务在校师生的学习生活,本文对面向校园领域的自动问答系统进行了研究。校园领域的知识多以表格或者文本形式存在,而之前的校园领域问答研究大多将研究重点放在了文本形式知识上,而忽略了对表格知识的研究利用。本研究除了对文本知识以外,还对表格知识进行研究。对于不同形式的校园知识,系统自动查询的方式不同,缺乏统一易用的查询方式。本研究的主要目标是构建校园领域知识库,并实现基于该知识库的自动问答系统。本文的研究内容主要分为以下三个部分。(1)数据库自然语言接口模型构建:校园领域知识中的表格数据适合存储在关系数据库中。为了实现对这部分知识的自然语言查询,本文提出了一个基于语法树的结合自注意力机制的数据库自然语言接口模型。实验表明,在校园领域关系数据库上,本文提出的模型是有效的。(2)基于知识库的问答处理方法:校园领域知识中的文本类数据可以通过构建知识图谱的方式进行整合。为了实现对这部分知识的自然语言查询,本文对知识库问答进行了研究。将知识库问答过程分为命名实体识别、属性映射和答案选择三个部分。研究并实现了基于BERT+Bi-LSTM+CRF的命名实体识别模型和基于Siamese+BERT+Bi-LSTM的属性映射模型。实验表明,在校园领域知识图谱上,本文提出的模型可以达到较高的准确率。(3)面向校园领域的自动问答系统设计与实现。基于以上研究构建了面向校园领域的自动问答系统,在网页上为用户提供服务。学校师生可以通过自然语言对系统进行提问,获得想要知道的信息。
住房公积金领域自动问答系统关键技术研究
这是一篇关于住房公积金,自动问答系统,知识图谱,问句类型识别,问句关键词提取的论文, 主要内容为目前,针对公积金领域知识咨询的需求与日俱增,但是国家在公积金领域知识自动问答系统的建设方面投入还比较少,当前的咨询服务还停留在发布公告、出版书籍以及社区问答阶段,远远没有达到智能化程度。因此,本文从实际需求出发,研究住房公积金领域自动问答系统的关键技术,并基于本文的研究成果实现这个系统,在解决实际需求的同时尝试提高用户体验。本文主要研究内容如下:首先通过对住房公积金领域知识语料进行分析,设计领域词库扩充算法,用于从语料中抽取领域基础词扩充领域词库;然后对领域实体和实体关系抽取方法进行研究,抽取公积金领域实体和实体关系,并依此构建公积金领域知识图谱;然后对问句解析技术进行深入研究,提出融合句法分析和SVM模型的领域问句类型识别算法,用于识别输入的问句所属的问句类型;然后提出基于领域知识图谱和依存句法分析的问句关键词提取算法,用于从问句中提取用户关心的重要信息;然后构造Cypher查询模板并结合问句类型识别和关键词提取的结果自动生成可执行的Cypher查询语句,用于在基于Neo4j的图形数据库中检索问句的答案;然后设计问句匹配算法,用于从问答对库中获取答案;最后基于以上研究编码实现一个住房公积金领域自动问答系统。最后对设计的算法和实现的系统进行性能评测,证明了本文所提出的方案在构建住房公积金领域自动问答系统上的可行性。
融合知识表示的自动问答系统关键技术研究
这是一篇关于自动问答系统,多样化知识表示,深度学习,答案检索,生成模型的论文, 主要内容为近年来随着人工智能和深度学习技术的发展,自动问答系统已经在诸多领域取得了广泛的应用。目前自动问答系统的实现主要有两种技术路线,一是采用检索的方法,包括传统的检索模型以及利用基于深度学习的相似度计算模型检索候选答案文档;二是答案自动生成的方法,该方法利用大量问答语料训练学习得到问题与答案之间的关联模式,自动生成答案序列。在自动问答系统构建过程中,无论是检索还是自动生成的方法都不可避免的面临知识匮乏的问题。首先,如果没有上下文或是相关的知识储备,很难理解问句的含义,这给答案的检索和生成都带来了挑战。另外,由于知识存在形式的多样性,使其在深度语义表示模型中的处理使用方式变得十分困难。针对这些问题,本文对以关键词为代表的特定领域的知识,互联网中广泛大量的相关问答对以及目前广泛研究的知识图谱这三种不同形态的知识信息在问答系统中的融合应用进行了深入广泛的研究,本文研究内容如下:1.为了缓解深度学习模型中对问句表示缺少知识的问题,本文提出了一个带有知识记忆单元的深度学习模型(KM-Bi LSTM),将关键词知识特征加入知识记忆单元,利用其中存储的知识增强问句的表示,使得问句的语义表示更加准确,提高问句与答案之间的相似度度量效果。本文通过在Trec QA和Wiki QA答案选取数据集上的实验验证了该模型在答案选取任务上的有效性。2.针对社区问答检索中单一问题语义表示不充分的问题,本文提出了一个融合外部候选问答对知识的深度语义模型(ECQ-Bi LSTM),来对问句语义表示进行更充分地建模。在该模型中,相关问答对中包含的知识信息将根据相关程度动态地加入到问句表示中。本文通过Trec Live QA竞赛以及Trec QA和Wiki QA上的实验探讨了外部知识信息的获取方法以及问句表示与外部知识信息的有效融合方法。3.为了解决事实类问答答案生成模型中缺少对目标答案生成控制的问题,本文提出了一个融合知识图谱三元组知识信息的答案自动生成模型(KV-Seq2seq)。该模型嵌入了一个key-value结构的三元组知识存储结构,在传统Seq2seq模型的基础上对中间编码状态和知识图谱信息进行了融合,丰富了问句的表示,同时使得答案序列的生成更加准确和富有多样性。综上所述,本文对知识表示在问答系统方向上的应用做了广泛而深入的研究,大量的实验结果表明融合知识表示的问答系统能够更好地提高答案检索和生成的效果,更加准确智能地回答用户的问题。
危化品安全知识自动问答系统应用技术研究
这是一篇关于化工领域,自动问答系统,命名实体识别,相似度匹配的论文, 主要内容为近些年,化工产业作为我国经济支柱型产业,其技术水平和生产能力均取得了大幅度的提升,对于危险化学品的安全监管也变得尤为重要。传统的危化品安全管理方法往往依赖于从大量的规范、手册等途径获取安全技术知识,这种方法效率低下且易出现语义理解偏差。此外,由于危化品种类繁多,相关技术覆盖面广,传统的知识获取方式很难满足人们的需求。基于上述问题,本文提出一种基于知识图谱的危化品安全知识自动问答系统。主要研究工作如下:(1)实体识别:本文提出基于改进图注意力网络的命名实体识别方法。该方法融合多种特征交互逻辑,提出一种整体关系交互图的构建方法,并结合图注意力网络,实现了多特征的自适应嵌入,充分利用了图结构空间建模的优势,提升了多特征交互效率。此外,模型还使用一种具备方向感知的TENER编码器建模文本深层次特征信息,提升了方向位置敏感型特征的捕获能力,进一步确保了模型在限定领域实体识别任务中的性能表现。(2)意图识别:本文提出基于多头自注意力机制Siamese网络的意图识别方法。该方法使用一种共享权重参数的Siamese网络结构将文本序列投射到同一向量空间中进行相似度匹配,不仅实现深层次抽象语义信息的捕获,参数量和计算量的减少也使得模型更加轻量化。此外,本文还在其基础上引入了多头自注意力机制,使用自注意力机制自适应的调整字符语义权重,突出语义关联特征,进而通过多头自注意力计算学习不同类型的信息,从多个角度强化文本内在依赖联系,强化语义交互信息。(3)问答系统开发:基于上述研究和模型分析结论,本文结合专业领域知识图谱和问句解析模型,设计并搭建了一套可实现人机实时交互的基于知识图谱的危化品安全知识自动问答系统。本文构建的危化品安全知识自动问答系统可在一定程度上解决当前危化品安全技术知识查询手段短缺问题,更好的满足公众的知识获取需求,对保障人民生命财产安全、增强公众安全防范意识,强化危化品生产制造过程的标准化、规范化水平有着十分重要的意义。
基于甲状腺知识图谱的自动问答系统设计与实现
这是一篇关于甲状腺疾病,知识图谱,自动问答系统,SPARQL查询的论文, 主要内容为随着人们生活水平的提高,甲状腺疾病的发生已经并不罕见,而国内甲状腺医疗资源分布不均,造成了大型医院人满为患、医生接诊病人多、病人看病时间长等问题。随着“互联网+”技术以及智慧医疗的迅速发展,甲状腺患者会寻求在线医疗咨询平台如寻医问药网、好大夫在线网等进行甲状腺疾病咨询。但这类平台需要医生在线,通过人工答诊的方式为患者提供咨询服务,导致这类在线咨询平台缺乏自动智能化问诊与答诊的途径,无法为大量的患者提供及时的疾病咨询服务。如何为甲状腺患者提供自动化的在线问答服务,已成为智慧医疗领域广泛关注的课题。甲状腺患者在就诊过程中会产生大量的甲状腺电子病历数据,这些数据为甲状腺诊疗自动问答系统的实现提供了数据来源。为此,本文在上海某三甲医院甲状腺电子病历的基础上,构建了甲状腺知识图谱,并基于甲状腺知识图谱,利用自然语言处理结合知识图谱查询技术,设计并实现一个面向甲状腺诊疗的自动问答系统。本文的研究内容主要包括:1)设计了基于甲状腺知识图谱的自动问答系统总体架构:阐述了系统的总体架构,将整个系统分为甲状腺知识图谱构建子系统和甲状腺诊疗自动问答子系统。甲状腺知识图谱构建子系统负责构建甲状腺诊疗自动问答系统进行查询的知识库,甲状腺诊疗自动问答子系统负责对用户输入的自然语言问句转化为知识图谱查询语句,而后得到问句的答案。根据子系统的各功能以及相互关系设计了整个系统的架构图,并对两个子系统分别进行了概述。2)设计了甲状腺知识图谱构建子系统:首先对甲状腺电子病历数据特点进行了分析,从中提取甲状腺相关术语,通过归纳同类术语,获得甲状腺知识图谱的相关概念,据此设计了甲状腺知识图谱概念模式结构。然后,分析概念模式结构,定义了概念之间的关系,完成甲状腺知识图谱概念模式的设计。随后,从数据库中提取甲状腺相关数据作为实体集,根据设计的概念模式进行实体填充操作。最后将实体以及实体关系以三元组<实体-关系-属性>构成甲状腺知识图谱。3)设计了基于甲状腺知识图谱的自动问答处理流程:甲状腺诊疗自动问答子系统主要由问句预处理模块和答案生成模块组成。在问句预处理模块中,首先利用中文分词算法将用户输入的问句进行分词操作,通过关键词获得问句的类别。其次,针对甲状腺咨询问句语料采用LSTM+CRF算法生成识别模型,利用该模型从问句中获得甲状腺实体。而后,利用LTP-parser工具对问句进行依存句法分析,得到句子中各结构的主客关系,形成问句的三元组形式。最后,将问句三元组中的实体映射到知识图谱的实体上,避免对不存在于知识图谱中的实体进行查询,获得查询的三元组。在答案生成模块中,根据问句类别,将问句预处理模块得到的查询三元组与SPARQL查询模板进行匹配,把自然语言的问题转化为知识图谱查询语言,通过在知识图谱内进行查询,得到问句的答案,再对问句的答案进行针对性的处理,最终反馈给用户。4)实现了基于甲状腺知识图谱的自动问答系统方案:首先对甲状腺知识图谱的构建细节以及构建成果进行展示。其次对自动问答系统中问句预处理模块和答案生成模块的实现过程以及系统成果进行展示。测试结果证明本文的自动问答系统具有较好的可用性。
基于物联网的垃圾分类回收系统的设计与实现
这是一篇关于物联网,垃圾分类回收,奖励机制,自动问答系统,文本分类,卷积神经网络的论文, 主要内容为随着我国经济快速发展以及城市化水平加快,我国城市垃圾产量逐年递增,垃圾围城现象愈发严重。垃圾分类回收是实现垃圾减量化、资源化、无害化的重要途径。目前,我国主要通过在公共场所设置垃圾分类桶进行垃圾分类回收。然而现有的垃圾分类回收设备信息化、智能化水平低下,并且人们对垃圾分类认识度、参与度不高,致使我国的垃圾分类实行至今仍然没有取得良好的效果。针对以上问题,本文基于物联网技术,设计并实现了一个基于物联网的垃圾分类回收系统。该系统由五个部分组成,分别为回收机控制系统、Android大屏系统、用户微信小程序、回收员微信小程序、后台管理系统。回收机控制系统用于回收机的监控以及数据采集,涉及回收机投口和箱门的开闭控制,垃圾重量、容量、温度等传感数据的采集;Android大屏系统用于人机交互以及相关信息展示,主要提供了回收机工作参数设置、垃圾投递业务、垃圾回收业务、广告宣传等功能;用户微信小程序服务于用户,主要提供了附近回收机查找、扫码投递、垃圾投递记录查询、环保金展示等功能;回收员微信小程序服务于回收员,主要提供了扫码回收、回收机状态查询、回收记录查询等功能;后台管理系统主要提供了人员管理、设备管理、数据分析等功能。通过该系统的运作,实现对垃圾分类设备的智能化监控以及相关数据采集,提高了现有垃圾分类回收设备的信息化以及智能化程度,同时本系统引入了垃圾投递奖励机制,进一步提高了用户参与垃圾分类的积极性。同时,针对目前上海市实行的四分类垃圾分类标准存在垃圾所属类别辨别困难的问题,本文对自动问答系统在垃圾分类回收系统中的应用展开研究,提出了基于卷积神经网络(Convolutional Neural Networks,CNN)自动问答系统。通过此问答系统实现对垃圾所属类别问题的回答,进而指导人们正确地分类投递垃圾。本文首先介绍本课题的研究背景和意义以及国内外垃圾分类回收现状;其次简要介绍了系统开发中所涉及到的技术,包括物联网技术、Android技术、微信小程序技术、Spring Boot框架技术、Nginx和Tomcat技术、My SQL数据库技术、Redis数据库技术;然后对垃圾分类回收系统的业务流程、功能性和非功能性需求进行了深入的需求分析;根据系统需求分析,完成了系统总体设计,包括系统架构设计、系统功能设计、数据库设计以及通讯接口设计;根据系统的总体设计,给出了系统各部分主要功能实现过程,包括回收机控制系统软硬件实现、Android大屏系统实现、用户微信小程序实现、回收员微信小程序实现以及后台管理系统实现。最后,通过功能测试和压力测试验证了系统的可用性与稳定性。此外,在基于卷积神经网络的自动问系统应用研究上,我们给出了相关背景及方法介绍、自动问答系统构建过程,并且对所提出的模型进行了实验。为了验证CNN模型的有效性,本文将CNN模型和传统机器学习模型进行了文本分类对比实验,最终结果表明采用CNN模型构建的自动问答系统准确率到达88.6%,高于传统机器学习模型问答准确率,从而验证了所提出方法的有效性。
面向校园领域的自动问答系统的研究与实现
这是一篇关于自动问答系统,数据库自然语言接口,知识图谱,知识库问答的论文, 主要内容为随着互联网数据的爆炸式增长,人们每天都能接触到海量的信息。但是通过搜索引擎搜索信息的方式是低效的。自动问答系统允许用户通过自然语言提问,直接向用户返回准确的答案。这样的信息获取方式相较于搜索引擎,更加贴近人类的生活习惯。自动问答系统根据知识领域的不同可以分为面向开放领域的自动问答系统和面向特定领域的自动问答系统。面向开放领域的自动问答系统是没有针对性的,已经有很多大型的公司和科研机构对其进行了研究。而面向特定领域的自动问答系统可以针对性地解答用户在该领域的问题,更加具有研究意义和实用性。为了更好地服务在校师生的学习生活,本文对面向校园领域的自动问答系统进行了研究。校园领域的知识多以表格或者文本形式存在,而之前的校园领域问答研究大多将研究重点放在了文本形式知识上,而忽略了对表格知识的研究利用。本研究除了对文本知识以外,还对表格知识进行研究。对于不同形式的校园知识,系统自动查询的方式不同,缺乏统一易用的查询方式。本研究的主要目标是构建校园领域知识库,并实现基于该知识库的自动问答系统。本文的研究内容主要分为以下三个部分。(1)数据库自然语言接口模型构建:校园领域知识中的表格数据适合存储在关系数据库中。为了实现对这部分知识的自然语言查询,本文提出了一个基于语法树的结合自注意力机制的数据库自然语言接口模型。实验表明,在校园领域关系数据库上,本文提出的模型是有效的。(2)基于知识库的问答处理方法:校园领域知识中的文本类数据可以通过构建知识图谱的方式进行整合。为了实现对这部分知识的自然语言查询,本文对知识库问答进行了研究。将知识库问答过程分为命名实体识别、属性映射和答案选择三个部分。研究并实现了基于BERT+Bi-LSTM+CRF的命名实体识别模型和基于Siamese+BERT+Bi-LSTM的属性映射模型。实验表明,在校园领域知识图谱上,本文提出的模型可以达到较高的准确率。(3)面向校园领域的自动问答系统设计与实现。基于以上研究构建了面向校园领域的自动问答系统,在网页上为用户提供服务。学校师生可以通过自然语言对系统进行提问,获得想要知道的信息。
危化品安全知识自动问答系统应用技术研究
这是一篇关于化工领域,自动问答系统,命名实体识别,相似度匹配的论文, 主要内容为近些年,化工产业作为我国经济支柱型产业,其技术水平和生产能力均取得了大幅度的提升,对于危险化学品的安全监管也变得尤为重要。传统的危化品安全管理方法往往依赖于从大量的规范、手册等途径获取安全技术知识,这种方法效率低下且易出现语义理解偏差。此外,由于危化品种类繁多,相关技术覆盖面广,传统的知识获取方式很难满足人们的需求。基于上述问题,本文提出一种基于知识图谱的危化品安全知识自动问答系统。主要研究工作如下:(1)实体识别:本文提出基于改进图注意力网络的命名实体识别方法。该方法融合多种特征交互逻辑,提出一种整体关系交互图的构建方法,并结合图注意力网络,实现了多特征的自适应嵌入,充分利用了图结构空间建模的优势,提升了多特征交互效率。此外,模型还使用一种具备方向感知的TENER编码器建模文本深层次特征信息,提升了方向位置敏感型特征的捕获能力,进一步确保了模型在限定领域实体识别任务中的性能表现。(2)意图识别:本文提出基于多头自注意力机制Siamese网络的意图识别方法。该方法使用一种共享权重参数的Siamese网络结构将文本序列投射到同一向量空间中进行相似度匹配,不仅实现深层次抽象语义信息的捕获,参数量和计算量的减少也使得模型更加轻量化。此外,本文还在其基础上引入了多头自注意力机制,使用自注意力机制自适应的调整字符语义权重,突出语义关联特征,进而通过多头自注意力计算学习不同类型的信息,从多个角度强化文本内在依赖联系,强化语义交互信息。(3)问答系统开发:基于上述研究和模型分析结论,本文结合专业领域知识图谱和问句解析模型,设计并搭建了一套可实现人机实时交互的基于知识图谱的危化品安全知识自动问答系统。本文构建的危化品安全知识自动问答系统可在一定程度上解决当前危化品安全技术知识查询手段短缺问题,更好的满足公众的知识获取需求,对保障人民生命财产安全、增强公众安全防范意识,强化危化品生产制造过程的标准化、规范化水平有着十分重要的意义。
基于物联网的垃圾分类回收系统的设计与实现
这是一篇关于物联网,垃圾分类回收,奖励机制,自动问答系统,文本分类,卷积神经网络的论文, 主要内容为随着我国经济快速发展以及城市化水平加快,我国城市垃圾产量逐年递增,垃圾围城现象愈发严重。垃圾分类回收是实现垃圾减量化、资源化、无害化的重要途径。目前,我国主要通过在公共场所设置垃圾分类桶进行垃圾分类回收。然而现有的垃圾分类回收设备信息化、智能化水平低下,并且人们对垃圾分类认识度、参与度不高,致使我国的垃圾分类实行至今仍然没有取得良好的效果。针对以上问题,本文基于物联网技术,设计并实现了一个基于物联网的垃圾分类回收系统。该系统由五个部分组成,分别为回收机控制系统、Android大屏系统、用户微信小程序、回收员微信小程序、后台管理系统。回收机控制系统用于回收机的监控以及数据采集,涉及回收机投口和箱门的开闭控制,垃圾重量、容量、温度等传感数据的采集;Android大屏系统用于人机交互以及相关信息展示,主要提供了回收机工作参数设置、垃圾投递业务、垃圾回收业务、广告宣传等功能;用户微信小程序服务于用户,主要提供了附近回收机查找、扫码投递、垃圾投递记录查询、环保金展示等功能;回收员微信小程序服务于回收员,主要提供了扫码回收、回收机状态查询、回收记录查询等功能;后台管理系统主要提供了人员管理、设备管理、数据分析等功能。通过该系统的运作,实现对垃圾分类设备的智能化监控以及相关数据采集,提高了现有垃圾分类回收设备的信息化以及智能化程度,同时本系统引入了垃圾投递奖励机制,进一步提高了用户参与垃圾分类的积极性。同时,针对目前上海市实行的四分类垃圾分类标准存在垃圾所属类别辨别困难的问题,本文对自动问答系统在垃圾分类回收系统中的应用展开研究,提出了基于卷积神经网络(Convolutional Neural Networks,CNN)自动问答系统。通过此问答系统实现对垃圾所属类别问题的回答,进而指导人们正确地分类投递垃圾。本文首先介绍本课题的研究背景和意义以及国内外垃圾分类回收现状;其次简要介绍了系统开发中所涉及到的技术,包括物联网技术、Android技术、微信小程序技术、Spring Boot框架技术、Nginx和Tomcat技术、My SQL数据库技术、Redis数据库技术;然后对垃圾分类回收系统的业务流程、功能性和非功能性需求进行了深入的需求分析;根据系统需求分析,完成了系统总体设计,包括系统架构设计、系统功能设计、数据库设计以及通讯接口设计;根据系统的总体设计,给出了系统各部分主要功能实现过程,包括回收机控制系统软硬件实现、Android大屏系统实现、用户微信小程序实现、回收员微信小程序实现以及后台管理系统实现。最后,通过功能测试和压力测试验证了系统的可用性与稳定性。此外,在基于卷积神经网络的自动问系统应用研究上,我们给出了相关背景及方法介绍、自动问答系统构建过程,并且对所提出的模型进行了实验。为了验证CNN模型的有效性,本文将CNN模型和传统机器学习模型进行了文本分类对比实验,最终结果表明采用CNN模型构建的自动问答系统准确率到达88.6%,高于传统机器学习模型问答准确率,从而验证了所提出方法的有效性。
面向高速铁路道岔故障维修领域的知识图谱研究与应用
这是一篇关于高速铁路道岔,故障文本数据,深度学习,知识图谱,自动问答系统的论文, 主要内容为高速铁路道岔作为高速列车运营过程中的关键地面信号设备,在高速列车实际运行的过程中,其一旦发生故障会对高速铁路运行的效率和安全产生极大影响。因此,高速铁路道岔的故障维修需要充分发挥技术优势,依托大数据研究高速铁路道岔故障维修方法,辅助高速铁路道岔维护人员进行故障维修,以提高维修效率。高速铁路多年来的运营积累,产生了大量以自然语言方式记录的高速铁路道岔故障文本数据。但当前针对道岔故障维修领域非结构化文本数据的研究,未能充分挖掘出数据中蕴含着丰富的故障知识,仅仅是根据故障诊断结果进行粗略定位,并不能表示出道岔故障时各要素之间的复杂联系。为解决上述问题,本文将知识图谱技术应用至道岔故障维修领域,以高速铁路道岔故障文本数据集为基础,通过知识图谱技术挖掘出道岔故障各要素之间的内部联系,提高维修效率。论文的主要研究内容如下:(1)构建高速铁路道岔故障实体识别语料库。在命名实体识别的初期,需要具有标注好的数据集,但当前高速道岔故障维修领域并没有公开的标注好的数据集,因此本文首要任务就是构建高速铁路道岔故障语料库。首先定义了8种故障实体类型,后续采用“精灵标注助手”软件对高速道岔故障数据集进行文本序列标注,最后将数据处理成实体识别模型允许输入的BIO格式,从而实现高速铁路道岔故障实体识别语料库的构建。(2)建立高速铁路道岔故障维修领域实体识别模型。利用构建完成的高速铁路道岔故障语料库作为实验数据集,建立BERT-Bi LSTM-CRF命名实体识别模型,模型首先通过基于Transformer的预训练语言模型(Bi-directional Encoder Representations from Transformers,BERT)获取上下文语义信息的高质量词向量表示,其次将BERT获取到的词向量输入至双向长短时记忆神经网络(Bi-direction Long Short Term Memory,Bi LSTM),从而学习上下文语义特征,并为各类标签打分,最后将得分标签序列通过条件随机场(Conditional Random Field,CRF)模型增加约束,输出最优标签序列。通过实验分析,本文建立的实体识别模型的精确率、召回率、F1值分别达到93.41%、92.93%和93.17%。并且通过对比实验显示,本文模型在以上三种指标上均优于其他实体识别模型。(3)提出基于规则的高铁道岔故障实体关系抽取方法。为提升领域知识图谱的质量,采用基于规则的关系抽取方法,在道岔维修领域专家的指导下,根据故障数据集的特点制定关系抽取的规则模板,最后再请领域内的不同专家按照制定的规则利用置信度打分的方式进行实体间的关系判断。该方法虽然是人工进行关系抽取,但是抽取规则以及关系判断均由领域专家指导,抽取的关系正确性高,能显著提高知识图谱知识质量。(4)构建高速铁路道岔故障维修领域知识图谱。构建的领域知识图谱分为命名实体识别、关系抽取、知识融合和知识存储四个步骤,在知识融合部分,运用了知识融合的关键技术——实体对齐,利用基于文本相似度与语义相似度算法分别实现了结构相似的同义故障实体与结构相似但语义不同的故障实体的对齐。根据实体识别、关系抽取以及知识融合得到三元组数据结果,构建高速铁路道岔故障维修领域知识图谱,利用Neo4j图数据库实现知识储存和图谱可视化呈现。最后设计基于高速铁路道岔故障维修领域知识图谱的自动问答系统。该系统基于Fast API的web框架下开发,实现了问题解析功能、查询语句生成功能、数据库连接功能、答案转化功能、界面显示功能。用户可以使用此系统完成故障类型的识别、找到故障间的内在联系和隐含知识、提供维修措施的建议。系统有效的辅助了工作人员对高铁道岔故障的维护,推动现场工作更加高效地运转。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码向导 ,原文地址:https://bishedaima.com/lunwen/52832.html