基于意图识别的法院客服问答系统研究与实现
这是一篇关于智能客服,问句理解,意图识别,深度学习的论文, 主要内容为随着传统搜索引擎的弊端不断显露,问答系统的发展越来越受到人们的重视,发展迅速。目前,作为问答系统的一种,智能客服系统也发展迅速、应用广泛。在电商、金融、医疗和家电等诸多领域,智能客服机器人基本代替人工客服,实时高效地为用户服务,成果斐然。生活在法制的社会,大众和法院有着紧密的联系,法院客服扮演着十分重要的角色。人工客服已无法满足大众的需求,急需用智能客服的方式来替代。在法院智能客服系统中,问句匹配的精度直接影响系统的准确性。高精度的问句匹配需要用深度学习技术学习大量的语料库,语料库不足时,很难实现高精度的问句匹配。为保证系统的准确性,问题理解技术必须成为强力支柱。识别问句中包含的用户意图,按意图去知识库中检索、匹配最相似的问句是本文的核心思想。用户意图识别包含两部分:一是识别用户问句类型,二是识别问句中具体意图。当问句集的范围比较集中,问句之间有着较高的词语重复度,大大地增加了问句相似度的计算难度。为解决这个问题,本文提出先识别出问句类型,然后只在同类型的问句间计算相似度,以此来减小衡量问句相似度的难度。本文提出基于多特征融合挖掘的问句类型分类模型,使用词向量、词性等特征,用带有注意力机制的双向长短时记忆网络进行分类学习。利用人工整理的法院客服的数据进行测试,实验结果表明分类算法较其它算法有不错的提升,同时也明显提升了问答系统的准确性。对意图不同的问句来说,计算其相似度没有意义,直接判定为不相识。因此,识别出用户问句的具体意图会进一步降低问句相似度的计算难度。本文采用多标签分类的方法来识别问句中的多种意图,提出了基于共现矩阵的多标签分类模型,充分了利用类别之间的关系,实验结果表明该算法较其它算法有提高,同样提升了问答系统的准确性。论文最后完成了基于意图识别的法院客服问答系统的设计与实现。构建出一套完整的客服问答系统,可以准确地回答用户问题。
基于RoBERTa的智能医疗问答系统研究与实现
这是一篇关于RoBERTa,问答系统,实体识别,意图识别,知识图谱的论文, 主要内容为在互联网技术高速发展的背景下,大部分人习惯于使用搜索引擎来查询医疗信息。但是互联网上的信息通常杂乱无章而且质量参差不齐,需要人工耗费大量时间精力去筛选其中有用的信息,而一些在线问诊平台虽然有专业医生进行解答,但是通常时效性较差。因此,本文基于医疗领域数据构建了智能医疗问答系统,为用户提供准确、高效、优质的医疗问答服务。本文的工作主要包含以下三个部分:(1)本文将问句语义解析模块划分为实体识别和意图识别两个子模块。在实体识别子模块中本文提出了Ro BERTa-Bi GRU-Attention-CRF模型,使用Ro BERTa预训练模型生成输入问句的词向量表示,采用Bi GRU模型提取上下文语义信息,接下来通过多头自注意力层进一步提取文本特征获取不同词语的权重关系,从而弥补Ro BERTa模型没有进行微调的问题,最后利用CRF模型对实体标签进行约束纠正。该模型在CMe EE数据集和Med ER数据集的F1值分别为69.51%和89.16%,效果明显优于其他实体识别模型。在意图识别子模块中本文使用Ro BERTa-DPCNN模型,通过引入Ro BERTa预训练模型对文本数据进行嵌入,采用DPCNN模型对文本特征进行卷积和池化操作并对用户意图进行分类。该模型在Med IR数据集下的F1值为86.42%,效果相比其他意图识别模型更加优秀。(2)本文实现了基于知识图谱的答案检索方法。使用爬虫技术从医疗信息网站获取相关数据并对其进行预处理,使用Json文件完成数据持久化。根据定义的Schema完成医疗知识图谱的构建,并采用Neo4j进行存储,其中包含约3万个实体、21万条关系。根据实体识别模型和意图识别模型获得医疗实体信息和用户意图,使用实体链指和槽位填充技术生成Cypher语句去知识图谱中获取答案,最后将答案数据展示给用户。(3)本文实现了智能医疗Web系统。使用软件工程方法对系统进行需求分析、概要设计和详细设计。系统主要基于Django框架实现了对算法模型的集成整合,使用Vue技术完成前端界面可视化,并对系统进行了功能测试以及性能测试从而验证系统的可用性和实用性,其中系统问答准确率达到88%。从而证明本系统可以提供高效的医疗问答服务。
基于知识图谱的智能医疗问答及导诊系统的研究
这是一篇关于知识图谱,问答系统,导诊系统,意图识别,命名实体识别的论文, 主要内容为随着互联网技术的快速发展和人民生活水平的提高,人们对于从网络上获取健康和医疗的知识和服务的需求愈发强烈。同时,国家也出台了构建智慧医疗比如远程医疗、在线问诊等相关服务的政策。但是目前医疗领域缺乏开源的、精准式的问诊系统,用户对于在线医疗的需求较难得到满足。此外,医疗领域普遍缺乏构建问诊系统的中文标注语料,因此基于深度学习模型的系统难以构建起来。本文针对目前存在的问题,以中文医疗知识图谱为知识基础,构建了基于云平台的通用智能医疗问答和导诊系统,可应用于医疗服务机器人、移动端小程序等场景。主要的研究工作包括:构建了中文医疗知识图谱,并且针对多源知识图谱难以同时使用的问题,提出了多库融合的方法,设计了基于实体及其关系的加权相似度计算的实体对齐算法,实现了多源知识图谱较高准确率的知识融合。对构建医疗问答系统进行了研究,重点研究了意图识别和命名实体识别模型算法。首先对于意图识别来说,针对语境混淆的难题,提出了闲聊与医疗意图的粗分类和医疗意图细分类的分层分类模型,设计了GBDT-LR混合模型的粗分类算法和BERT-Text CNN与规则融合的细分类算法,提高了可扩展性,实现了医疗意图分类的准确率从82%提升到了84%。此外,针对医疗意图训练语料缺乏的问题,提出了基于语句陈述逻辑和模板化整定的样本扩增方法,设计了数据集自动生成算法,实现了5000多条有效数据的生成。其次对于命名实体识别来说,针对缺乏领域知识而命名实体识别的准确率低的问题,提出了注入分词特征的语义模型,设计了Word Cut-BERT-Bi LSTM-CRF命名实体识别算法,实现了医疗实体识别的准确率从79%提升到了87%。对构建医疗导诊系统进行了研究。针对超高维度医疗疾病语义空间的降维问题,提出了多轮对话的导诊方式,设计了基于贝叶斯的数据处理算法和树形循环决策算法,提高了症状收集的准确性,从而实现了较高准确率的科室推荐。提出了基于云平台的智能医疗问答和导诊系统软件平台。在云平台方面,搭建了具有云计算、云存储等功能的云服务平台。在软件开发方面,基于分层思想提出了由交互层、决策层、应用服务层、算法层和基础服务层组成的五层模型,拥有模块化、易扩展、低耦合的特性。最终该系统可向用户提供医疗知识问答、科室导诊、健康评估、健康信息管理等功能。
面向政务领域的智能问答研究与应用
这是一篇关于政务服务,智能问答,知识图谱,要素识别,意图识别,机器阅读理解的论文, 主要内容为随着大数据、人工智能等技术的快速普及和政府数字化建设的全面提速,越来越多的政务服务从传统的线下办理转变为线上办理,实现了数据多跑路,群众少跑腿。然而,随着线上办事事项的增多,政务服务网站的后台留言量也急剧增加。为缓解后台人工压力,各省份的政务服务网站相继开通了政务问答服务。现有的政务问答服务主要通过传统的关键词匹配技术和构建常见问题库来实现。其中,关键词匹配技术从数据库中通过关键词匹配出相应条目作为答案,问题覆盖范围广,但不能提供细粒度的答案;构建常见问题库能够为用户的常见问题提供细粒度的答案,但其问题覆盖范围有限。针对以上问题,本文通过研究基于领域知识图谱与深度学习的智能问答技术,提出了基于政务知识图谱的智能问答方法和基于机器阅读理解的政务问答方法,既确保了问题的覆盖范围,又能获取到细粒度的答案,提升了政务问答的效果和智能化水平。为了将以上两种智能问答方法应用于政务领域中,本文做了以下研究工作:(1)基于政务知识图谱的智能问答方法。政务服务平台中办事事项数据为半结构化数据,本文通过定义政务本体结构,可直接将其转换为结构化的知识图谱数据,由于无需实体识别和关系抽取步骤,减少了错误积累,保证了图谱的质量。之后本文基于政务知识图谱提出了检索排序式的知识图谱问答方法,主要分为实体提及词识别和问句意图识别两部分。实体提及词识别需要将实体提及词精准地识别出来,以便更好地链接到知识库中的相关实体,本文设计了Mac BERT-Bi LSTM-CRF模型实现了实体提及词的识别。意图识别问题需要识别出问句的意图确定最终答案,为了更好地区分意图之间的差异,本文使用基于预训练模型和孪生网络的Sentence-BERT模型进行问句意图识别。(2)基于机器阅读理解的政务智能问答方法。政府部门发布的采购公告和招标公告为非结构化数据,针对该类数据,本文设计了一种基于Chinese BERTBi LSTM模型的机器阅读理解方法实现政务问答。另外,政府不同部门的采购公告和招标公告存在着差异化,一部分部门发布的采购公告和招标公告行文不规范,对该部分数据进行了数据清洗。同时,针对人工标注数据较少的问题,使用一种结合自训练的数据增强方法扩充了数据。(3)政务智能问答系统设计与实现。本文对政务问答的需求进行深入分析,结合基于政务知识图谱的智能问答方法和基于机器阅读理解的政务问答方法构建政务领域的问答系统。在实现过程中,对系统的功能性和非功能性进行了全面测试。测试结果表明,所开发的系统能够有效地满足设计要求。通过在政务问答系统中引入智能问答技术,促进了政务问答领域的智能化发展,对实现公共服务高效化具有重要意义。
基于意图识别的客服机器人框架设计与关键技术研究
这是一篇关于问答系统,关键词自动抽取,意图识别,语义相似度计算的论文, 主要内容为聊天机器人是自然语言处理领域的一个重要研究方向,旨在让用户能用自然语言的方式与机器进行沟通。基于常见问答对的问答系统,是聊天机器人的一种重要实现方法,通过比较用户的问题与问答对中问题的相似程度,快速地返回一个准确而简洁的答案,其中全面而准确的问答对是问答系统的基础,也是发展瓶颈。在客服领域,大量且真实的人工客服数据为问答系统的使用提供非常合适的应用场景,而且准确且高效的问答系统也为企业节约了客服成本,提高了客服效率。本文以母婴行业的电商客服为背景,主要做了以下几方面的工作:首先,本文针对传统基于常见问答对的问答系统(Frequently Asked Questions,FAQ)框架的不足,在传统FAQ框架的基础,加入意图识别模块,设计了一个新的客服机器人框架。然后,本文针对客服机器人框架中的三个关键技术,关键词自动抽取,意图识别和语义相似度计算,结合本文的实际应用场景,进行了深入的研究。设计了多种关键词特征,利用XGBOOST(eXtreme Gradient Boosting)算法构建了一个关键词自动抽取模型;设计了一个意图分类模板和多种意图识别特征,利用Softmax算法建立一个多分类模型进行意图识别;设计了多种语义相似度特征,基于XGBOOST算法构造语义相似度计算模型。最后,对本文所建立的三种模型进行了实验和评估。本文提出的关键词自动抽取方法相比传统的无监督方法和有监督方法准确率都有大幅提高;意图识别的平均准确率为78.4%;在不同相似性阈值的情况下,基于关键词自动抽取模型的语义相似度计算模型相比基于TF-IDF(Term Frequency–Inverse Document Frequency)的语义相似度计算模型准确率都有提高。将这三种模型用于本文提出的客服机器人框架和传统的FAQ框架,实验结果证明,本文提出的框架比传统的FAQ框架准确率更高。
基于知识图谱的危化品智能问答系统研究
这是一篇关于知识图谱,问答系统,意图识别,槽位填充,危险化学品的论文, 主要内容为危险化学品在工业生产和科学研究中具有重要作用,促进了我国的经济发展和技术创新,同时危险化学品爆炸或泄露等带来的安全事故也对人民的生命财产安全带来了巨大的威胁。问答系统可以快速地回答相关行业用户提出的问题,从而帮助用户快速获取所需的信息,从而减少处理危险化学品事故所需要的时间,降低事故的影响。而知识图谱是一种描述实体、概念、事件及它们之间关系的结构化知识表示形式,可以帮助问答系统将问题中提到的实体链接到知识图谱中的实体,从而更准确地回答问题。意图识别(Intent Recognition)和槽位填充(Intent Recognition)是问答系统中的两个重要任务,意图识别要求识别用户在交互中表达的意图或目的。槽位填充要求在识别用户意图的基础上,从用户的语句中提取相关信息,填充到预定义的槽位中。虽然目前随着深度学习技术的发展对于意图识别和槽位填充任务已经取得了较好的效果,但是只有少部分的相关学者对两个任务进行联合建模,且联合建模的模型忽略了前者任务预测错误对于后者任务的影响。因此基于上述问题,本文提出了融合意图识别和槽位填充模型联合模型,在已经建立的危险化学品知识图谱的基础上,设计出完整的危险化学品问答系统。本文主要研究内容如下:(1)本文构建了危险化学品知识图谱,首先从国家官方数据库中获取危险化学品数据,从而对得到的结构化、半结构化、非结构化的数据进行数据清洗以及格式化,从中抽取出相应的实体、关系和属性。对于其他渠道获取的数据,采用知识合并将其融合到原始知识库中,最终将知识存储到图数据库中,建立起知识图谱为后面问答系统的答案检索提供数据的支撑。(2)本文构建了融合意图识别和槽位填充模型联合模型,在共享编码器的基础上,将句级别的意图识别优化为字级别的意图识别,将意图识别和槽位填充任务的神经网络优化为双向的LSTM,从而优化两个任务的性能,通过对比实验、消融实验在实验数据集上取得了较好的效果,最后通过引入预训练模型再一次证明了本文模型的有效性。(3)本文在以构建的知识图谱的基础上,设计出与之匹配的问答系统架构,完成危险化学品问答系统的搭建,并对问答系统的用户提问、历史提问、知识图谱可视化的界面进行展示。
基于知识图谱的医疗领域多轮问答研究
这是一篇关于问答系统,多轮问答,知识图谱,命名实体识别,意图识别的论文, 主要内容为随着对问答系统(Question-Answering,QA)的深入研究,简单的单轮问答已经相对成熟,但是在多轮问答方面的研究还较少。在现实的运用场景中,由于中文日常交流中语句结构的不严谨等问题,例如会经常性地直接省略主语,导致单轮问答在使用过程中效果不佳。因此,为了使得问答系统更加贴近用户的使用习惯,更精准地满足用户需求,进行多轮问答的研究是十分必要的。目前的多轮问答研究的多集中于日常对话,将其移植到医疗领域则表现不佳。因为医疗领域存在的专业术语系统无法识别,并且医疗领域的多轮对话研究存在诸多难题。例如相关的医疗领域数据集较少,医疗领域数据存在专业术语,嵌套实体等问题,因此主流的模型在医疗领域的数据集上效果不佳。本文结合知识图谱与多轮交互技术,实现了基于知识图谱的医疗领域多轮问答。本文的研究内容如下:(1)针对医疗领域的专业术语以及嵌套实体难以识别的问题,本文探索在主流命名实体识别模型中加入医疗专业术语形成的外部特征向量。提出了外部特征向量+BERT-Bi LSTM-CRF的方法,通过网络爬虫获取医疗数据并形成词典,然后将医疗专业术语转化为向量,嵌入到预训练语言模型中。实验结果表明,引入外部特征向量能够有效地增强模型在医疗领域的命名实体识别效果。(2)针对医疗领域问答相关数据集较少,训练样本不足等问题,研究外部数据增强的方法以及处理小样本数据的模型。本文提出Sim BERT数据增强结合BERTText CNN进行医疗领域意图识别。通过Sim BERT模型将数据集中小样本部分的数据进行增量处理,然后使用BERT-Text CNN对增强后的数据集进行训练。实验结果表明,数据增强后的医疗领域意图识别效果更佳。(3)分析研究知识抽取的方法,设计医疗领域知识图谱的Schema结构,并将抽出的实体关系按照设计的结构转化成三元组形式。基于Neo4j图数据库的构建医疗领域的知识图谱。基于已构建的知识图谱,研究多轮问答系统,最终实现基于知识图谱的医疗领域多轮问答系统。
自然语言理解模型训练系统的设计与实现
这是一篇关于对话系统,自然语言理解,意图识别,槽位填充的论文, 主要内容为随着人工智能技术的发展,对话系统的应用越来越广泛。任务型对话系统作为对话系统的一个重要分支,可以完成许多基本任务,为企业节省人力成本。自然语言理解(NLU)是任务型对话系统必不可少的核心模块,包括意图识别和槽位填充两个关键子任务,通常基于神经网络模型实现。鉴于任务型对话系统广泛的应用价值以及自然语言理解在任务型对话系统中的不可或缺性,提出了一个自然语言理解模型训练系统,以提高自然语言理解模型的开发效率。系统基于B/S结构,供单个NLU开发者使用。每个开发者将系统部署到自己的开发主机上,即可通过可视化的操作进行NLU模型的训练。首先经过需求分析,明确了系统所应具备的功能,并进行系统的总体设计。然后将系统划分为领域设置、数据资源管理、模型训练和模型部署测试四个主要模块,并进行了各模块的详细设计,包括UML类图设计和功能流程图设计等。系统服务端使用Python语言,基于Flask框架和Tensorflow框架实现,前端页面基于Vue.js框架实现。系统内置了多种模型供开发者选择,并提供基于规则和词典的数据增强功能,还引入了拼音特征以缓解语音交互下可能存在的语音识别问题。系统将模型训练流程模块化,通过Web页面屏蔽了具体的代码实现,使不同代码风格的NLU开发者之间的工作交接更加方便,并大大提高了开发者的模型开发效率。
面向态势感知的意图研究与推荐系统设计
这是一篇关于态势感知,信息过载,意图识别,推荐系统,知识图谱,图神经网络的论文, 主要内容为随着计算机技术的飞速发展,复杂信息系统人机交互界面的设计受到各方的高度关注,界面设计的优劣直接关系到操作人员的决策效能。态势感知环境中,人机交互界面中往往包含多维度信息。然而,当前复杂信息系统在设计时往往未能充分结合人因学理论,操作人员极易发生漏情、错情、信息过载等情况。同时,当前态势感知环境中信息的获取能力与共享速度得到了极大提升,短时间内界面中呈现的过量态势信息会严重干扰用户对关键信息的检索和有效利用,加大了用户出现认知过载情况的风险。本研究以战场态势环境为例,针对用户与系统交互时存在的认知过载问题,设计出了具备高准确性、多样性与完备性的态势推荐模型,并总结出了相应的设计策略,使用户在面对海量的态势数据时,能够聚焦于高价值态势信息,缩短认知和决策时间,降低认知负荷。同时,研究中设计的态势智能推荐系统能够根据用户历史交互记录以及态势信息之间的内在关联,从而能够得到传统方法难以获取的用户“隐性意图”,并能够通过智能推送的方式提升人机交互过程中的自然性。论文主要研究内容与创新点如下:1.针对“意图识别”问题,进行了态势感知需求研究,将战场态势感知环境中的指挥员意图定义为显性意图与隐性意图。通过设计了一套基于态势知识图谱的推荐系统,实现了对指挥员上述两种意图的识别与挖掘;2.以战场态势推荐为例,确定了504个战场态势要素与要素间实体关系,并以此设计出战场指挥员历史交互数据与态势知识图谱,完成了对指挥员的意图识别与态势推荐任务。同时,根据推荐系统常用评估算法与实际态势推荐环境,确定了态势相关性、态势完备性与态势多样性作为模型的评价指标从而对模型的优劣进行评估并以此展开对模型的优化实验。3.利用图神经网络善于捕获图结构数据中节点关系的优势,更好的完成态势推荐任务。研究中分别基于Pin Sage、GCMC、NGCF三种经典的图神经网络推荐模型完成了推荐系统设计,同时使用了两种不同的知识图谱增强推荐方法,使得系统具备更强的推荐多样性、准确性与可解释性。4.通过实验对图神经网络推荐模型的结构进行实验研究,针对实验中遇到的过平滑问题、小样本问题进行了优化,据此提出了包含模型设计与推荐流程设计的态势推荐设计策略。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕业设计货栈 ,原文地址:https://bishedaima.com/lunwen/47881.html