基于知识图谱的电商领域智能问答系统研究与实现
这是一篇关于知识图谱,智能问答,命名实体识别,关系抽取,深度学习的论文, 主要内容为随着互联网的快速发展,线上购物成为人们的主要消费形式之一,同时电商平台为了更好地服务于网购用户和商家,开发了智能客服问答系统。随着电商平台商品的种类和网购用户数量的快速增长,网购用户和电商商家从海量的商品评论信息中获取真实、有效的商品评价信息越来越困难。而现有智能客服问答系统又不能满足网购用户和电商商家的这样的个性化需求,因此构建面向电商领域的智能问答系统就很有必要。智能问答系统涉及命名实体识别、关系抽取、知识库构建和数据库检索等众多技术。在对电商的细粒度商品评价中,实体的抽取及其方面评价是一个难题。针对上述需求,本文以电商商品评论数据为基础,搭建基于知识图谱的智能问答系统。主要研究工作如下:(1)针对没有公开的电商领域商品评论实体识别数据集的现状,本文采用Scrapy爬虫框架抓取京东平台的笔记本电脑评论数据,对数据进行处理后,使用BIO标记策略进行人工标记,构建了电商领域商品评论实体识别数据集。(2)在电商商品评论实体识别方面,设计了基于BERT-Bi GRU-MHAT-CRF模型的命名实体识别方法并通过实验验证了其有效性。该方法首先将笔记本电脑评论数据通过BERT进行向量化后并作为Bi GRU的输入;然后,通过Bi GRU网络自动学习笔记本电脑评论数据中文本特征,并利用多头注意力机制进行特征强化;最后,使用CRF进行标签预测,识别出笔记本电脑评论数据中的实体类。(3)在实体关系抽取方面,采用基于词典和规则的方法进行实体关系抽取。首先,根据电商商品评论数据识别出来的实体和现有评价词词典,构建针对笔记本电脑评论方面的评价对象和评价词词典;然后,结合词典构建评价对象-评价词关系的按规则抽取得实体关系对,并对每对关系标记情感值;最后,统计评价属性的评价词占比,得到实体和实体关系数据。(4)在知识库搭建方面,采用Neo4j图数据库进行知识存储。首先整理抽取的笔记本电脑商品的评论知识,然后,使用Neo4j对笔记本电脑商品的评论知识进行存储,完成知识图谱的搭建,并作为问答系统的知识库。(5)设计了基于电商领域商品评论知识图谱的智能问答系统,该系统由问句意图识别模块和答案反馈模块组成。问句意图识别模块利用基于BERT-Bi GRU-MHATCRF模型的实体识别和实体链接方法对问题进行意图识别。答案反馈模块以图数据库查询语言的形式对问句意图进行表示,并在知识图谱中检索,获得碎片化的答案信息,将其整理后把答案回馈给提问用户。最后结合以上所有技术实现了问答系统,经过实验测试,所开发的系统达到了预期目标。
面向半结构化和非结构化文本的知识图谱自动构建与应用
这是一篇关于实体识别,关系抽取,词汇增强,Prompt-tuning,智能问答的论文, 主要内容为近年来,政府和企业越来越注重对数据进行理解、分析和总结,但是由于数据规模庞大、类型繁杂、整理及维护成本高等问题,大部分数据的显性知识和共性问题不能被充分挖掘和分析,办公人员难以全面高效的工作。构建知识图谱可以达到对大规模数据挖掘和管理需求。基于半结构化和非结构化文本的三元组自动抽取是构建知识图谱核心,其中包含两个子任务:命名实体识别,关系抽取。本文工作主要包括以下三个方面:(1)对于中文实体识别任务,本文提出基于置信度估计的动态词汇增强模型(Dynamic lexicon enhance model for confidence estimation,DLECE)。首先使用知识增强预训练语言模型用于解决中文分词错误、一词多义和文本语义表征不足等问题。然后针对字符序列标注模型存在词法语义丢失问题,设计了词汇增强层,利用中文词库无损引入词汇内部语义信息。同时,采用注意力机制动态去除词汇增强集噪声。最后,本文提出全局和局部两种标签置信度估计方法,解决模型在错标和漏标数据集训练效果差的问题。在两份中文数据集实验表明,DLECE不仅在原始数据集的F1值达到了92.04%/86.03%,而且在带噪数据集上的F1值达到了89.22%/81.38%,均优于其他对比模型。(2)对于中文关系抽取任务,本文提出基于Prompt的多粒度知识增强关系抽取模型(Prompt-based ERNIE-Gram for relation extraction,Prompt-ERNIE-Gram)。首先使用多粒度知识增强模型解决字符和N-Gram语义表征不足等问题。然后为了解决Prompt-tuning范式无法直接迁移关系抽取任务问题,构建推理模板库进行模型输入输出适配。同时,利用中文近义词库解决模型在通用域泛化性差的问题。最后,提出使用词汇表达器用于将模型预测结果映射至标签集合中,不仅有效提升模型召回率,还去除了近义词库噪声。在两份中文数据集实验表明,Prompt-ERNIE-Gram取得了最好结果,F1值分别是96.76%和96.32%。(3)本文搭建了基于知识图谱的生活服务智能问答系统。首先,使用本文提出的DLECE和Prompt-ERNIE-Gram从八千万条半结构化与非结构化文本中自动抽取出三元组。然后,与开源生活服务知识图谱进行融合,构建出包含三千五百万节点的大规模中文生活服务知识图谱。同时,将图谱储存至Neo4j图数据库后利用Graph XR进行展示。最后基于知识图谱搭建了生活服务智能问答系统,能够回答各类实际生活场景中的复杂问题。
基于智能问答的医疗随访系统设计与实现
这是一篇关于微信小程序,医疗随访,智能问答,预约挂号,软件设计的论文, 主要内容为依据当前医疗需求,本文基于移动互联网技术和微信小程序平台,完成了“基于智能问答的医疗随访系统设计与实现”的总体设计,主要满足了用户管理需求、用户挂号需求、用户医疗信息服务需求和用户随访需求等。由于小程序的显著性优势,结合web前端技术,设计并实现web端和小程序端的医疗随访系统。论文主要完成了以下工作:(1)介绍了我国在政策、市场等层面对“互联网+医疗”的需求,以及现有技术的支持,引出了“基于智能问答的医疗随访系统设计与实现”的研究背景和研究意义。(2)设计了系统开发的技术路线和运行环境。设计了数据库的格式规范,采用My SQL数据库,实现数据的合理储存和快速提取,采用SSM框架在小程序的基础上进行前端的开发,在网页和小程序端都能够提供服务。(3)系统设计了功能模块,包括:网络预约挂号、医疗信息服务、检验报告查询、医疗随访和用户管理,用户管理设计了三种权限模式分别为患者、医生和管理员,他们的权限是逐级递增的。系统实现了信息可视化,系统功能全面,使用方便。(4)详细说明了系统的设计与实现过程,并对医疗随访小程序进行了测试,初步完善了系统各项功能,对小程序的测试结果进行了总结,为系统改进提供依据。
基于知识图谱的玉米种植管理系统研发
这是一篇关于玉米,知识图谱,智能问答,种植管理模型,数字化系统的论文, 主要内容为玉米是我国重要的粮食作物之一,在粮食作物中占据着举足轻重的地位。目前,德州市陵城区仅有核心示范区能实现玉米高产,当地农民的玉米种植产量距离“吨半粮”目标还有不小的差距。德州“吨半粮”的创建具有提高粮食产量、促进农民增收等多重意义,对于德州乃至全国的粮食生产具有重要的推动作用。针对陵城区玉米种植存在多依赖经验判断、信息化普及水平低、缺乏规范性管理等实际问题,如何通过信息化、数字化技术将传统的经验转化为数字标准化的服务决策模式,提高玉米种植管理水平,是当前德州“吨半粮”玉米产业发展中亟待解决的课题。本研究以德州市陵城区“吨半粮”试验田的夏玉米为研究对象,进行玉米种植管理数字化研究,主要内容如下:(1)玉米种植知识图谱构建针对玉米种植知识领域开源知识图谱数据匮乏问题,采取自顶向下的方式构建玉米种植知识图谱。设计BERT-Bi LSTM-CRF模型完成玉米种植知识命名实体识别,通过基于规则的方法进行关系抽取以获取三元组。在知识存储方面,将获取到的数据存储于Neo4j图数据库中。通过实验调节模型参数,BERT-Bi LSTM-CRF模型在命名实体识别任务上相比LSTM、LSTM-CRF、Bi LSTM-CRF三类模型,F1值分别提高了14.31%、7.36%、3.86%。(2)玉米种植智能问答方法研究针对传统模型难以获取足够玉米种植问句特征问题,基于已构建的玉米种植知识图谱,采用基于BERT-Text CNN的问句意图理解模型和基于BERT-Bi LSTM-CRF的问句实体识别模型得到问句三元组,并通过Cypher语句检索问句三元组。实验结果表明,问句意图理解模型F1值达到了89.69%,问句实体识别任务F1值达到了90.48%,答案评估平均精确率为71.41%。(3)基于Drools规则引擎的玉米种植管理模型研究为解决当前德州市陵城区玉米种植规范性管理程度低问题,在分析玉米种植管理过程并查阅相关文献基础上,构建玉米苗期、穗期、花粒期种植管理模型。设计玉米播种期、苗期、穗期及花粒期的玉米种植管理方案,分别建立对应时期的环境管控、农事操作、水肥管理、病虫害防治等种植管理规则库,利用Drools规则引擎建立玉米全周期的种植管理模型,为农户提供玉米种植管理服务,实现玉米种植管理的数字化。(4)玉米种植管理系统设计与实现从用户需求、功能性需求和非功能性需求出发,进行了系统总体架构设计、功能设计和数据库设计。基于Spring Boot+Vue的前后端分离框架,所研发的系统实现了玉米种植知识图谱的可视化、玉米种植智能问答、基于Drools规则引擎的种植管理模型实现和后台种植信息管理等功能,提高了玉米种植的数字化管控水平。
面向半结构化和非结构化文本的知识图谱自动构建与应用
这是一篇关于实体识别,关系抽取,词汇增强,Prompt-tuning,智能问答的论文, 主要内容为近年来,政府和企业越来越注重对数据进行理解、分析和总结,但是由于数据规模庞大、类型繁杂、整理及维护成本高等问题,大部分数据的显性知识和共性问题不能被充分挖掘和分析,办公人员难以全面高效的工作。构建知识图谱可以达到对大规模数据挖掘和管理需求。基于半结构化和非结构化文本的三元组自动抽取是构建知识图谱核心,其中包含两个子任务:命名实体识别,关系抽取。本文工作主要包括以下三个方面:(1)对于中文实体识别任务,本文提出基于置信度估计的动态词汇增强模型(Dynamic lexicon enhance model for confidence estimation,DLECE)。首先使用知识增强预训练语言模型用于解决中文分词错误、一词多义和文本语义表征不足等问题。然后针对字符序列标注模型存在词法语义丢失问题,设计了词汇增强层,利用中文词库无损引入词汇内部语义信息。同时,采用注意力机制动态去除词汇增强集噪声。最后,本文提出全局和局部两种标签置信度估计方法,解决模型在错标和漏标数据集训练效果差的问题。在两份中文数据集实验表明,DLECE不仅在原始数据集的F1值达到了92.04%/86.03%,而且在带噪数据集上的F1值达到了89.22%/81.38%,均优于其他对比模型。(2)对于中文关系抽取任务,本文提出基于Prompt的多粒度知识增强关系抽取模型(Prompt-based ERNIE-Gram for relation extraction,Prompt-ERNIE-Gram)。首先使用多粒度知识增强模型解决字符和N-Gram语义表征不足等问题。然后为了解决Prompt-tuning范式无法直接迁移关系抽取任务问题,构建推理模板库进行模型输入输出适配。同时,利用中文近义词库解决模型在通用域泛化性差的问题。最后,提出使用词汇表达器用于将模型预测结果映射至标签集合中,不仅有效提升模型召回率,还去除了近义词库噪声。在两份中文数据集实验表明,Prompt-ERNIE-Gram取得了最好结果,F1值分别是96.76%和96.32%。(3)本文搭建了基于知识图谱的生活服务智能问答系统。首先,使用本文提出的DLECE和Prompt-ERNIE-Gram从八千万条半结构化与非结构化文本中自动抽取出三元组。然后,与开源生活服务知识图谱进行融合,构建出包含三千五百万节点的大规模中文生活服务知识图谱。同时,将图谱储存至Neo4j图数据库后利用Graph XR进行展示。最后基于知识图谱搭建了生活服务智能问答系统,能够回答各类实际生活场景中的复杂问题。
基于古诗知识图谱的智能问答研究
这是一篇关于知识图谱,智能问答,BERT,BiLSTM-CRF的论文, 主要内容为随着互联网的发展,数字化信息呈现出指数增长的趋势,给人们从海量数据中快速准确地获取需要的信息带来了挑战。传统的信息获取方式是使用搜索引擎,通过关键词匹配的方法返回大量的相关网页,导致用户需要耗费大量的精力从返回的网页中筛选出自己需要的答案。与传统的基于搜索引擎的信息获取方式相比,智能问答能够精准理解用户的搜索意图,并将答案直接返回给用户,提高了用户信息获取的效率。同时,知识图谱能够作为智能问答的一个高质量数据来源,其快速发展推动了智能问答在多个领域内的应用。目前,在教育领域非常重视古诗知识的学习和运用,但是古诗知识的体系复杂,用户获取古诗信息的方法主要是通过搜索引擎,对于想要根据条件个性化查找古诗信息的用户来说,这种信息获取方式不够高效。因此,本文构建了一个古诗知识图谱,并基于该知识图谱实现了古诗知识的智能问答。本文的研究工作主要包括以下几个方面:第一,古诗知识图谱构建。以关系型数据库中的数据为基础,利用互联网数据进行补充,将不同来源的数据进行融合,构建了能够用于智能问答的古诗知识图谱。第二,基于BERT的问句分类算法研究。常用的分类算法大都采用Word2vec获取文本的词向量表示,这种词向量表示方法存在一定的局限,训练之后的词向量是固定的,不会发生变化。但是同一个词在不同的上下文环境中表达的语义会有所不同。因此,本文使用BERT来获取包含上下文语义信息的词向量,通过BERT实现问句的分类,实验结果表明该方法下的问句分类效果得到了提升。第三,基于加入了条件随机场的双向长短期记忆网络(BiLSTM-CRF)的实体识别算法研究。在实际语境中,单个词的上下文信息会对该词的语义产生影响,传统的神经网络无法捕获长距离的上下文信息。针对此问题,本文使用BiLSTM-CRF去识别问句中的实体,首先双向长短期记忆网络(BiLSTM)能够一定程度上解决文本的长距离依赖问题,其次结合条件随机场(CRF)能够获取实体标签之间存在的依赖关系,最终提升实体识别效果。并且本文在BiLSTM-CRF的基础上验证了不同词向量对算法的影响,实验证明使用BERT预训练词向量的BiLSTM-CRF能获得更好的效果。第四,基于古诗知识图谱的智能问答系统的设计与实现。本文实现了一个基于古诗知识图谱的智能问答系统,在实际运行过程中系统运行状况良好,能够实时对用户的问句进行准确回答,满足用户古诗信息获取的需求。
基于微服务架构的企业智能问答系统的设计与实现
这是一篇关于微服务架构,智能问答,Spring MVC,企业问题处理平台的论文, 主要内容为随着公司业务的发展,企业销售人员在与商户洽谈业务合作时遇到越来越多无法解决的问题。但现有的问题反馈流程效率低下,已经无法适应业务需求,因此公司急需开发一个统一的问题反馈处理平台。近年来,随着移动互联网、大数据的快速发展与普及,移动智能应用受到业界广泛关注,并催生了智能问答系统应用研究的发展,这为开发企业问题处理平台提供了一种选择。智能问答系统能够接受用户以自然语言形式输入的问题,经过问题分析、信息检索和答案抽取等步骤,返回一个较为简洁准确的答案。但现有系统大多面向普通大众,极少针对企业特定领域场景,缺乏可定制性。这些系统很多都采用传统软件架构,不能适应快速变化的企业应用需求,缺乏可扩展性和可靠性。与此同时,现有智能问答系统仅提供自动问答服务,受回答准确率的限制,并不能最大程度解决用户的问题。与现有面向大众且功能单一的智能问答系统不同,本文对面向企业销售人员的多功能问题处理平台支撑技术开展了研究。论文工作的主要关注点是如何通过构建基于移动环境的便携化问题处理平台,组合运用多种答案查询方式,为销售人员提供实时问答服务,提高销售人员与客户的互动效率,同时确保系统的高可靠性。针对上述问题,本文在分析国内外智能问答系统技术发展现状的基础上,提出了基于微服务的企业智能问答系统的软件架构方案,围绕业务将系统拆分成用户、授权、监控、通知、配置等一组小型服务。结合系统需求分析,给出了用户端及管理平台的逻辑设计,确定了基于H5网页的移动客户端和基于B/S模式的PC管理平台的方案。在此基础上,设计并实现了提供目录检索、智能问答以及人工提问多种服务的问答系统。智能问答系统上线后高效解决了销售人员的问题,提高了销售人员与用户交互的效率,同时为企业积累了宝贵的知识资产。本论文的主要贡献有:(1)在分析国内外智能问答系统技术发展现状和不足的基础上,提出了基于微服务的企业智能问答系统的软件架构方案。(2)在分析面向销售人员的企业问题处理平台需求的基础上,提出了基于H5网页的移动客户端开发模式和基于B/S模式的PC管理平台开发框架,并结合前后端服务的特点,提出了基于React框架的前端项目和基于Spring MVC框架的后端项目的组合模式。(3)基于Spring MVC框架,在系统详细设计的基础上,给出了用户管理、授权认证、系统监控、通知推送、机器人模块等后台核心模块的实现机制,并对系统进行了功能性测试。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码驿站 ,原文地址:https://bishedaima.com/lunwen/46060.html