面向小麦病虫害领域的中文命名实体识别和关系抽取研究
这是一篇关于小麦病虫害,实体识别,实体关系抽取,知识图谱,知识可视化的论文, 主要内容为小麦是全球最重要的粮食作物之一,其种植面积与产量在粮食作物中占比较高。小麦种植过程中面临着许多挑战,各种各样的病虫害是影响小麦产量和品质的主要原因之一,有效的预防和防治措施能够促进小麦种植产业的发展。目前,丰富的小麦病虫害预防和防治措施等知识往往以非结构化文本的形式保存在网页、书籍和文献中,数据的存储、组织、表示及管理方式不尽相同,导致该领域数据处于分散混乱的状态,并且由于非结构化文本难以直观刻画出重要信息之间的关系,不利于知识的高效利用,也不利于知识的获取和共享,难以满足小麦生产管理者对病虫害知识更深层次和更细粒度的信息需求。知识抽取是一种组织和管理非结构化文本数据的有效方法,其目的是从非结构化数据中识别出相关命名实体,并抽取实体之间的关系,在知识图谱、知识检索、知识库问答等领域发挥着重要作用。本文为了提高小麦病虫害知识组织的有效性,以非结构化文本形式的小麦病虫害知识数据为研究对象,开展命名实体识别和关系抽取研究,分别提出了基于远程监督和有监督的小麦病虫害知识抽取模型,并实现了小麦病虫害知识的可视化展示。本文主要完成的工作内容如下:(1)基于远程监督的小麦病虫害中文实体关系抽取。针对小麦病虫害领域数据集匮乏问题,基于远程监督的思想,利用CN-DBpedia与Ownthink两个外部知识库中的相关三元组与小麦病虫害非结构化文本知识进行匹配对齐,并结合人工校正的方式构造了小麦病虫害中文实体关系抽取数据集Wheat CRE,该数据集蕴含6种关系类别。其次进一步分析了该数据集的文本特征,为了降低句内噪声词对模型的影响,提出了一种融合BERT与实体表征的单标签句子级实体关系抽取模型BE-CRE,该模型基于BERT获取动态字符表征,为了丰富文本特征,进一步融合了目标实体表征,充分利用小麦病虫害中文命名实体隐含的特定含义,为模型提供额外的有效信息,提升了模型在关系抽取任务中的效果。与当前主流模型相比,BE-CRE在Wheat CRE上表现最佳,F1-M值为89.29%,且BE-CRE在人物关系抽取数据集Character CRE上的表现优于对比模型,F1-M值为78.31%,证明该模型具有一定的泛化性。(2)基于有监督的小麦病虫害中文命名实体识别与关系抽取。远程监督利用外部知识库可以有效解决数据集匮乏问题,但其依赖于外部知识库的支撑,存在知识挖掘不充分的问题。为了深层次挖掘小麦病虫害非结构化文本中蕴含的知识,在前述研究的基础上,首先结合领域专家的指导和对农业领域已有研究的总结,深入剖析小麦病虫害文本知识,细粒度定义了21种实体类别和18种关系类别,并通过人工标注的方式,分别构建了小麦病虫害实体识别数据集Wpd CNER和关系抽取数据集Wpd CRE。针对实体类别增加带来的实体类别分布不均匀、实体边界模糊、实体嵌套等具体问题,提出一种融合ALBERT-Bi LSTM-CRF与规则的实体识别模型WPD-RA,该模型在Wpd CNER上识别的F1值为95.29%,优于当前主流模型。针对关系类别进一步多样化带来的关系重叠问题,提出一种融合BERT-Bi LSTM-Attention与实体表征的关系抽取模型WPD-BBAE,利用Attention动态分配权重,增强句中关键词的重要性,该模型在Wpd CRE上表现最佳,F1-M值为90.44%。(3)小麦病虫害知识的可视化展示。基于前述工作建立的知识抽取方法,首先对小麦病虫害领域的非结构化训练语料进行实体识别和关系抽取,得到了结构化的小麦病虫害实体关系三元组,经三元组去重处理,最终共得到2684个实体,5668个关系,实现了对小麦病虫害知识的细粒度挖掘与结构化整合。其次通过图数据库Neo4j对处理后的三元组数据进行存储,实现了小麦病虫害知识的可视化展示,为小麦病虫害知识的获取与共享提供途径。本文针对小麦病虫害领域的非结构化文本数据,分别提出了远程监督和有监督的小麦病虫害实体识别和关系抽取模型,可以为该领域知识的细粒度挖掘与结构化组织提供技术支撑,进而可以为构建该领域知识图谱、智能知识检索、智能问答等深层次知识利用发挥作用。
基于小麦病虫害知识图谱的推荐技术研究
这是一篇关于小麦病虫害,知识图谱,命名实体识别技术,推荐技术,特征融合的论文, 主要内容为小麦是当今世界最重要的粮食作物之一,我国对小麦种植产业的发展极为重视。小麦种植时的播种方式与耕种方式均会对小麦产量造成直接影响,而小麦病虫害的发生更是可能会造成小麦减产甚至绝收。在现代化农业发展进程中要加强对小麦种植技术的全面了解和认识,特别是要加强麦农对于小麦病虫害相关知识的了解,以此确保小麦的品质与产量。由于农业生产者文化教育程度的差异以及新的科技成果传播方式的问题,他们在实际生产中更多依赖于农事生产经验而不是网络中的相关农业知识,随着智慧农业的发展,推荐系统被引入以解决农业知识传播的效率问题,推荐系统能够根据不同用户的特征进行推荐,能够促进小麦病虫害知识的有效传播,提高麦农对于相关知识的了解程度。本文以小麦病虫害知识为研究对象,对小麦病虫害命名实体识别技术进行研究,并提出一种面向小麦病虫害知识的推荐模型,为小麦病虫害防治等相关知识的有效传播提供技术支持。文章的主要工作包括:(1)小麦病虫害命名实体识别技术的研究。将知识图谱的概念引入小麦病虫害领域中,首先对小麦病虫害知识的特点进行分析,完成小麦病虫害领域的本体库的构建工作,依托小麦病虫害本体库进行知识抽取工作后整合形成知识图谱。构建基于BIO标注策略的BERT-Bi LSTM-CRF小麦病虫害命名实体识别模型,设计实验与基线模型进行对比分析,结果表明该模型表现优越,达到了0.9086的精确率、0.9001的召回率和0.9043的F1得分。(2)提出一种基于知识图谱的特征融合推荐模型,针对当前推荐模型中存在的数据稀疏性和用户兴趣描述粒度大的问题,将知识图谱引入推荐模型中,基于知识图谱进行用户兴趣建模,融合挖掘的语义特征与知识特征后使用融合注意力机制的门控循环单元捕获知识图谱中蕴含的高阶信息,丰富用户表征以改进推荐效果。基于学术界通用的数据集Movie Lens数据集以及构建的小麦病虫害知识相关数据集进行实验,结果验证了本文所构建的推荐模型各个模块的重要性,能够有效提升推荐效果且该模型能够有效缓解数据稀疏性问题,AUC和准确率分别达到0.8857和0.8131。针对小麦病虫害知识的传播效率问题,本文对小麦病虫害命名实体识别技术进行研究,在此基础上提出一种基于知识图谱特征融合的推荐模型,借助该模型促进小麦病虫害知识的有效传播,助力农业生产实践。
面向小麦病虫害领域的中文命名实体识别和关系抽取研究
这是一篇关于小麦病虫害,实体识别,实体关系抽取,知识图谱,知识可视化的论文, 主要内容为小麦是全球最重要的粮食作物之一,其种植面积与产量在粮食作物中占比较高。小麦种植过程中面临着许多挑战,各种各样的病虫害是影响小麦产量和品质的主要原因之一,有效的预防和防治措施能够促进小麦种植产业的发展。目前,丰富的小麦病虫害预防和防治措施等知识往往以非结构化文本的形式保存在网页、书籍和文献中,数据的存储、组织、表示及管理方式不尽相同,导致该领域数据处于分散混乱的状态,并且由于非结构化文本难以直观刻画出重要信息之间的关系,不利于知识的高效利用,也不利于知识的获取和共享,难以满足小麦生产管理者对病虫害知识更深层次和更细粒度的信息需求。知识抽取是一种组织和管理非结构化文本数据的有效方法,其目的是从非结构化数据中识别出相关命名实体,并抽取实体之间的关系,在知识图谱、知识检索、知识库问答等领域发挥着重要作用。本文为了提高小麦病虫害知识组织的有效性,以非结构化文本形式的小麦病虫害知识数据为研究对象,开展命名实体识别和关系抽取研究,分别提出了基于远程监督和有监督的小麦病虫害知识抽取模型,并实现了小麦病虫害知识的可视化展示。本文主要完成的工作内容如下:(1)基于远程监督的小麦病虫害中文实体关系抽取。针对小麦病虫害领域数据集匮乏问题,基于远程监督的思想,利用CN-DBpedia与Ownthink两个外部知识库中的相关三元组与小麦病虫害非结构化文本知识进行匹配对齐,并结合人工校正的方式构造了小麦病虫害中文实体关系抽取数据集Wheat CRE,该数据集蕴含6种关系类别。其次进一步分析了该数据集的文本特征,为了降低句内噪声词对模型的影响,提出了一种融合BERT与实体表征的单标签句子级实体关系抽取模型BE-CRE,该模型基于BERT获取动态字符表征,为了丰富文本特征,进一步融合了目标实体表征,充分利用小麦病虫害中文命名实体隐含的特定含义,为模型提供额外的有效信息,提升了模型在关系抽取任务中的效果。与当前主流模型相比,BE-CRE在Wheat CRE上表现最佳,F1-M值为89.29%,且BE-CRE在人物关系抽取数据集Character CRE上的表现优于对比模型,F1-M值为78.31%,证明该模型具有一定的泛化性。(2)基于有监督的小麦病虫害中文命名实体识别与关系抽取。远程监督利用外部知识库可以有效解决数据集匮乏问题,但其依赖于外部知识库的支撑,存在知识挖掘不充分的问题。为了深层次挖掘小麦病虫害非结构化文本中蕴含的知识,在前述研究的基础上,首先结合领域专家的指导和对农业领域已有研究的总结,深入剖析小麦病虫害文本知识,细粒度定义了21种实体类别和18种关系类别,并通过人工标注的方式,分别构建了小麦病虫害实体识别数据集Wpd CNER和关系抽取数据集Wpd CRE。针对实体类别增加带来的实体类别分布不均匀、实体边界模糊、实体嵌套等具体问题,提出一种融合ALBERT-Bi LSTM-CRF与规则的实体识别模型WPD-RA,该模型在Wpd CNER上识别的F1值为95.29%,优于当前主流模型。针对关系类别进一步多样化带来的关系重叠问题,提出一种融合BERT-Bi LSTM-Attention与实体表征的关系抽取模型WPD-BBAE,利用Attention动态分配权重,增强句中关键词的重要性,该模型在Wpd CRE上表现最佳,F1-M值为90.44%。(3)小麦病虫害知识的可视化展示。基于前述工作建立的知识抽取方法,首先对小麦病虫害领域的非结构化训练语料进行实体识别和关系抽取,得到了结构化的小麦病虫害实体关系三元组,经三元组去重处理,最终共得到2684个实体,5668个关系,实现了对小麦病虫害知识的细粒度挖掘与结构化整合。其次通过图数据库Neo4j对处理后的三元组数据进行存储,实现了小麦病虫害知识的可视化展示,为小麦病虫害知识的获取与共享提供途径。本文针对小麦病虫害领域的非结构化文本数据,分别提出了远程监督和有监督的小麦病虫害实体识别和关系抽取模型,可以为该领域知识的细粒度挖掘与结构化组织提供技术支撑,进而可以为构建该领域知识图谱、智能知识检索、智能问答等深层次知识利用发挥作用。
面向小麦病虫害领域的中文命名实体识别和关系抽取研究
这是一篇关于小麦病虫害,实体识别,实体关系抽取,知识图谱,知识可视化的论文, 主要内容为小麦是全球最重要的粮食作物之一,其种植面积与产量在粮食作物中占比较高。小麦种植过程中面临着许多挑战,各种各样的病虫害是影响小麦产量和品质的主要原因之一,有效的预防和防治措施能够促进小麦种植产业的发展。目前,丰富的小麦病虫害预防和防治措施等知识往往以非结构化文本的形式保存在网页、书籍和文献中,数据的存储、组织、表示及管理方式不尽相同,导致该领域数据处于分散混乱的状态,并且由于非结构化文本难以直观刻画出重要信息之间的关系,不利于知识的高效利用,也不利于知识的获取和共享,难以满足小麦生产管理者对病虫害知识更深层次和更细粒度的信息需求。知识抽取是一种组织和管理非结构化文本数据的有效方法,其目的是从非结构化数据中识别出相关命名实体,并抽取实体之间的关系,在知识图谱、知识检索、知识库问答等领域发挥着重要作用。本文为了提高小麦病虫害知识组织的有效性,以非结构化文本形式的小麦病虫害知识数据为研究对象,开展命名实体识别和关系抽取研究,分别提出了基于远程监督和有监督的小麦病虫害知识抽取模型,并实现了小麦病虫害知识的可视化展示。本文主要完成的工作内容如下:(1)基于远程监督的小麦病虫害中文实体关系抽取。针对小麦病虫害领域数据集匮乏问题,基于远程监督的思想,利用CN-DBpedia与Ownthink两个外部知识库中的相关三元组与小麦病虫害非结构化文本知识进行匹配对齐,并结合人工校正的方式构造了小麦病虫害中文实体关系抽取数据集Wheat CRE,该数据集蕴含6种关系类别。其次进一步分析了该数据集的文本特征,为了降低句内噪声词对模型的影响,提出了一种融合BERT与实体表征的单标签句子级实体关系抽取模型BE-CRE,该模型基于BERT获取动态字符表征,为了丰富文本特征,进一步融合了目标实体表征,充分利用小麦病虫害中文命名实体隐含的特定含义,为模型提供额外的有效信息,提升了模型在关系抽取任务中的效果。与当前主流模型相比,BE-CRE在Wheat CRE上表现最佳,F1-M值为89.29%,且BE-CRE在人物关系抽取数据集Character CRE上的表现优于对比模型,F1-M值为78.31%,证明该模型具有一定的泛化性。(2)基于有监督的小麦病虫害中文命名实体识别与关系抽取。远程监督利用外部知识库可以有效解决数据集匮乏问题,但其依赖于外部知识库的支撑,存在知识挖掘不充分的问题。为了深层次挖掘小麦病虫害非结构化文本中蕴含的知识,在前述研究的基础上,首先结合领域专家的指导和对农业领域已有研究的总结,深入剖析小麦病虫害文本知识,细粒度定义了21种实体类别和18种关系类别,并通过人工标注的方式,分别构建了小麦病虫害实体识别数据集Wpd CNER和关系抽取数据集Wpd CRE。针对实体类别增加带来的实体类别分布不均匀、实体边界模糊、实体嵌套等具体问题,提出一种融合ALBERT-Bi LSTM-CRF与规则的实体识别模型WPD-RA,该模型在Wpd CNER上识别的F1值为95.29%,优于当前主流模型。针对关系类别进一步多样化带来的关系重叠问题,提出一种融合BERT-Bi LSTM-Attention与实体表征的关系抽取模型WPD-BBAE,利用Attention动态分配权重,增强句中关键词的重要性,该模型在Wpd CRE上表现最佳,F1-M值为90.44%。(3)小麦病虫害知识的可视化展示。基于前述工作建立的知识抽取方法,首先对小麦病虫害领域的非结构化训练语料进行实体识别和关系抽取,得到了结构化的小麦病虫害实体关系三元组,经三元组去重处理,最终共得到2684个实体,5668个关系,实现了对小麦病虫害知识的细粒度挖掘与结构化整合。其次通过图数据库Neo4j对处理后的三元组数据进行存储,实现了小麦病虫害知识的可视化展示,为小麦病虫害知识的获取与共享提供途径。本文针对小麦病虫害领域的非结构化文本数据,分别提出了远程监督和有监督的小麦病虫害实体识别和关系抽取模型,可以为该领域知识的细粒度挖掘与结构化组织提供技术支撑,进而可以为构建该领域知识图谱、智能知识检索、智能问答等深层次知识利用发挥作用。
基于小麦病虫害知识图谱的推荐技术研究
这是一篇关于小麦病虫害,知识图谱,命名实体识别技术,推荐技术,特征融合的论文, 主要内容为小麦是当今世界最重要的粮食作物之一,我国对小麦种植产业的发展极为重视。小麦种植时的播种方式与耕种方式均会对小麦产量造成直接影响,而小麦病虫害的发生更是可能会造成小麦减产甚至绝收。在现代化农业发展进程中要加强对小麦种植技术的全面了解和认识,特别是要加强麦农对于小麦病虫害相关知识的了解,以此确保小麦的品质与产量。由于农业生产者文化教育程度的差异以及新的科技成果传播方式的问题,他们在实际生产中更多依赖于农事生产经验而不是网络中的相关农业知识,随着智慧农业的发展,推荐系统被引入以解决农业知识传播的效率问题,推荐系统能够根据不同用户的特征进行推荐,能够促进小麦病虫害知识的有效传播,提高麦农对于相关知识的了解程度。本文以小麦病虫害知识为研究对象,对小麦病虫害命名实体识别技术进行研究,并提出一种面向小麦病虫害知识的推荐模型,为小麦病虫害防治等相关知识的有效传播提供技术支持。文章的主要工作包括:(1)小麦病虫害命名实体识别技术的研究。将知识图谱的概念引入小麦病虫害领域中,首先对小麦病虫害知识的特点进行分析,完成小麦病虫害领域的本体库的构建工作,依托小麦病虫害本体库进行知识抽取工作后整合形成知识图谱。构建基于BIO标注策略的BERT-Bi LSTM-CRF小麦病虫害命名实体识别模型,设计实验与基线模型进行对比分析,结果表明该模型表现优越,达到了0.9086的精确率、0.9001的召回率和0.9043的F1得分。(2)提出一种基于知识图谱的特征融合推荐模型,针对当前推荐模型中存在的数据稀疏性和用户兴趣描述粒度大的问题,将知识图谱引入推荐模型中,基于知识图谱进行用户兴趣建模,融合挖掘的语义特征与知识特征后使用融合注意力机制的门控循环单元捕获知识图谱中蕴含的高阶信息,丰富用户表征以改进推荐效果。基于学术界通用的数据集Movie Lens数据集以及构建的小麦病虫害知识相关数据集进行实验,结果验证了本文所构建的推荐模型各个模块的重要性,能够有效提升推荐效果且该模型能够有效缓解数据稀疏性问题,AUC和准确率分别达到0.8857和0.8131。针对小麦病虫害知识的传播效率问题,本文对小麦病虫害命名实体识别技术进行研究,在此基础上提出一种基于知识图谱特征融合的推荐模型,借助该模型促进小麦病虫害知识的有效传播,助力农业生产实践。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设项目助手 ,原文地址:https://bishedaima.com/lunwen/56155.html