柑橘病虫害知识图谱构建研究
这是一篇关于知识图谱,实体识别,本体构建,知识补全的论文, 主要内容为随着信息技术在社会各领域应用的不断深入和拓展,传统农业也由此进入了以信息技术改造升级的时代。湖南是我国柑橘种植大省,一旦发生柑橘病虫害将会严重影响柑橘产量及其品质,带来重大经济损失,降低农户收益。当前常见的柑橘病虫害相关资料大多被记录于专业书籍或领域文章之中,种植柑橘的农户难以在短时间内查询到有关资料。针对上述问题,本文通过采用知识图谱相关技术构建柑橘病虫害知识库,同时通过研究深度学习模型和本体编辑器Protégé,在相关专家及文献指导下完善柑橘病虫害知识图谱,研究并实现基于知识图谱的柑橘病虫害查询系统。目前我国对覆盖柑橘全产业链的知识服务仍然处于起步阶段,缺乏成熟实用的柑橘病虫害服务系统,本文的研究对加快柑橘产业智能化服务体系建设具有重大意义。论文主要工作包括:(1)依据《农业科学叙词表》中记录的柑橘病虫害实体结构层次创建初始的模式层,并将部分柑橘病虫害数据导入Neo4j图数据库中,实现一个初始的柑橘病虫害农业知识图谱。基于《农业科学叙词表》中的病虫害实体并设计八爪鱼数据采集器从百度百科、农业书籍等多种来源获取与实体相关的数据集,将获取到半结构化数据和非结构化数据存入CSV文件中,然后进行数据清洗、降噪等处理。(2)基于Bi LSTM-CRF深度学习算法扩展知识图谱数据层。通过对数据集采用BIO标注策略训练深度学习算法,使其自动识别文本实体并依据标签信息抽取出柑橘病虫害三元组数据。实验过程中将对batch_size和num_epochs进行不同的取值实验,最后确定值分别取64和100。通过对多种实体识别模型Bi LSTM、Bi LSTM-CRF、LSTM、LSTM-CRF分别进行训练和比较,Bi LSTM-CRF模型效果最好,其精确率、召回率和F1值分别达到91.07%、80.95%和85.71%。(3)借助抽取的三元组数据,设计基于Protégé本体编辑器构建柑橘病虫害领域本体信息库,并在本体信息库基础上研究通过编写SWRL规则库和Pellet推理机对柑橘病虫害领域本体信息进行扩展。同时在相关领域专家指导下完成知识图谱的推理及补全。通过Neo4j图数据库的命令操作将本体信息库中的知识存入Neo4j图数据库中,实现本体库到知识图谱的转化。最后将推理出的柑橘病虫害新知识编辑成若干个自然语句,然后重新打上标注用于对数据集的扩展,并使用Bi LSTM-CRF进行训练。实验结果表明,数据扩展后的Bi LSTM-CRF模型相比于数据扩展前的Bi LSTM-CRF模型精确率、召回率和F1值分别提高了0.31%,0.59%,0.47%。(4)以柑橘病虫害知识图谱作为数据来源,采用表示层、业务处理层、数据访问层三层架构,设计并实现了一个基于知识图谱的柑橘病虫害查询系统,该系统可以有效指导柑橘种植生产,为柑橘病虫害防治提供科学依据。
河北省旅游景点知识图谱的构建与应用
这是一篇关于知识图谱,本体构建,信息抽取,知识融合,可视化的论文, 主要内容为在互联网与大数据的环境下,搜索引擎逐步成为人们认识世界的主要途径。但是随着旅游领域数据的不断激增,游客通常需要花费大量时间和精力进行多次筛选才能获得所需信息,因此提供一个完备的、可以帮助用户迅速准确地了解景点信息的系统是非常有意义的。知识图谱可以大幅度提高搜索引擎效率,故本文针对河北省旅游行业的需求,通过整合多源异构数据构建了旅游景点知识图谱,且在此基础上设计并实现了基于知识图谱的景点信息可视化系统。主要工作包含以下方面:(1)语料的获取及预处理。首先对相关网站进行分析对比,确定语料的来源网站;然后将Phantom JS和Selenium结合搭建爬虫框架并通过该框架实现初始语料的爬取;最后利用NLPIR工具实现初始语料的中文分词、词性标注等预处理工作。(2)河北省旅游景点知识图谱的构建研究。首先通过训练Bi-LSMT-CRF命名实体识别模型和SVM关系预测模型实现景点属性和属性关系的抽取工作;然后利用Levenshtein距离算法和Word2vec模型通过计算属性的相似度将属性进行融合,通过学习排序法和多值合并法进行属性值的融合;又依据河北省旅游景点的实际特点制定改进的本体构建方法,即:将循环思想融入七步法,增加迭代更新过程。并根据改进的七步法,在Protégé本体编辑软件实现本体的构建;最后将所有知识导入Neo4j图数据库进行存储,完成旅游景点知识图谱的构建。(3)旅游景点知识图谱的应用。本文基于构建的知识图谱设计实现了一个集景点信息管理、景点信息搜索和搜索结果可视化为一体的应用系统。系统直接与图数据库进行连接,可以迅速高效的完成景点信息搜索和对景点信息的增删改查操作;并通过D3技术实现了将知识图谱中的景点信息全面直观的向用户可视化展示。本研究有助于用户更高效快捷地搜索信息、并直观简洁地了解景点,进而促进河北省旅游业的发展,还有助于领域知识图谱构建工作的进一步研究。
面向在线评论口碑舆情观点挖掘的产品领域本体构建研究
这是一篇关于在线评论,口碑舆情,产品领域本体,本体构建的论文, 主要内容为随着电子商务的迅猛发展,越来越多的消费者习惯了网络购物,由于网络的虚拟性,消费者往往会从电商网站、论坛、博客等平台搜寻在线评论,获取产品口碑情况后再做决定,企业也越来越重视口碑营销。为了快速、有效地从海量、非结构化的在线评论中提取观点,帮助消费者购买决策与企业了解消费者反馈,学者先后提出了非本体方法与本体方法的观点挖掘方法体系,后者在效果上有所提升。但大多数研究重点关注挖掘算法改进或系统设计,针对产品领域本体构建的研究却非常少,所构建的本体适用性也有所局限。因此,本文聚集于产品领域本体构建方法,基于网络口碑理论、观点挖掘理论、自然语言处理技术及领域本体理论探讨系统、完备、适用性更强的产品领域本体构建思路,以期能实现更好的观点挖掘效果。本文的产品领域本体构建研究从需求分析开始。首先对在线评论口碑舆情观点挖掘进展进行了梳理,结合当今竞争情报、客户关系管理、精准营销等企业运营实践的需要,探究了当下观点挖掘的功能需求;通过分析领域本体的功能特征阐述了本体能够在一定程度上满足以上需求。接着通过对产品领域本体的构建思路、构建步骤、领域重要概念获取方法、重要属性与关系的分析构建了通用产品领域本体模型。最后基于Protégé实现了手机领域本体构建,分别从手机官网、在线评论中获取领域概念,使用NLPIR分词得到160,662个词,之后采用基于频率的方法识别领域概念共281个,定义7个层级共93个类。结合相关常识与专家知识定义了手机领域对象属性与数值属性分别10个、27个,先后在Class、Property、Reasoner功能模块实现了手机领域本体构建,并用Graphviz插件实现了本体可视化,最后实现了OWL语言表示。分别采用非本体方法和本体方法进行了手机在线评论观点挖掘对比实验。研究结果表明,本文所构建的手机领域本体在手机在线评论观点挖掘实验中达到了较好的效果,相较于非本体方法,主题识别精度提高了17.36%,验证了领域本体在主题归并上的显著效果。情感计算的准确率、召回率和F值均有所提升,表明该手机领域本体对观点挖掘模型效果的提升起到了良好的效果,从而间接地说明了本文构建的产品领域本体模型的有效性。
基于本体的信息资源的集成
这是一篇关于本体构建,本体映射,信息资源集成框架,包装器,查询处理,集成系统的论文, 主要内容为信息资源集成可以屏蔽底层信息资源的异构性,提供给用户一个全局的信息视图,实现分布式、异构信息的统一访问。传统的集成方法无法解决语义异构问题,而本体具有良好的概念层次结构并支持逻辑推理,因而可以解决信息资源的语义异构问题。 本文提出了分布式网络环境下的基于本体的信息资源集成框架,它具有松耦合、易扩展、支持语义查询等良好特性。该框架不仅适合某领域的集成,如政府信息资源,而且用户还可以通过改变本体定义和信息资源来改变框架的应用范围,从而扩展到其它领域,因此该框架具有通用性。本文构建了政府档案全局本体,以关系数据库和XML两类信息源为例,利用局部信息资源的模式抽取出局部本体,建立了全局本体与局部本体,以及局部本体与信息资源之间的映射;提出了全局查询分解算法以及子查询转换算法;设计了包装器,它包括查询翻译服务、查询服务和结果转换服务,并把这些服务注册到私有UDDI注册中心。在查询处理部分提出了采用类SQL作为全局查询语言,查询结果以统一的对象形式进行整合,显示给用户。 为了验证框架的可实现性,设计并实现了基于本体的信息资源集成原型系统。采用OWL DL对本体进行描述、Jena2.5.3对本体进行解析,利用J2EE平台、JSP、Struts、EJB、Hibernate、Web Services、jUDDI、UDDI4J等技术实现了该原型系统,最后对所做的工作进行了总结。
基于知识图谱的钢铁生产过程表征技术研究与应用
这是一篇关于钢铁生产过程表征,知识图谱,本体构建,知识图谱应用,甘特图的论文, 主要内容为我国钢铁产业数字化发展仍处于初级阶段,在经济全球化程度不断加深、世界各产业结构转移升级以及产能过剩的影响下,我国钢铁产业利润有较大幅度下降,亟需提高工业化和信息化水平,融合新一代信息技术到生产和管理之中。钢铁生产过程是涵盖了连续型生产和离散型生产的混合流程,生产过程复杂,数据来源多、格式和协议多,传统的制造业信息化理论的多级架构设计使得自动化实时信息与业务信息分布在多个独立的系统中形成信息孤岛,数据按工序的空间分布进行组织与存储,这种情况下难以实现完整生产过程数据的整合贯通。本论文研究使用知识图谱技术来对钢铁生产过程数据进行整合和表征,首先构建了钢铁生产过程知识图谱本体结构,然后设计实现了一套系统来解决钢铁企业生产过程管理存在的问题,主要包括如下方面:(1)通过分析钢铁生产过程,完成了钢铁生产过程知识图谱的本体设计和图谱构建,在其基础上设计了基于知识图谱的钢铁生产过程表征系统。(2)以某钢铁企业生产为参考,实现系统功能,通过将本体属性映射到多源数据库字段的方式来构建图谱本体,并生成实体节点和关系来描述钢铁生产的工序过程衔接、物料流转、设备使用信息及其之间的关联,将生产过程数据、物料的检测数据和计量数据及其他系统中的业务数据等进行整合贯通。(3)通过可视化技术将特定的生产过程涉及的图节点完整展示,用于对生产情况的查询和评估,并将相应的数据整合,提供数据服务。以图表的形式对历史生产过程数据和图谱数据服务提供的数据进行表示,能够有效、直观地感知和了解生产过程情况。(4)研究了甘特图对比分析方法,并在系统中构建生产加工过程甘特图。通过将计划甘特图与生产实际甘特图进行对比分析,宏观地评判生产逾期、超时等情况,来为优化生产提供依据。
基于本体的信息资源的集成
这是一篇关于本体构建,本体映射,信息资源集成框架,包装器,查询处理,集成系统的论文, 主要内容为信息资源集成可以屏蔽底层信息资源的异构性,提供给用户一个全局的信息视图,实现分布式、异构信息的统一访问。传统的集成方法无法解决语义异构问题,而本体具有良好的概念层次结构并支持逻辑推理,因而可以解决信息资源的语义异构问题。 本文提出了分布式网络环境下的基于本体的信息资源集成框架,它具有松耦合、易扩展、支持语义查询等良好特性。该框架不仅适合某领域的集成,如政府信息资源,而且用户还可以通过改变本体定义和信息资源来改变框架的应用范围,从而扩展到其它领域,因此该框架具有通用性。本文构建了政府档案全局本体,以关系数据库和XML两类信息源为例,利用局部信息资源的模式抽取出局部本体,建立了全局本体与局部本体,以及局部本体与信息资源之间的映射;提出了全局查询分解算法以及子查询转换算法;设计了包装器,它包括查询翻译服务、查询服务和结果转换服务,并把这些服务注册到私有UDDI注册中心。在查询处理部分提出了采用类SQL作为全局查询语言,查询结果以统一的对象形式进行整合,显示给用户。 为了验证框架的可实现性,设计并实现了基于本体的信息资源集成原型系统。采用OWL DL对本体进行描述、Jena2.5.3对本体进行解析,利用J2EE平台、JSP、Struts、EJB、Hibernate、Web Services、jUDDI、UDDI4J等技术实现了该原型系统,最后对所做的工作进行了总结。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设导航 ,原文地址:https://bishedaima.com/lunwen/47664.html