基于自然语言处理技术的学术知识图谱研究与实现
这是一篇关于知识图谱,自然语言处理,数据获取与预处理,知识抽取,知识存储的论文, 主要内容为数据大爆炸时代,各行各业面临着全面化数字转型的挑战,如何挖掘数据间的内在关联,直观展示数据间的关系成为关键。在学术领域,每年都有无数学者发布诸多学术论文,每个学术网站都有大量各自为政的数据,数据孤岛虽有利于数据维护和控制,但是会降低数据质量、数据查看速度和数据分析的准确性。目前较为主流的查看教师发表论文情况、教师间合作关系及引用关系、论文详情的方法是在学术网站上通过网页展示查看获取学术信息。但教师之间合作关系、引用关系繁多,网页展示不足以让浏览者在脑海中建立起清晰的学术知识结构,直观了解情况。而知识图谱作为近些年的研究热潮,可以添加各种关联和关系,将数据孤岛串联起来,提供一个完整可见的数据查询视图。特别是在学术领域,知识图谱可以将复杂繁多的学术信息,包括学者信息和论文信息,成体系地展示出来,改变原来学术知识查询结果以网页文字展示的模式。并且,由于知识图谱的特性,可以使得学术知识查询变得简单快捷,教师之间的学术关系也能清晰直观地展现。因此本文设计实现一种可视化的学术知识图谱平台,用来解决学术知识结构化展示与整合的问题。本文主要工作如下:首先是数据源获取与预处理工作,本环节主要提取了高校网站教师主页的非结构化文本信息,以及学术网站包括百度学术和DBLP网页上的结构化和半结构化学术数据。其次是学术知识获取工作。在定义好本体后,对于学术网站上的半结构化数据和结构化数据,直接使用Jsoup框架爬取出学术知识三元组;对于非结构化文本数据,本文研究探索了基于自然语言处理的Bi LSTM-CRF训练模型,并利用其进行实体抽取实验。实体关系抽取环节,采用句法依存分析法从文本语句中抽取出实体的关系。知识表示与存储阶段利用RDF三元组表示方式结合Neo4j图数据库的方式完成。最后,利用知识三元组实现了学术知识图谱可视化平台的搭建。系统底层数据模块使用了图数据库存储与查询技术,后端使用Spring Boot框架,前端使用Echarts工具对查询到的数据进行渲染,最终以“节点-关系-节点”关系图的形式展示,同时完成了教师和论文的查询模块和信息展示模块。
基于知识图谱的经侦情报分析系统研究与实现
这是一篇关于经济犯罪侦查,知识表示,知识存储,知识抽取,可视化,自动化布局的论文, 主要内容为高速发展的互联网和现代信息技术,不仅改变了人们的生活和生产方式,也给犯罪分子提供了更多的犯罪手段和模式,特别是在经济领域。经济案件中的犯罪活动逐渐与互联网相融合,使得案件的线索和犯罪的证据容易被淹没在错综复杂的关系网络中,给侦查的情报分析工作提出了巨大挑战。近年来,随着人工智能技术的深入发展,知识图谱掀起了研究的热潮。知识图谱作为一个语义网,具有强大的语义处理能力和开放的数据组织能力,逐渐被应用于各大领域中。本文通过分析当前经济犯罪侦查(经侦)中的情报分析工作面临的问题和知识图谱技术的特点,研究并实现了一个基于知识图谱的经侦情报分析系统,以促进知识图谱在经侦领域中的应用,进而推进经侦情报分析工作的变革与创新。本文做的工作主要包括以下几点:1、经侦情报知识图谱的表示、建模与存储。本文通过对比主流知识图谱表示方法和存储技术的特点,并结合经侦情报知识模型和知识存储需要满足的要求,提出了基于RDF和RDFs的自上而下的经侦情报知识建模方法和基于MongoDB的经侦情报知识存储方法。2、经侦情报知识抽取。在知识抽取方面,本文首先研究了面向结构化数据的知识抽取方法,并使用它从结构化的企业基本信息、人员信息等数据中抽取了部分情报知识形成知识图谱;然后应用机器学习中的LightGBM模型,对知识库中的空壳企业进行识别,并补全相应的标签知识;最后,在已有知识的基础上,根据RDFs推理规则和自定义领域推理规则,应用Jena推理机进行知识推理,进一步补全图谱。3、经侦情报知识图谱的可视化与自动布局。本文研究了Web可视化技术的发展历程和常见的几种布局算法的优缺点、适用范围,再根据本文图谱可视化方面的需求,选择了GPU加速的客户端渲染技术来进行图谱节点和边的可视化,并结合JavaScript实现了一些基于图谱的人机交互,最后设计了基于服务端的力导向布局模型来优化图谱的布局。4、结合前三部分的研究,以及基于知识图谱的经侦情报分析系统的需求,对系统三个主要功能模块——知识数据管理模块、图谱可视化模块和经侦情报分析模块进行了设计和实现。
面向网络不良信息的知识图谱构建方法研究
这是一篇关于知识抽取,知识图谱,知识存储,深度置信网络的论文, 主要内容为随着信息产业的发展,网络在给大家提供信息服务的同时也带来了一定的安全隐患。而现在的网络信息检测和过滤形式单一,无法满足信息产业发展的需要。而近年来知识图谱在信息检索中的高速发展为不良信息的检索和过滤带来了新的契机。所以本文提出了面向网络不良信息知识图谱构建方法的课题研究。本课题在现有的技术和算法基础上,进行面向网络不良信息的知识图谱的构建方法研究。本文的整体构建流程包含了数据的采集、知识的抽取和图谱的构建三部分的工作。在知识图谱构建的过程中所研究的主要内容如下:(1)研究了面向网络不良信息构建知识图谱的方法。基于现阶段知识图谱构建的发展现状结合本课题网络不良信息的数据源,总结出面向网络不良信息的知识图谱构建方法和步骤。在知识图谱的构建过程中使用自顶向下和自底向上相结合的方法。采用自顶向下的方式构建知识图谱的模式层(schema),而采用自底向上的方式构建知识图谱的数据层(data)。(2)研究基于深度置信网络的知识抽取算法。在非结构化文本的知识抽取阶段本文使用了基于深度置信网络的算法模型,该模型需要将词的特征向量和神经元节点等作为参数输入参数。所以需要先使用哈工大的语言云平台将语料进行了分词和词性标注处理,然后将处理后的语料使用Google的word2vec工具进行词特征向量提取。(3)实现知识图谱的构建和存储。本文针对网络不良信息进行了知识图谱的构建。文中通过采集中文维基百科、搜狗百科的实体分类结合相应的知识推理构建了知识图谱的模式层,而数据层的构建部分和数据采集时实体的分类信息密不可分。最后将融合好的数据信息录入到图数据库Neo4j之中。
面向网络不良信息的知识图谱构建方法研究
这是一篇关于知识抽取,知识图谱,知识存储,深度置信网络的论文, 主要内容为随着信息产业的发展,网络在给大家提供信息服务的同时也带来了一定的安全隐患。而现在的网络信息检测和过滤形式单一,无法满足信息产业发展的需要。而近年来知识图谱在信息检索中的高速发展为不良信息的检索和过滤带来了新的契机。所以本文提出了面向网络不良信息知识图谱构建方法的课题研究。本课题在现有的技术和算法基础上,进行面向网络不良信息的知识图谱的构建方法研究。本文的整体构建流程包含了数据的采集、知识的抽取和图谱的构建三部分的工作。在知识图谱构建的过程中所研究的主要内容如下:(1)研究了面向网络不良信息构建知识图谱的方法。基于现阶段知识图谱构建的发展现状结合本课题网络不良信息的数据源,总结出面向网络不良信息的知识图谱构建方法和步骤。在知识图谱的构建过程中使用自顶向下和自底向上相结合的方法。采用自顶向下的方式构建知识图谱的模式层(schema),而采用自底向上的方式构建知识图谱的数据层(data)。(2)研究基于深度置信网络的知识抽取算法。在非结构化文本的知识抽取阶段本文使用了基于深度置信网络的算法模型,该模型需要将词的特征向量和神经元节点等作为参数输入参数。所以需要先使用哈工大的语言云平台将语料进行了分词和词性标注处理,然后将处理后的语料使用Google的word2vec工具进行词特征向量提取。(3)实现知识图谱的构建和存储。本文针对网络不良信息进行了知识图谱的构建。文中通过采集中文维基百科、搜狗百科的实体分类结合相应的知识推理构建了知识图谱的模式层,而数据层的构建部分和数据采集时实体的分类信息密不可分。最后将融合好的数据信息录入到图数据库Neo4j之中。
面向海战场的知识建模与知识图谱构建研究与设计
这是一篇关于海战场,本体,知识建模,知识抽取,知识存储的论文, 主要内容为随着海战场信息化技术的开展,军事应用需求对海战场知识存储和挖掘提出了更高的要求。海战场数据包括水面、水下、上空和岛屿等海量空间数据,兼具装备、态势、事件等诸多类型,知识图谱技术弥补了传统数据库海量数据处理困难、建模方式不灵活、表现形式不直观、数据利用率低的不足,可提供海战场数据在军事指挥方面的重要知识参考。然而,知识图谱在海战场领域的应用并不成熟,较为完备的海战场知识系统亟需构建。本文以知识建模方法和知识图谱技术为主要技术点,构建面向海战场的知识模型和原型系统。本文主要工作如下:1)提出新的知识建模方法——基于需求的螺旋反馈法为解决面向海战场的知识模型构建问题,针对该知识体系军事需求较强的特点,提出七步法与螺旋模型相结合的基于需求的螺旋反馈法,完成了包含海战活动、海战装备、军事政治事件、专家先验知识等核心概念的海战场领域本体知识模型的构建。2)面向海战场的知识抽取为摆脱对人工定义特征的依赖,提高实体抽取效率,基于CBOW模型和BIO规则进行数据预处理,选择BiLSTM-CRF模型实现海战场数据实体抽取;针对海战场公开数据较少的问题,基于依存句法分析构建面向海战场的种子模板,选取Bootstrapping算法实现关系抽取。3)面向海战场的知识图谱实现与应用为满足海战场数据管理需要,借助Neo4j图数据库平台实现实体和实体间关系的存储,展示知识图谱可视化和查询效果,同时也展现了面向海战场的知识图谱在智能搜索、知识问答、智能推荐和作为解释机制方面的应用价值。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设项目助手 ,原文地址:https://bishedaima.com/lunwen/49216.html