9篇关于知识可视化的计算机毕业论文

今天分享的是关于知识可视化的9篇计算机毕业论文范文, 如果你的论文涉及到知识可视化等主题,本文能够帮助到你 面向企业信息抽取的关键技术研究与应用 这是一篇关于企业信息抽取

今天分享的是关于知识可视化的9篇计算机毕业论文范文, 如果你的论文涉及到知识可视化等主题,本文能够帮助到你

面向企业信息抽取的关键技术研究与应用

这是一篇关于企业信息抽取,实体识别,关系抽取,知识图谱,知识可视化的论文, 主要内容为企业简介是企业信息的重要来源之一,大量有价值的企业信息蕴藏在各种企业简介中,如何从企业简介中高效地抽取信息,是自动化构建企业信息管理系统的基础。企业命名实体识别和关系抽取是将机器学习、深度学习等技术应用于企业信息管理领域,准确、快速地实现企业信息的抽取,从而帮助企业快速地构建企业信息知识图谱,辅助企业决策。为此,本文以企业简介文本为基础,通过抽取企业相关实体与关系,实现企业信息抽取,具体工作如下:(1)针对传统的词向量模型无法有效表示企业文本,复杂命名实体识别模型预测消耗大量的计算机资源与时间的问题,基于知识蒸馏原理设计一种命名实体识别模型。为保证获得良好的知识蒸馏效果,以模型结构类似为基准,选取BERT+CRF作为教师模型、Bi GRU+CRF作为学生模型。同时,在学生模型训练过程中,通过在总误差损失中加入软标签误差(学生模型与教师模型的知识误差),在误差反向传播中缩小总误差损失,从而缩小软标签误差,使学生模型拟合教师模型的概率分布,从而达到近似教师模型的预测精度。最后使用学生模型进行命名实体识别,在较短预测时间的情况下,达到高的预测精度。经过实验对比,该方法能够在损失少量预测精度的同时,大幅度提高预测效率。(2)针对企业简介中一个句子包含多个三元组,并且多个三元组之间存在实体重叠的问题,采用一种基于规则的多阶段关系抽取方法。该方法首先使用已有的联合模型SPN4RE完成预选三元组的初始抽取。针对预选三元组存在错误三元组的问题,使用命名实体识别模型识别句子中所有的实体,使用文本分类模型识别句子中所有的关系,进而将预选三元组中可能存在错误实体与错误关系的三元组过滤掉。针对预选三元组存在遗漏三元组的问题,将句子中所有实体与所有关系按照预定义的三元组模式进行三元组补全,并基于预选三元组中出现频率最高的前N类三元组生成筛选模板,对补全后的三元组基于语义相似度进行自动化审核,最后将审核结果与针对预选三元组过滤后的结果进行合并,从而得到出最终的三元组集合。经过实验证明,该方法能够提升联合模型的F1值,且能高效解决企业实际应用中基于大规模知识构建企业知识图谱之前信息抽取的需要。(3)以上述研究为基础,设计了一个企业信息抽取系统。首先,该系统对企业简介进行有效文本识别,识别出企业简介中含有关系的句子。然后对有关系的句子进行实体识别和关系抽取,生成企业信息三元组,利用Neo4j进行企业信息的可视化展示,从而辅助企业从企业简介文本中准确地获取更多的有用知识。

纺纱学知识图谱构建与应用研究

这是一篇关于纺纱学,学科知识图谱,资源推荐,知识可视化的论文, 主要内容为在长期的生产、教学与实践环节中,纺纱学科积累了大量的学科资源,且数据规模庞大,多源异构现象明显。现有模式无法对学科资源进行有效管理与利用。知识图谱是一种基于图模型的知识管理、组织与表征技术,具备多模态复杂学科资源管理能力,且低成本、易维护,在纺织教学与产业培训方面潜力巨大。因此本文将知识图谱技术引入传统纺纱领域,构建纺纱学知识图谱,发挥出知识图谱在知识管理、知识表征等方面的优势,对学科内多源异构数据进行有效管理。同时为进一步探究纺纱学知识图谱的可应用性,进行二次开发,实现基于纺纱学知识图谱的学习系统。首先,研究分析了纺纱学的特点,提出了纺纱学知识图谱的初步规划:包含纺纱学科多样知识实体,清晰体现知识点层级结构与关联关系,同时以长文本对知识点进行描述,以链接形式对学科资源有效管理。依照此设想设计三阶段十流程的纺纱学知识图谱构建方法,并从数据规模、映射关系复杂度与资源结构化程度三个方面对知识图谱构建技术进行比选,确定纺纱学知识图谱构建的最优方法组合。其次,按照三阶段十流程方法,确定纺纱学领域核心概念、层级结构与知识间关系,完成知识图谱体系构建工作。核心概念确定为:原理、设备、工艺、质量、其他。学科知识点关系确定为:包含、继承、并行、前驱、后继、影响、对应与解释。借助Protégé完成纺纱学知识数据化,依次设置纺纱学知识实体、数据属性与对象属性,得到了含有纺纱学知识信息的RDF文件。运用Neo4j图数据库对RDF文件进行存储,可视化展示了学科知识点间的层级结构与关联关系,并结合实际应用需求,展示图谱的知识实体查询、关联关系查询、模糊匹配查询等功能。第三,为进一步探究纺纱学知识图谱的可应用性,以构建的图谱为基础进行二次开发,设计并实现纺纱学知识图谱学习系统。系统重点考虑纺纱知识的管理与学习需求,设计了用户服务、纺纱知识服务、学习路径推荐等模块。系统采用B/S架构开发,技术栈为Spring Boot+Vue+My SQL+Neo4j,实现了知识管理、知识查询、知识推荐与学习路径规划等功能。最后,以本科用户视角和高校老师视角为例,分别介绍了纺纱学知识学习和管理的界面展示与功能操作。该系统将纺纱学知识和学科资源有机地联系在一起,可作为纺织院校在线教学的有力辅助与补充,也可用作纺织产业培训的工具,帮助企业完善培训体系。

面向小麦病虫害领域的中文命名实体识别和关系抽取研究

这是一篇关于小麦病虫害,实体识别,实体关系抽取,知识图谱,知识可视化的论文, 主要内容为小麦是全球最重要的粮食作物之一,其种植面积与产量在粮食作物中占比较高。小麦种植过程中面临着许多挑战,各种各样的病虫害是影响小麦产量和品质的主要原因之一,有效的预防和防治措施能够促进小麦种植产业的发展。目前,丰富的小麦病虫害预防和防治措施等知识往往以非结构化文本的形式保存在网页、书籍和文献中,数据的存储、组织、表示及管理方式不尽相同,导致该领域数据处于分散混乱的状态,并且由于非结构化文本难以直观刻画出重要信息之间的关系,不利于知识的高效利用,也不利于知识的获取和共享,难以满足小麦生产管理者对病虫害知识更深层次和更细粒度的信息需求。知识抽取是一种组织和管理非结构化文本数据的有效方法,其目的是从非结构化数据中识别出相关命名实体,并抽取实体之间的关系,在知识图谱、知识检索、知识库问答等领域发挥着重要作用。本文为了提高小麦病虫害知识组织的有效性,以非结构化文本形式的小麦病虫害知识数据为研究对象,开展命名实体识别和关系抽取研究,分别提出了基于远程监督和有监督的小麦病虫害知识抽取模型,并实现了小麦病虫害知识的可视化展示。本文主要完成的工作内容如下:(1)基于远程监督的小麦病虫害中文实体关系抽取。针对小麦病虫害领域数据集匮乏问题,基于远程监督的思想,利用CN-DBpedia与Ownthink两个外部知识库中的相关三元组与小麦病虫害非结构化文本知识进行匹配对齐,并结合人工校正的方式构造了小麦病虫害中文实体关系抽取数据集Wheat CRE,该数据集蕴含6种关系类别。其次进一步分析了该数据集的文本特征,为了降低句内噪声词对模型的影响,提出了一种融合BERT与实体表征的单标签句子级实体关系抽取模型BE-CRE,该模型基于BERT获取动态字符表征,为了丰富文本特征,进一步融合了目标实体表征,充分利用小麦病虫害中文命名实体隐含的特定含义,为模型提供额外的有效信息,提升了模型在关系抽取任务中的效果。与当前主流模型相比,BE-CRE在Wheat CRE上表现最佳,F1-M值为89.29%,且BE-CRE在人物关系抽取数据集Character CRE上的表现优于对比模型,F1-M值为78.31%,证明该模型具有一定的泛化性。(2)基于有监督的小麦病虫害中文命名实体识别与关系抽取。远程监督利用外部知识库可以有效解决数据集匮乏问题,但其依赖于外部知识库的支撑,存在知识挖掘不充分的问题。为了深层次挖掘小麦病虫害非结构化文本中蕴含的知识,在前述研究的基础上,首先结合领域专家的指导和对农业领域已有研究的总结,深入剖析小麦病虫害文本知识,细粒度定义了21种实体类别和18种关系类别,并通过人工标注的方式,分别构建了小麦病虫害实体识别数据集Wpd CNER和关系抽取数据集Wpd CRE。针对实体类别增加带来的实体类别分布不均匀、实体边界模糊、实体嵌套等具体问题,提出一种融合ALBERT-Bi LSTM-CRF与规则的实体识别模型WPD-RA,该模型在Wpd CNER上识别的F1值为95.29%,优于当前主流模型。针对关系类别进一步多样化带来的关系重叠问题,提出一种融合BERT-Bi LSTM-Attention与实体表征的关系抽取模型WPD-BBAE,利用Attention动态分配权重,增强句中关键词的重要性,该模型在Wpd CRE上表现最佳,F1-M值为90.44%。(3)小麦病虫害知识的可视化展示。基于前述工作建立的知识抽取方法,首先对小麦病虫害领域的非结构化训练语料进行实体识别和关系抽取,得到了结构化的小麦病虫害实体关系三元组,经三元组去重处理,最终共得到2684个实体,5668个关系,实现了对小麦病虫害知识的细粒度挖掘与结构化整合。其次通过图数据库Neo4j对处理后的三元组数据进行存储,实现了小麦病虫害知识的可视化展示,为小麦病虫害知识的获取与共享提供途径。本文针对小麦病虫害领域的非结构化文本数据,分别提出了远程监督和有监督的小麦病虫害实体识别和关系抽取模型,可以为该领域知识的细粒度挖掘与结构化组织提供技术支撑,进而可以为构建该领域知识图谱、智能知识检索、智能问答等深层次知识利用发挥作用。

清代服饰设色知识数字化与可视化设计研究

这是一篇关于清代服饰,色彩文化,设色知识,知识可视化,知识图谱的论文, 主要内容为清代是中国封建王朝的尾声,清代传统服饰在多元民族文化互相吸收影响下,形成了纹饰色彩艳丽丰富、制作工艺精妙绝伦的特点,在中国服装史上占据重要地位。清代服饰色彩中不仅蕴含了历代延续下来的“五行五色”传统思想文化,其色彩搭配的理念与方法在今日也为当代设计师提供了源源不断的灵感与配色参考。清宫剧《延禧攻略》因其偏高级灰的后期影视调色深受观众喜爱,但不少观众却在营销号的引导下错把“莫兰迪色”当作“乾隆色谱”。设计师在面对海量文化知识时,易出现吸收不足、转化不当的情况,常导致设计作品中色彩盲目使用、文化内涵缺失。本文以面向设计师色彩应用为目的,挖掘清代传统服饰色彩设色规律知识内容,进行知识的数字化与可视化。首先对传统文化色彩研究体系进行梳理与分析,并根据设计应用转化时的知识需求,总结面向设计师应用的传统服饰色彩设色体系研究方法。从数据来源的可靠性、高质量性、权威性与全面性几个角度选择五个博物馆中的清代服饰馆藏数据作为研究数据集,构建清代服饰色彩数据库。接着依据设色体系研究方法,基于经典清代文化典籍与近代服饰色彩研究中的记载与描写,从物质色彩与非物质色彩两方面梳理了清代服饰色彩的色名记载、设色成因、设色表现与审美特征。通过对文化内涵和美学价值的总结分析,为清代服饰设色规律文化数据库的数字化与可视化建设提供了知识结构与内容储备。最后通过分析设计师用户知识获取、知识分析与知识应用的需求,结合非物质文化遗产数据库的常用可视化形式,基于知识图谱的可视化形式构建清代服饰色彩设色规律知识可视化交互平台。设计师能够通过可视化图谱,从清代服饰设色规律知识中获取色彩应用的文化意象、年代背景、适用人群、使用场合、产地机构、色彩特征、装饰工艺等信息,更好地实现传统色彩文化的现代转化。传统色彩相关文字记载浩如烟海,书中也往往缺少直观可见的实际色彩。通过建立起文字信息与馆藏实物色彩之间的知识关联,设计师用户可以系统性地了解知识网络结构,进行文化的横纵深入研究;亦可从中获取色彩应用的文化背景与内涵底蕴,做到用色有据,色有所考,在传统色彩的现代创新中不失文化内涵。

基于神经网络的生物医学文献知识抽取研究

这是一篇关于生物医学文献,知识抽取,表型实体识别,关系抽取,知识可视化的论文, 主要内容为生物医学文献是展示学术成果的主要方式之一。目前,海量的生物医学文献构成了一座巨大的知识库,已然成为生物医学领域最重要的资源。有价值的信息都蕴藏在各类生物医学文献中,因而如何从这些文献中有效且高效地获取有价值的信息,成为科研人员的研究重点之一。生物医学文献的实体识别和关系抽取是将机器学习、深度学习等技术应用于生物医学文献,准确、快速地抽取到生物医学的实体及其关系。生物医学的实体识别和关系抽取的研究能够辅助生物医学科研人员的研究工作,并且在生命科学领域具有广泛的应用价值。除此之外,生物医学实体识别和关系抽取作为后续任务的基础,直接影响到生物医学知识图谱的构建与应用。本文以从生物文献中抽取实体和关系为目标,主要开展了以下几点工作:(1)生物医学文献中的表型实体具有种类多,专业词较长,表型边界不明确,缩写多等问题,大多数方法不能较好的识别出多分类的生物医学表型实体。针对这些问题,本文提出了一种基于BGOC模型的方法。该模型加入了BERT(Bidirectional Encoder Representations from Transformers)生成的包含丰富句法和语义信息的词表示;使用Bi GRU(Bidirection Gate Recurrent Unit)从特征序列中更好地提取上下文信息的序列结构;使用ON-LSTM(Ordered Neurons Long Short-Term Memory)对神经元的顺序信息进行编码,能更长时间保留高层信息。该模型在多个数据集上均取得了最好的实验结果,证明了有效性。(2)生物医学实体关系抽取的研究大部分集中在句子的内部,而随着需要抽取的关系种类越多且越复杂,关系也从句子内部逐渐发展到句子之间。同时,一个生物医学实体所对应的三元组可能存在多个,而目前的方法大都是处理一个实体对应一个三元组关系。针对这些问题,本文提出了基于CBGS模型的实体关系联合抽取方法。该模型使用CNN(Convolutional Neural Network)来捕捉字符级特征表示,并加入GCN(Graph Convolutional Network)使得句子外部两个长距离实体间的信息被捕捉,最后采用Sigmoid函数解决多分类的问题。经过多个数据集的实验对比,该模型较其他方法能取得更好的实验结果,证明了有效性。(3)结合中国科学院上海营养与健康研究所的需求和以上两项研究,本文第五章设计了一个生物医学文献的知识抽取系统。首先,该系统对医学生物文献进行正文提取,再将正文输入到实体识别模块或者关系抽取模块抽取实体或关系,输出结果。对于生物医学三元组数据可以通过Neo4j进行知识可视化。该系统能够辅助科研人员从最新文献中获得有用的知识。

基于知识图谱的专业知识体系可视化系统设计与实现

这是一篇关于知识图谱,智慧教学,信息抽取,知识可视化的论文, 主要内容为高等教育是国家发展的一块基石,但中国的高等教育起步较晚,专业知识体系还不够完善,在教学中易造成知识点缺失或知识点冗余等问题,借助知识梳理和可视化手段可以解决专业培养体系中的问题。传统的知识梳理方法依赖专家的手动梳理,不仅费时费力,而且效率低下。知识图谱的出现打破了这个僵局,其依托于人工智能与自然语言处理技术,为知识的梳理及可视化带来了新的方向。为了更好的对专业知识结构进行梳理,对知识图谱构建中的三个关键步骤进行重点研究。首先针对预处理后专业教育的语料,设计了一种引入反馈机制的本体构建方法来构建合适的知识图谱本体。其次基于所构建的本体,在人工构建的数据集上对比主流的信息抽取模型,完成了知识图谱数据层的填充。在得到以课程为单位的知识子图后,利用实体对齐和先修关系挖掘连接各个课程的知识点形成跨课程的链路,从而构建专业知识图谱,其中设计并提取了课程上下文特征等四项特征进行知识点间的先修关系挖掘。通过专业知识图谱可以对课程知识点的分布及课程间的联系有清晰的认识,同时从知识冗余度与相关性等角度给出课程知识结构的分析报告,帮助课程进行迭代。结合专业教学实际情况和课程教学资源,设计了一套构建专业教育知识图谱的流程,同时基于知识可视化的需求,完成了功能模块设计和数据库设计,实现了一个完整的专业知识体系可视化系统。对系统进行了测试分析,结果表明该系统已初步具备基本的知识可视化功能与知识图谱管理功能,能够较好地满足实际需求,帮助师生去梳理课程结构,促进课程的改革和创新。

纺纱学知识图谱构建与应用研究

这是一篇关于纺纱学,学科知识图谱,资源推荐,知识可视化的论文, 主要内容为在长期的生产、教学与实践环节中,纺纱学科积累了大量的学科资源,且数据规模庞大,多源异构现象明显。现有模式无法对学科资源进行有效管理与利用。知识图谱是一种基于图模型的知识管理、组织与表征技术,具备多模态复杂学科资源管理能力,且低成本、易维护,在纺织教学与产业培训方面潜力巨大。因此本文将知识图谱技术引入传统纺纱领域,构建纺纱学知识图谱,发挥出知识图谱在知识管理、知识表征等方面的优势,对学科内多源异构数据进行有效管理。同时为进一步探究纺纱学知识图谱的可应用性,进行二次开发,实现基于纺纱学知识图谱的学习系统。首先,研究分析了纺纱学的特点,提出了纺纱学知识图谱的初步规划:包含纺纱学科多样知识实体,清晰体现知识点层级结构与关联关系,同时以长文本对知识点进行描述,以链接形式对学科资源有效管理。依照此设想设计三阶段十流程的纺纱学知识图谱构建方法,并从数据规模、映射关系复杂度与资源结构化程度三个方面对知识图谱构建技术进行比选,确定纺纱学知识图谱构建的最优方法组合。其次,按照三阶段十流程方法,确定纺纱学领域核心概念、层级结构与知识间关系,完成知识图谱体系构建工作。核心概念确定为:原理、设备、工艺、质量、其他。学科知识点关系确定为:包含、继承、并行、前驱、后继、影响、对应与解释。借助Protégé完成纺纱学知识数据化,依次设置纺纱学知识实体、数据属性与对象属性,得到了含有纺纱学知识信息的RDF文件。运用Neo4j图数据库对RDF文件进行存储,可视化展示了学科知识点间的层级结构与关联关系,并结合实际应用需求,展示图谱的知识实体查询、关联关系查询、模糊匹配查询等功能。第三,为进一步探究纺纱学知识图谱的可应用性,以构建的图谱为基础进行二次开发,设计并实现纺纱学知识图谱学习系统。系统重点考虑纺纱知识的管理与学习需求,设计了用户服务、纺纱知识服务、学习路径推荐等模块。系统采用B/S架构开发,技术栈为Spring Boot+Vue+My SQL+Neo4j,实现了知识管理、知识查询、知识推荐与学习路径规划等功能。最后,以本科用户视角和高校老师视角为例,分别介绍了纺纱学知识学习和管理的界面展示与功能操作。该系统将纺纱学知识和学科资源有机地联系在一起,可作为纺织院校在线教学的有力辅助与补充,也可用作纺织产业培训的工具,帮助企业完善培训体系。

巴蜀传统技艺知识图谱构建

这是一篇关于传统技艺,非物质文化遗产,知识图谱,Neo4j图数据库,知识可视化的论文, 主要内容为传统技艺属于非物质文化遗产的一类,包含当地人民在历史实践中不断传承下来的手工艺知识。巴蜀地区得天独厚的地理环境造就了内涵丰富的巴蜀传统技艺,然而其多元、活态等特点使其在展示时较有难度,难以满足大众的知识需求,不利于传承与发展。基于此提出问题:如何满足传统技艺的知识需求,多维度展示巴蜀传统技艺的内涵与关联?为此,拟以知识图谱技术实现对巴蜀传统技艺知识的深入挖掘与可视化展示。首先抓取文本资料作为数据来源,分析后展示出巴蜀传统技艺初印象,分析出语料特征;其次据此结合知识分类结果抽取出知识模型;然后对比选取数据存储技术路线,结合实际数据设计数据模型并构建数据集,导入图数据库完成数据存储;最终,基于图数据以知识图谱的形式为用户提供可视化展示服务与知识检索服务,满足用户知识需求。本文在数据上生成结构化程度较高的巴蜀传统技艺数据集;概念上构建了可通用的知识模型;应用上基于Neo4j技术构建了能提供多种知识服务的巴蜀传统技艺知识图谱。不足之处在于现有数据量较小,且随着新项目公布数据集需要持续维护,在未来争取扩大规模并增强现有路线可复用性。基于传统技艺的代表性,本文提出的研究方法具备参考性。

基于期刊论文的统计学科研究现状及热点趋势挖掘分析——基于中国学术期刊的研究

这是一篇关于统计学科,期刊论文,共词分析,知识可视化的论文, 主要内容为期刊论文是研究人员重要的研究成果之一,凝结着学者的学术观点,是学者们心血的结晶,是反映学科发展状态的直观载体,能够较大程度上反映出相关学科的发展情况和发展水平。从统计学科发展的角度来看,统计学于2011年2月成为一级学科,统计学的学科地位有所提升。相应的,统计学科在获得发展机遇的同时也存在很多新的挑战。统计学科的研究内容与研究热点至今依旧具有较高的研究意义与价值。本文从期刊论文作为学科研究现状与热点趋势挖掘分析的切入点,选取国内高水平统计学科高校与科研机构所发表的期刊论文进行分析,为统计学科研究人员与学者的选题与把握学科发展提供参考。本文对期刊论文的形式特征与内容特征进行深入研究。从形式特征中发现期刊论文发文量的时间变化及核心来源等信息,从内容特征中把握近十年统计学科研究现状与热点。本文构建高频关键词知识网络对关键词进行类团划分,引用多维尺度分析模型将高频关键词划分主题域,对关键词的设定方式进行论述。本文引入时间维度发掘统计学科研究现状及热点,基于知识图谱对2009年至2019年中每一年的研究热点从研究内容与研究方法两个角度进行论述,把握近十年统计学科期刊论文的发文热点趋势。本文针对关键词在一段时间内的突发程度回顾历年学科研究前沿,并对当今学科研究前沿进行预测。通过对统计学科学者发表的期刊论文进行研究,能够看出统计学科发展过程中的研究热点与研究趋势,得到如下主要结论:第一,统计学期刊论文发文数量为波动上升态势,发刊专题多为数学和社会学及统计学,较多论文受到基金支持且多为国家级基金支持;第二,学者对关键词设置主要分为研究内容与研究方法,对关键词的设置逐渐趋于具体化;第三,学者的研究对象与当下社会热点紧密相关;第四,统计学科作为工具性学科,其与多学科融合的情况不断显现,以此衍生出了统计学科的多个研究领域及方向;第五,随着对数据分析需求的不断升级,统计学研究热点逐渐多元化。

本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码货栈 ,原文地址:https://bishedaima.com/lunwen/47858.html

相关推荐

发表回复

登录后才能评论