基于中医古籍的知识图谱构建与应用
这是一篇关于命名实体识别,关系抽取,知识图谱,深度神经网络,中医古籍的论文, 主要内容为中医学是中国古代医学的瑰宝,是历代医家思想、文化以及智慧的结晶。中医古籍是中医学发展的主要知识载体,记载了中华民族几千年的医学知识以及实践经验,如《黄帝内经》、《伤寒论》、《金匮要略》等中医古籍文献承载了中医基础理论和临床方剂的核心知识,历经几千年的临床验证和发展,极具医学研究及临床价值。在人工智能和大数据技术时代,进行中医古籍文献知识的挖掘和利用是中医药学传承与创新发展的重要基础任务之一,但仍存在如下显著挑战:(1)中医古籍容量巨大,且都是以书籍的形式记载,数据以非结构化文本为主要形式,古籍数据如命名实体等的人工处理与提取耗时耗力。(2)古籍文献都是以文言文进行记录,文言文所用字词简练,与现代文在词汇和语义上存在较大不同,用于人工智能分析的标准数据集尤为缺乏,因此,给计算机方法从古籍文献进行自动抽取提供了较大障碍。(3)以临床诊疗辅助为目标,如何对中医古籍关系知识进行快速查询与应用也存在较大问题。针对以上问题,本文主要从以下三方面开展研究。1)基于深度神经网络的中医古籍命名实体识别研究。本文通过人工方式对古籍文献数据进行命名实体标注和审核,并形成了具有1179408样本的标准语料库,该语料库包含11种命名实体类型及1895210个实体,为开展面向中医古籍的命名实体抽取方法研究提供了重要数据基础;通过Word2Vec、ELMo、BERT不同方法构建词嵌入模型并作为输入通过BILSTM+CRF模型进行命名实体识别任务。最终实验结果中BERT+BILSTM+CRF模型获得了最好的实验效果,精确率达到83.07%,F1值达到83.25%。其中结果相对较差的模型Word2Vec+BILSTM+CRF精确率也达到了80.16%,F1值达到了80.34%,总体上在古籍实体抽取中获得了良好的实验结果。2)基于深度神经网络的中医古籍实体关系抽取研究。首先通过人工方式对古籍文献数据进行实体关系的标注和审核并形成标准语料库,最终从662本古籍文献中得到90705条关系数据。基于此关系抽取标准语料库,分别利用BERT+BILSTM+CRF的pipeline方法以及PCNN+ATT方法进行直接关系抽取。其中PCNN+ATT方法进行关系抽取得到63.25%的精确率以及63.57%的F1值。而相比之下,基于BERT+BILSTM+CRF进行命名实体识别再进行关系抽取的pipeline方法得到61.43%的精确率和61.99%的F1值。实验也验证了基于注意力机制的方法在关系抽取上取得相对好的效果。3)中医古籍知识图谱库构建与案例分析。采用Neo4j图形数据库进行中医古籍知识图谱库构建,将人工标注以及智能抽取审核的关系数据存储到知识图谱平台中,形成共计119380个实体以及164028条关系的中医古籍知识库。进一步,我们基于Neo4j搭建的前端可视化平台,为该知识图谱的查询和利用提供了便捷技术支持。
探求中医消渴病文献知识规律与数据库构建策略研究
这是一篇关于消渴,中医古籍,知识元,数据库的论文, 主要内容为目的挖掘整理消渴病文献,研究消渴病知识规律。利用“病脉证并治”知识元标引系统进行标引实践,依据标引结果在“病脉证并治”知识元标引系统的基础上,提出构建消渴病专病数据库的策略与建议。方法利用国家重点研发计划“中医药现代化研究”重点专项项目“基于知识元理论与临床需求深度融合的中医古籍整理及专题文献研究”中所选600种古籍,进行消渴病文献的挖掘整理工作。依托于国家重点研发计划立项的中医古籍“病脉证并治”知识元标引系统,确定文献入选标准和文献排除标准,选取代表性消渴病文献进行数据库标引。依据标引结果,导出各类数据和知识图谱。针对标引数据进行古籍文献内涵的探析,以此结果来论证以数据挖掘形成的文献数据结果,能否更好地体现消渴病古籍文献内涵。多角度地依据数据结果展示古籍文献关于消渴病理论与诊治预防调护等成果,并依据标引结果,在“病脉证并治”知识元标引系统和“中医古籍知识共享服务平台”的基础上,提出构建消渴病专病数据库的策略与建议。结论通过对消渴病的文献进行整理分析,发现消渴病的别名众多,大都是以病症、病因、病位和病性这四大框架对消渴病进行分类命名。消渴病病因主要有饮食不节、禀赋不足、服芳香石药、情志失调、外感六淫、劳欲过度、虫积和外伤八个方面。病机总为阴亏燥热,常相互影响。治疗消渴病以养阴生津、清热润燥为主,注重活血化瘀和化痰利湿,同时需要在脏腑上对肺、胃和肾都有所侧重。在治疗消渴病除应用健脾、益气、清热的药物外,还应灵活运用化痰除湿药物,更要注重活血、化瘀、行气、通络方法的运用。通过对针灸治疗消渴病的腧穴进行统计,发现主要以生津止渴、补肾助阳、清热泻火等为取穴原理。本病的预防主要是合理化的饮食和适当的运动。从标引数据结果来看,“病脉证并治”知识元标引系统所提供的模板标引方法使得知识结构更加清晰,且降低了工作人员的标引难度。在标引过程中也发现系统存在诸多的问题,例如结构比较简单、语义粒度较大。鉴于此,在构建中医古籍消渴专病数据库时,可考虑建设单层数据库、并行数据库和混合数据库。可使消渴病复杂知识转变为标准化语义单元,提高访问速度,改进库与库间的运行效率,优化资源的调配与分析,灵活处理中医古籍表达所带来的非标准化的问题,对中医消渴病古籍知识进行深入的剖析与呈现。同时可以提高搜索精度,改善人工标引的错误与分类不明确的问题。
温病学派古籍的知识图谱构建与应用
这是一篇关于温病学派,中医古籍,知识建模,知识图谱,知识问答的论文, 主要内容为目的:温病学派古籍记载的大量碎片化知识及相关条文,研究温病学派古籍为主题的知识图谱构建及应用方法,可为温病学派古籍知识的合理组织及推荐应用开辟新思路,促进中医药古籍知识的高效组织、有效继承与良好发展。方法:1.知识表示与建模:以温病学派古籍文献为知识来源,对其中包含的知识元素的概念类型、属性及知识结构等进行总结,刻画,对知识元素间的相关性进行共现分析,明确核心概念,构建反映温病学派古籍知识体系的知识模型,为后续知识图谱的构建奠定基础。2.知识图谱构建研究:对获取的古籍文本数据,通过doccano文本标注平台进行命名实体标注,借助自然语言处理工具包Han LP,编写Python代码实现基于规则和自定义词典的知识抽取与命名实体识别,并结合人工校对获得相关实体。对获得实体进行知识规范化及实体对齐,结合实体间关系,采用基于Anaconda3平台,Jupyter Notebook(Python3.8)使用py2neo库进行批量导入,建立温病学派古籍知识图谱。3.知识图谱应用探索:以前述研究构建的知识图谱为基础,选择Java作为程序设计语言,采用HTML5+Java Script+j Query+Vue+Element UI进行前端开发,采用Spring Boot+Spring MVC+Spring Data JPA进行后端开发,使用Echarts进行可视化展示,前后端通过Ajax实现数据交互,数据库方面采用Neo4j+SQLite数据库存储信息,构建温病学派古籍知识问答系统。结果:1.知识表示与建模:对温病学派古籍原文进行整理,共得到4996条有效数据,将其分为中药、方剂、医理三大主题。根据对知识结构的分析,中药类,方剂类主题内包含的知识元素较为一致,且结构相似,医理类主题条文表述自由,包含信息复杂,涉及概念种类丰富,缺乏一定的规律性。通过对概念及属性间的共现分析确定纳入最终知识模型的概念及属性并根据语义对概念间关系进行设计,完成知识建模。知识模型共包含相关概念7个,属性18个,概念间关系13条。2.知识图谱构建研究:对获得的温病学派古籍文本进行实体抽取,知识规范化及实体对齐等,最终获得1408个规范化表述的实体及16629条实体间关系,并导入Neo4j图数据库中进行存储。3.知识图谱应用探索:以构建的知识图谱为基础,从功能需要,用户需求等入手设计并实现温病学派古籍知识问答系统。结论:构建温病学派古籍知识图谱能够很好的将知识进行组织和整合,辅助建立更为全面、完整的知识体系,知识图谱作为知识组织的有力工具,其优势为对复杂关系的支持及直观、便捷的展示,故使用知识图谱组织温病学派古籍知识是正确的选择。通过构建知识图谱并结合知识问答,知识检索相关技术能够实现对温病学派古籍内知识的快速获取,为温病学派古籍的信息化奠定基础。
温病学派古籍的知识图谱构建与应用
这是一篇关于温病学派,中医古籍,知识建模,知识图谱,知识问答的论文, 主要内容为目的:温病学派古籍记载的大量碎片化知识及相关条文,研究温病学派古籍为主题的知识图谱构建及应用方法,可为温病学派古籍知识的合理组织及推荐应用开辟新思路,促进中医药古籍知识的高效组织、有效继承与良好发展。方法:1.知识表示与建模:以温病学派古籍文献为知识来源,对其中包含的知识元素的概念类型、属性及知识结构等进行总结,刻画,对知识元素间的相关性进行共现分析,明确核心概念,构建反映温病学派古籍知识体系的知识模型,为后续知识图谱的构建奠定基础。2.知识图谱构建研究:对获取的古籍文本数据,通过doccano文本标注平台进行命名实体标注,借助自然语言处理工具包Han LP,编写Python代码实现基于规则和自定义词典的知识抽取与命名实体识别,并结合人工校对获得相关实体。对获得实体进行知识规范化及实体对齐,结合实体间关系,采用基于Anaconda3平台,Jupyter Notebook(Python3.8)使用py2neo库进行批量导入,建立温病学派古籍知识图谱。3.知识图谱应用探索:以前述研究构建的知识图谱为基础,选择Java作为程序设计语言,采用HTML5+Java Script+j Query+Vue+Element UI进行前端开发,采用Spring Boot+Spring MVC+Spring Data JPA进行后端开发,使用Echarts进行可视化展示,前后端通过Ajax实现数据交互,数据库方面采用Neo4j+SQLite数据库存储信息,构建温病学派古籍知识问答系统。结果:1.知识表示与建模:对温病学派古籍原文进行整理,共得到4996条有效数据,将其分为中药、方剂、医理三大主题。根据对知识结构的分析,中药类,方剂类主题内包含的知识元素较为一致,且结构相似,医理类主题条文表述自由,包含信息复杂,涉及概念种类丰富,缺乏一定的规律性。通过对概念及属性间的共现分析确定纳入最终知识模型的概念及属性并根据语义对概念间关系进行设计,完成知识建模。知识模型共包含相关概念7个,属性18个,概念间关系13条。2.知识图谱构建研究:对获得的温病学派古籍文本进行实体抽取,知识规范化及实体对齐等,最终获得1408个规范化表述的实体及16629条实体间关系,并导入Neo4j图数据库中进行存储。3.知识图谱应用探索:以构建的知识图谱为基础,从功能需要,用户需求等入手设计并实现温病学派古籍知识问答系统。结论:构建温病学派古籍知识图谱能够很好的将知识进行组织和整合,辅助建立更为全面、完整的知识体系,知识图谱作为知识组织的有力工具,其优势为对复杂关系的支持及直观、便捷的展示,故使用知识图谱组织温病学派古籍知识是正确的选择。通过构建知识图谱并结合知识问答,知识检索相关技术能够实现对温病学派古籍内知识的快速获取,为温病学派古籍的信息化奠定基础。
基于深度学习的中医古籍自然语言处理研究
这是一篇关于深度学习,神经网络,自然语言处理,实体识别,关系抽取,知识图谱,中医古籍的论文, 主要内容为目的:中医学经过几千年的传承与发展,积累了大量的中医古籍文本数据,具有完整的知识理论体系和临床指导价值,因此对中医古籍进行自然语言处理研究具有重要的意义。本文对中医古籍文献《金匮要略》进行数据处理和标注形成标准化的数据集。在命名实体识别和关系抽取任务中建立适用于中医古籍的深度学习网络模型,并且将抽取出的信息结合人工审核储存到图数据库中构建中医古籍知识图谱。方法:对于中医古籍的命名实体识别任务,本文建立了一种ALBERT-BiLSTM-CRF模型,使用ALBERT预训练模型完成词嵌入后,将词向量输入到BiLSTM神经网络隐含层中,BiLSTM结构可以进一步提取语义特征,对学习内容具有长时性,有效解决了梯度爆炸的问题,为了解决输出标签之间的相互依赖的问题,选择CRF最后作为最后的输出层。本文在经过数据预处理的中医古籍数据集上做了多组对比实验。对于中医古籍文本的关系抽取任务,本文使用Cas Rel深度学习神经网络进行了关系抽取实验。模型使用BERT预训练模型作为编码器,解码器主要包括Subject Tagger、Relation-Specific Object Tagger,可以抽取出Subject实体,并且标记每一个Subject实体所有可能的Relation和相应的Object实体,从而得到实体关系三元组(Subject、Relation、Object)。在知识图谱构建方面,经过命名实体识别与关系抽取后,本文结合人工审核整理形成实体以及实体之间关系的数据,并且将数据存储到了Neo4j图数据库中。结果:在命名实体识别任务中,本文建立的ALBERT-BiLSTM-CRF模型在标注完成后的数据集上识别全部实体的精确率为95.65%,召回率为93.97%,F1值为94.80%,并通过实验找到了最适合模型的参数。相比于其他四种模型性能最优,相较于BERT-RNN-CRF模型F1值提升了3.87个百分点,相较于BERT-LSTM-CRF模型F1值提升了2.76个百分点,相较于BERT-BiLSTM-CRF模型F1值提升了1.75个百分点,相较于ALBERT-CRF模型F1值提升了6.3个百分点。本文使用了基于Cas Rel模型的关系抽取方法,实验结果的精确率为71.64%,召回率为76.12%,F1值为73.81%。最后本文将抽取到信息结合人工审核整理成为6个实体CSV文件和5个关系CSV文件,并且存储到了Neo4j图数据库中,共计1411个实体节点与2081个关系。结论:实验结果表明,基于ALBERT-BiLSTM-CRF中医古籍命名识别模型在标注后的数据上取得了良好的效果,性能优于其他算法。在保证识别效果的前提下,Albert的参数量更少,因此更适合于中医古籍的命名实体识别研究。在中医古籍关系数据集上,Cas Rel模型取得较好的实验结果,可以用于中医古籍文本的关系抽取任务。本文构建的中医古籍知识图谱为后续的辅助诊疗、智能问答系统等应用做了基础工作,为中医古籍现代化研究做出了一些贡献。
温病学派古籍的知识图谱构建与应用
这是一篇关于温病学派,中医古籍,知识建模,知识图谱,知识问答的论文, 主要内容为目的:温病学派古籍记载的大量碎片化知识及相关条文,研究温病学派古籍为主题的知识图谱构建及应用方法,可为温病学派古籍知识的合理组织及推荐应用开辟新思路,促进中医药古籍知识的高效组织、有效继承与良好发展。方法:1.知识表示与建模:以温病学派古籍文献为知识来源,对其中包含的知识元素的概念类型、属性及知识结构等进行总结,刻画,对知识元素间的相关性进行共现分析,明确核心概念,构建反映温病学派古籍知识体系的知识模型,为后续知识图谱的构建奠定基础。2.知识图谱构建研究:对获取的古籍文本数据,通过doccano文本标注平台进行命名实体标注,借助自然语言处理工具包Han LP,编写Python代码实现基于规则和自定义词典的知识抽取与命名实体识别,并结合人工校对获得相关实体。对获得实体进行知识规范化及实体对齐,结合实体间关系,采用基于Anaconda3平台,Jupyter Notebook(Python3.8)使用py2neo库进行批量导入,建立温病学派古籍知识图谱。3.知识图谱应用探索:以前述研究构建的知识图谱为基础,选择Java作为程序设计语言,采用HTML5+Java Script+j Query+Vue+Element UI进行前端开发,采用Spring Boot+Spring MVC+Spring Data JPA进行后端开发,使用Echarts进行可视化展示,前后端通过Ajax实现数据交互,数据库方面采用Neo4j+SQLite数据库存储信息,构建温病学派古籍知识问答系统。结果:1.知识表示与建模:对温病学派古籍原文进行整理,共得到4996条有效数据,将其分为中药、方剂、医理三大主题。根据对知识结构的分析,中药类,方剂类主题内包含的知识元素较为一致,且结构相似,医理类主题条文表述自由,包含信息复杂,涉及概念种类丰富,缺乏一定的规律性。通过对概念及属性间的共现分析确定纳入最终知识模型的概念及属性并根据语义对概念间关系进行设计,完成知识建模。知识模型共包含相关概念7个,属性18个,概念间关系13条。2.知识图谱构建研究:对获得的温病学派古籍文本进行实体抽取,知识规范化及实体对齐等,最终获得1408个规范化表述的实体及16629条实体间关系,并导入Neo4j图数据库中进行存储。3.知识图谱应用探索:以构建的知识图谱为基础,从功能需要,用户需求等入手设计并实现温病学派古籍知识问答系统。结论:构建温病学派古籍知识图谱能够很好的将知识进行组织和整合,辅助建立更为全面、完整的知识体系,知识图谱作为知识组织的有力工具,其优势为对复杂关系的支持及直观、便捷的展示,故使用知识图谱组织温病学派古籍知识是正确的选择。通过构建知识图谱并结合知识问答,知识检索相关技术能够实现对温病学派古籍内知识的快速获取,为温病学派古籍的信息化奠定基础。
温病学派古籍的知识图谱构建与应用
这是一篇关于温病学派,中医古籍,知识建模,知识图谱,知识问答的论文, 主要内容为目的:温病学派古籍记载的大量碎片化知识及相关条文,研究温病学派古籍为主题的知识图谱构建及应用方法,可为温病学派古籍知识的合理组织及推荐应用开辟新思路,促进中医药古籍知识的高效组织、有效继承与良好发展。方法:1.知识表示与建模:以温病学派古籍文献为知识来源,对其中包含的知识元素的概念类型、属性及知识结构等进行总结,刻画,对知识元素间的相关性进行共现分析,明确核心概念,构建反映温病学派古籍知识体系的知识模型,为后续知识图谱的构建奠定基础。2.知识图谱构建研究:对获取的古籍文本数据,通过doccano文本标注平台进行命名实体标注,借助自然语言处理工具包Han LP,编写Python代码实现基于规则和自定义词典的知识抽取与命名实体识别,并结合人工校对获得相关实体。对获得实体进行知识规范化及实体对齐,结合实体间关系,采用基于Anaconda3平台,Jupyter Notebook(Python3.8)使用py2neo库进行批量导入,建立温病学派古籍知识图谱。3.知识图谱应用探索:以前述研究构建的知识图谱为基础,选择Java作为程序设计语言,采用HTML5+Java Script+j Query+Vue+Element UI进行前端开发,采用Spring Boot+Spring MVC+Spring Data JPA进行后端开发,使用Echarts进行可视化展示,前后端通过Ajax实现数据交互,数据库方面采用Neo4j+SQLite数据库存储信息,构建温病学派古籍知识问答系统。结果:1.知识表示与建模:对温病学派古籍原文进行整理,共得到4996条有效数据,将其分为中药、方剂、医理三大主题。根据对知识结构的分析,中药类,方剂类主题内包含的知识元素较为一致,且结构相似,医理类主题条文表述自由,包含信息复杂,涉及概念种类丰富,缺乏一定的规律性。通过对概念及属性间的共现分析确定纳入最终知识模型的概念及属性并根据语义对概念间关系进行设计,完成知识建模。知识模型共包含相关概念7个,属性18个,概念间关系13条。2.知识图谱构建研究:对获得的温病学派古籍文本进行实体抽取,知识规范化及实体对齐等,最终获得1408个规范化表述的实体及16629条实体间关系,并导入Neo4j图数据库中进行存储。3.知识图谱应用探索:以构建的知识图谱为基础,从功能需要,用户需求等入手设计并实现温病学派古籍知识问答系统。结论:构建温病学派古籍知识图谱能够很好的将知识进行组织和整合,辅助建立更为全面、完整的知识体系,知识图谱作为知识组织的有力工具,其优势为对复杂关系的支持及直观、便捷的展示,故使用知识图谱组织温病学派古籍知识是正确的选择。通过构建知识图谱并结合知识问答,知识检索相关技术能够实现对温病学派古籍内知识的快速获取,为温病学派古籍的信息化奠定基础。
温病学派古籍的知识图谱构建与应用
这是一篇关于温病学派,中医古籍,知识建模,知识图谱,知识问答的论文, 主要内容为目的:温病学派古籍记载的大量碎片化知识及相关条文,研究温病学派古籍为主题的知识图谱构建及应用方法,可为温病学派古籍知识的合理组织及推荐应用开辟新思路,促进中医药古籍知识的高效组织、有效继承与良好发展。方法:1.知识表示与建模:以温病学派古籍文献为知识来源,对其中包含的知识元素的概念类型、属性及知识结构等进行总结,刻画,对知识元素间的相关性进行共现分析,明确核心概念,构建反映温病学派古籍知识体系的知识模型,为后续知识图谱的构建奠定基础。2.知识图谱构建研究:对获取的古籍文本数据,通过doccano文本标注平台进行命名实体标注,借助自然语言处理工具包Han LP,编写Python代码实现基于规则和自定义词典的知识抽取与命名实体识别,并结合人工校对获得相关实体。对获得实体进行知识规范化及实体对齐,结合实体间关系,采用基于Anaconda3平台,Jupyter Notebook(Python3.8)使用py2neo库进行批量导入,建立温病学派古籍知识图谱。3.知识图谱应用探索:以前述研究构建的知识图谱为基础,选择Java作为程序设计语言,采用HTML5+Java Script+j Query+Vue+Element UI进行前端开发,采用Spring Boot+Spring MVC+Spring Data JPA进行后端开发,使用Echarts进行可视化展示,前后端通过Ajax实现数据交互,数据库方面采用Neo4j+SQLite数据库存储信息,构建温病学派古籍知识问答系统。结果:1.知识表示与建模:对温病学派古籍原文进行整理,共得到4996条有效数据,将其分为中药、方剂、医理三大主题。根据对知识结构的分析,中药类,方剂类主题内包含的知识元素较为一致,且结构相似,医理类主题条文表述自由,包含信息复杂,涉及概念种类丰富,缺乏一定的规律性。通过对概念及属性间的共现分析确定纳入最终知识模型的概念及属性并根据语义对概念间关系进行设计,完成知识建模。知识模型共包含相关概念7个,属性18个,概念间关系13条。2.知识图谱构建研究:对获得的温病学派古籍文本进行实体抽取,知识规范化及实体对齐等,最终获得1408个规范化表述的实体及16629条实体间关系,并导入Neo4j图数据库中进行存储。3.知识图谱应用探索:以构建的知识图谱为基础,从功能需要,用户需求等入手设计并实现温病学派古籍知识问答系统。结论:构建温病学派古籍知识图谱能够很好的将知识进行组织和整合,辅助建立更为全面、完整的知识体系,知识图谱作为知识组织的有力工具,其优势为对复杂关系的支持及直观、便捷的展示,故使用知识图谱组织温病学派古籍知识是正确的选择。通过构建知识图谱并结合知识问答,知识检索相关技术能够实现对温病学派古籍内知识的快速获取,为温病学派古籍的信息化奠定基础。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码港湾 ,原文地址:https://bishedaima.com/lunwen/52312.html