蒙古文民族工艺美术资源系统设计与实现
这是一篇关于蒙古文,民族工艺,MVC,CSS3的论文, 主要内容为随着互联网技术的不断发展,越来越多的行业开始借助计算机软件完成一些运算较为困难,数据较为庞大的工作。一些数据量较大的资源库,不再以单一的纸质形式存储,而是将数据录入到资源管理系统中,增强数据的稳定性及安全性。现阶段网站建设的门槛变得越来越低,其中涉及的核心技术和要点也变得越来越普及和完善。但与此同时,由于蒙古文特殊的书写方式对网站的页面布局产生了一系列的要求,这对网站的设计产生了一定局限性,目前蒙古文网站的开发和管理技术仍处于不断探索的阶段。民族工艺美术资源库为民族工艺美术资源产业的样本管理提供数字化技术支持,资源库系统支持大规模、多种类艺术样品的录入、审核、编辑、删除、管理、分类、分级、用户管理以及日志管理等功能。样品的数据资源包括文本、图片、音频、视频、二维数据和三维数据等,以满足客户群需要。为适应少数民族地区的特殊需要,系统需采用蒙古文和汉语双语进行工艺美术样本的描述。而国内目前还没有成熟的蒙汉双语样本库。本文主要介绍了蒙古文民族工艺美术资源系统的设计与实现,系统采用B/S的体系架构。系统实现采用MVC设计模式,使用Spring+SpringMVC+Mybatis框架,使用MySQL数据库存储后台数据。结合现阶段内蒙古地区对于民族工艺美术资源的保护情况,经过对蒙文用户实际需求的分析,设计并实现了主要为蒙文用户提供资源管理服务的蒙古文民族工艺美术资源系统。系统能够稳定地提供资源管理服务,完成设计目标。
基于WordNet的蒙古文领域知识图谱构建方法研究
这是一篇关于WordNet,知识图谱,IC值,语义相似度,蒙古文的论文, 主要内容为知识图谱是一种采用可视化方式展示知识库中包含的各类知识要素的语义网络,随着近年来科学技术的不断创新,语言信息处理开始着眼于知识图谱这一可视化展示方法。自然语言处理,特别是蒙古文信息处理目前着重解决语义问题,所以词汇语义网和知识图谱等成为当下研究的热点。本文的所有数据均来自于WordNet底层数据库,这是因为几乎所有的概念信息都包含在WordNet当中。目前部分本体库、语义词典甚至于蒙古文名词语义网等都是以WordNet为基础而设计的。本文以Word Net为数据来源,提高了资源的利用率,与非结构化数据相比,减少了对资源预处理,节约了时间,加快了构建速度。本文对构建过程进行了深入研究,具体各项研究内容如下:1、首先分析影响语义相似度的参数,在综合分析各参数的优劣势后将概念信息量(Information Content,IC)定为参数,并在已有算法的基础上提出了改进的IC值计算模型。本文在基于WordNet自身结构的同时考虑到WordNet每个概念在语义树中的深度以及概念的子节点数来计算概念IC值。经过实验验证,改进后的IC计算模型更符合WordNet语义树的特征。2、在选定语义相似度参数后,对现有算法展开了剖析。最后,结合IC参数,给出了语义相似度计算的新模型,该模型还将概念的语义距离考虑在内,通过实验检验发现改进后的语义相似度模型在计算的语义相似度值与人工打分的相关系数高于其它计算方法,这说明该算法模型优于其它计算模型。3、概念以及概念间关系的抽取是构建知识图谱最为关键的一步,本文顶层概念的抽取是利用语义相似度算法的改进模型进行的,然后根据WordNet底层数据库获得概念集以及各概念间的关系。4、本文知识图谱的构建是按以下的流程进行的:基于人工将目标领域划分为彼此不包含的子领域,并为每个子领域设定一个核心概念,利用语义相似度算法获得每个子领域的顶层概念。根据顶层概念借助WordNet底层数据库获得每个子领域的初始概念集。然后重新利用语义相似度算法求每个子领域的初始概念集与其余子领域的顶层概念的语义相似度值,获得目标领域的最终概念集。将最终概念集利用蒙古文WordNet进行映射获得相对应的蒙古文词汇,最后利用图形数据库理论,使所构建的目标领域知识图谱可视化展示。5、蒙古文计算机领域知识图谱的构建是对本文基于WordNet蒙古文领域知识图谱构建方法的检验,展示了具体的构建流程,将对之后蒙古文知识图谱的进一步完善有一定的参考价值。
蒙古文民族工艺美术资源系统设计与实现
这是一篇关于蒙古文,民族工艺,MVC,CSS3的论文, 主要内容为随着互联网技术的不断发展,越来越多的行业开始借助计算机软件完成一些运算较为困难,数据较为庞大的工作。一些数据量较大的资源库,不再以单一的纸质形式存储,而是将数据录入到资源管理系统中,增强数据的稳定性及安全性。现阶段网站建设的门槛变得越来越低,其中涉及的核心技术和要点也变得越来越普及和完善。但与此同时,由于蒙古文特殊的书写方式对网站的页面布局产生了一系列的要求,这对网站的设计产生了一定局限性,目前蒙古文网站的开发和管理技术仍处于不断探索的阶段。民族工艺美术资源库为民族工艺美术资源产业的样本管理提供数字化技术支持,资源库系统支持大规模、多种类艺术样品的录入、审核、编辑、删除、管理、分类、分级、用户管理以及日志管理等功能。样品的数据资源包括文本、图片、音频、视频、二维数据和三维数据等,以满足客户群需要。为适应少数民族地区的特殊需要,系统需采用蒙古文和汉语双语进行工艺美术样本的描述。而国内目前还没有成熟的蒙汉双语样本库。本文主要介绍了蒙古文民族工艺美术资源系统的设计与实现,系统采用B/S的体系架构。系统实现采用MVC设计模式,使用Spring+SpringMVC+Mybatis框架,使用MySQL数据库存储后台数据。结合现阶段内蒙古地区对于民族工艺美术资源的保护情况,经过对蒙文用户实际需求的分析,设计并实现了主要为蒙文用户提供资源管理服务的蒙古文民族工艺美术资源系统。系统能够稳定地提供资源管理服务,完成设计目标。
基于WordNet的蒙古文名词语义网上下位语义关系树构造方法的研究
这是一篇关于WordNet,蒙古文,名词语义网,上下位语义关系,构建方法的论文, 主要内容为英文WordNet是以词汇语义为基本节点,以词汇之间的各种语义关系为连接方式而构建的复杂网络。它的构建为自然语言处理中的机器翻译、语义信息提取、自动文摘、信息检索等相关应用提供了基础性的语义信息。而蒙古文词汇语义网,是希望借用英文WordNet现有的各种语义关系,结合蒙古文自身的特点而构建的语义网络。它的构建成功同样将为蒙古文的相关语义信息处理工作提供不小的辅助。本文研究的蒙古文名词语义网上下位语义关系树的构建,是蒙古文词汇语义网中的名词子网的一种十分重要的语义关系的构建,而且该语义关系子网的构建成功,将对蒙古文词汇语义网其他语义关系子网的构建提供可直接借鉴的思路与方法。 作为词汇语义网,需要有丰富的词汇来源,为此本文选择了《蒙古语语义信息词典》的名词分库作为蒙古文名词语义网的基本词汇库,因为该词典中恰好是以词汇语义为基本词条,而不是一般词典的那种以词形作为基本词条的组织方式,这将为我们的工作提供很大的便利。而为了借用英文WordNet中的各种语义关系体系,本文使用了东南大学提供的英文WordNet的底层词汇语义关系数据库。 本文在研究了英文WordNet的基本架构和各种语义关系的基础上,又参考了同属于词汇语义网络的“中文概念词典”的构建方法。“中文概念词典”直接借用了英文WordNet本身的语义关系体系,这一点本文的意图与它相同,但是它所采用的将英文语义节点直接翻译成中文的构建方法无法被本文直接借鉴,因为本文利用的词汇来源——《蒙古语语义信息词典》中的蒙古文名词词汇量远小于英文WordNet中的名词词汇量。最终我们设计了自己独有的从蒙古文同义词集合向英文WordNet映射的构建方式。 为了方便有效地构建蒙古文名词语义网上下位语义关系树,以及为了方便今后对它的查询和修改,本文设计开发了一款可视化的网络管理应用平台。在该平台的帮助下,词典编辑人员可以进行从《蒙古语语义信息词典》中抽取的名词同义词集合向英文WordNet映射的工作,可以查看建立好的上下位语义关系树的任何局部,还可以对该树进行增加删除节点、子树移动、断绝上下位关系的操作;而普通用户可以利用该平台的查询模块完成对某蒙古文单词的包括上位关系、同义关系、反义关系等十几种语义关系的对应词汇的查询工作。为了完成这款网络平台,本文研究使用了java语言的MVC编程框架,即利用JSP页面向用户显示一个可视化的管理应用平台,并在底层使用ACCESS数据库存储从《蒙古语语义信息词典》和英文WordNet中抽取的词汇信息。 同时为了完成蒙古文在页面的正常显示,本文设计了先将蒙古文以长二进制字符流的格式从底层数据库读出再转换成对应的蒙古文的显示方法。
面向旅游领域的蒙古文关系抽取的研究与实现
这是一篇关于蒙古文,旅游领域,关系抽取,注意力机制,BERT的论文, 主要内容为现如今,人们在旅游出行前通常会首选旅行服务软件搜索目的地的相关信息。面向旅游领域的关系抽取是构建旅游知识图谱以及开发智能推荐系统等工作的重要基础。目前面向旅游领域关系抽取工作的相关研究方法在中文和英文等大语种语言环境中较为成熟,但在蒙古文关系抽取方面的研究工作仍处于起步阶段。为了推进边疆地区旅游业智能化发展,开展面向旅游领域的蒙古文关系抽取研究工作具有重要意义。本文面向旅游领域的蒙古文关系抽取工作进行研究,主要工作如下:(1)建立了面向旅游领域的蒙古文关系抽取语料库。针对蒙古文旅游领域公开语料库较少的问题,本文利用爬虫技术收集了旅游领域的相关文本信息,将其中的中文文本进行翻译及校正处理后与蒙古文文本信息合并为新的数据集。通过预处理后进行人工标注,最终构建了含有28种关系类型、74699条语句的蒙古文旅游领域关系抽取语料库。(2)结合蒙古文构词特点,构建了基于注意力机制的蒙古文关系抽取模型。该模型根据蒙古文构词特点将单词切分后作为Word2Vec模型的输入,利用双向长短时记忆网络(Bidirectional Long Short-Term Memory Network,BiLSTM)进行特征抽取,在此基础上引入注意力机制优化特征向量。实验结果表明本文构建的蒙古文关系抽取模型相比基线模型的F1值提升了4.9%。(3)针对语料库中存在的一词多义的问题,本文提出了融合预训练语言模型的关系抽取方法。该方法根据蒙古文构词特点预训练了蒙古文BERT(Bidirectional Encoder Representations from Transformer,BERT)模型,并在此基础上构建了BM-BiLSTM-Attention和BM-BiGRU-Attention两种蒙古文关系抽取模型。实验结果表明,使用蒙古文BERT进行向量化表示有效提升了关系抽取效果,上述两种模型在关系抽取任务中的F1值均达到了70%以上。本文以上述研究为基础,设计并搭建了蒙古文关系抽取系统,实现了面向旅游领域的蒙古文关系抽取服务。
蒙古文民族工艺美术资源系统设计与实现
这是一篇关于蒙古文,民族工艺,MVC,CSS3的论文, 主要内容为随着互联网技术的不断发展,越来越多的行业开始借助计算机软件完成一些运算较为困难,数据较为庞大的工作。一些数据量较大的资源库,不再以单一的纸质形式存储,而是将数据录入到资源管理系统中,增强数据的稳定性及安全性。现阶段网站建设的门槛变得越来越低,其中涉及的核心技术和要点也变得越来越普及和完善。但与此同时,由于蒙古文特殊的书写方式对网站的页面布局产生了一系列的要求,这对网站的设计产生了一定局限性,目前蒙古文网站的开发和管理技术仍处于不断探索的阶段。民族工艺美术资源库为民族工艺美术资源产业的样本管理提供数字化技术支持,资源库系统支持大规模、多种类艺术样品的录入、审核、编辑、删除、管理、分类、分级、用户管理以及日志管理等功能。样品的数据资源包括文本、图片、音频、视频、二维数据和三维数据等,以满足客户群需要。为适应少数民族地区的特殊需要,系统需采用蒙古文和汉语双语进行工艺美术样本的描述。而国内目前还没有成熟的蒙汉双语样本库。本文主要介绍了蒙古文民族工艺美术资源系统的设计与实现,系统采用B/S的体系架构。系统实现采用MVC设计模式,使用Spring+SpringMVC+Mybatis框架,使用MySQL数据库存储后台数据。结合现阶段内蒙古地区对于民族工艺美术资源的保护情况,经过对蒙文用户实际需求的分析,设计并实现了主要为蒙文用户提供资源管理服务的蒙古文民族工艺美术资源系统。系统能够稳定地提供资源管理服务,完成设计目标。
面向法律领域的蒙古文知识图谱自动问答研究
这是一篇关于蒙古文,自动问答,知识图谱,实体抽取,属性抽取的论文, 主要内容为随着我国法律体系的逐步完善,群众的法律咨询需求量与日俱增。现如今蒙古族群众仍停留于人工咨询的方式,导致法律咨询量和律师资源失去了平衡,致使法律从业人员的人力成本变高,蒙古文法律自动问答则可以有效地缓解人工法律咨询供不应求的状态。蒙古文法律问答面临专业性强、从业人员少和数据资源少等难点,引入法律知识图谱能增强问答过程中的法律专业性。本文对面向法律领域的知识图谱自动问答技术进行研究,针对现有法律问答中受到问答库限制、无法推理以及回复专业性低等缺点,设计并实现了面向法律领域的蒙古文知识图谱自动问答系统。主要研究内容有:(1)法律领域自动问答蒙古文数据资源建设本文首先对现有中文法律数据资源进行收集、筛选、翻译、人工校正、自动校正等一系列处理,构建了15万对蒙古文法律问答语料库。然后从蒙古文问答语料中构建了17400句子的实体标注语料库以及16200句子的属性标注语料库,为问句语义解析提供数据支撑。最后,针对缺少蒙古文法律领域知识图谱的现状,构建了857个实体的蒙古文法律罪名相关知识图谱。(2)面向法律领域的蒙古文实体抽取研究首先采用BiLSTM-CRF模型研究了蒙古文法律实体自动抽取方法。为增加模型的泛化性,选择了少数民族多语言预训练模型CINO,研究了基于CINO-BiLSTM-CRF实体抽取模型。另外,为了利用Transformer模型和BiLSTM模型在上下文长距离依赖特征和方向性特征提取方面的有效性,将Transformer模型和BiLSTM模型相结合进行特征提取,研究了基于Transformer-BiLSTM-CRF蒙古文实体抽取模型。实验结果表明,引入CINO预训练模型能有效地提高训练数据少的实体在BiLSTMCRF模型的泛化能力,CINO-BiLSTM-CRF模型在P、R和F1值上都有所提升。通过结合Transformer和BiLSTM模型的特征提取能力,同时捕获长距离和方向性特征,因此Transformer-BiLSTM-CRF取得了综合最优效果,F1值达到了93.30%,在嵌套实体上的表现也是最优的。(3)面向法律领域的蒙古文属性抽取研究在基于多语言的少数民族预训练CINO模型的基础上,设计了CINO-BiLSTM-Attention和CINO-BiGRU-Attention两种蒙古文属性抽取模型。实验结果表明,在蒙古文句子上利用BiLSTM模型进行特征抽取更优于BiGRU模型,CINO-BiLSTM-Attention模型在P、R和F1指标上均高于CINO-BiGRU-Attention模型。(4)面向法律领域的蒙古文知识图谱问答系统针对检索式法律问答结果受到语料库限制的缺点,本文通过蒙古文法律知识图谱辅助检索来提高问答准确率。系统主要分为问句语义解析模块、知识图谱检索模块和检索式自动问答模块。首先,利用蒙古文法律实体抽取模型、属性抽取模型对蒙古文问句进行语义解析。然后将知识图谱问答系统与检索式问答系统相融合,提高了面向法律领域的自动问答系统的回复准确率,在检索式问答系统上准确率提升了2.13%。
面向法律领域的蒙古文知识图谱自动问答研究
这是一篇关于蒙古文,自动问答,知识图谱,实体抽取,属性抽取的论文, 主要内容为随着我国法律体系的逐步完善,群众的法律咨询需求量与日俱增。现如今蒙古族群众仍停留于人工咨询的方式,导致法律咨询量和律师资源失去了平衡,致使法律从业人员的人力成本变高,蒙古文法律自动问答则可以有效地缓解人工法律咨询供不应求的状态。蒙古文法律问答面临专业性强、从业人员少和数据资源少等难点,引入法律知识图谱能增强问答过程中的法律专业性。本文对面向法律领域的知识图谱自动问答技术进行研究,针对现有法律问答中受到问答库限制、无法推理以及回复专业性低等缺点,设计并实现了面向法律领域的蒙古文知识图谱自动问答系统。主要研究内容有:(1)法律领域自动问答蒙古文数据资源建设本文首先对现有中文法律数据资源进行收集、筛选、翻译、人工校正、自动校正等一系列处理,构建了15万对蒙古文法律问答语料库。然后从蒙古文问答语料中构建了17400句子的实体标注语料库以及16200句子的属性标注语料库,为问句语义解析提供数据支撑。最后,针对缺少蒙古文法律领域知识图谱的现状,构建了857个实体的蒙古文法律罪名相关知识图谱。(2)面向法律领域的蒙古文实体抽取研究首先采用BiLSTM-CRF模型研究了蒙古文法律实体自动抽取方法。为增加模型的泛化性,选择了少数民族多语言预训练模型CINO,研究了基于CINO-BiLSTM-CRF实体抽取模型。另外,为了利用Transformer模型和BiLSTM模型在上下文长距离依赖特征和方向性特征提取方面的有效性,将Transformer模型和BiLSTM模型相结合进行特征提取,研究了基于Transformer-BiLSTM-CRF蒙古文实体抽取模型。实验结果表明,引入CINO预训练模型能有效地提高训练数据少的实体在BiLSTMCRF模型的泛化能力,CINO-BiLSTM-CRF模型在P、R和F1值上都有所提升。通过结合Transformer和BiLSTM模型的特征提取能力,同时捕获长距离和方向性特征,因此Transformer-BiLSTM-CRF取得了综合最优效果,F1值达到了93.30%,在嵌套实体上的表现也是最优的。(3)面向法律领域的蒙古文属性抽取研究在基于多语言的少数民族预训练CINO模型的基础上,设计了CINO-BiLSTM-Attention和CINO-BiGRU-Attention两种蒙古文属性抽取模型。实验结果表明,在蒙古文句子上利用BiLSTM模型进行特征抽取更优于BiGRU模型,CINO-BiLSTM-Attention模型在P、R和F1指标上均高于CINO-BiGRU-Attention模型。(4)面向法律领域的蒙古文知识图谱问答系统针对检索式法律问答结果受到语料库限制的缺点,本文通过蒙古文法律知识图谱辅助检索来提高问答准确率。系统主要分为问句语义解析模块、知识图谱检索模块和检索式自动问答模块。首先,利用蒙古文法律实体抽取模型、属性抽取模型对蒙古文问句进行语义解析。然后将知识图谱问答系统与检索式问答系统相融合,提高了面向法律领域的自动问答系统的回复准确率,在检索式问答系统上准确率提升了2.13%。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕业设计工坊 ,原文地址:https://bishedaima.com/lunwen/50635.html