7个研究背景和意义示例,教你写计算机句法分析论文

今天分享的是关于句法分析的7篇计算机毕业论文范文, 如果你的论文涉及到句法分析等主题,本文能够帮助到你

基于自然语言处理的能源电池领域的知识图谱构建

这是一篇关于知识图谱,TextRank,Word2vec,句法分析,规则的论文, 主要内容为随着大数据时代的到来,信息剧增,从海量文本中迅速捕获有价值的知识是目前亟待解决的问题,知识图谱就此问世。虽在其他领域,已经成功构建了很多知识图谱库,但针对专业性领域的知识图谱构建还处于起步时期,尤其是能源电池领域,这严重阻碍了该领域知识的应用和共享。因此,本文以该领域50篇科技论文作为研究对象构建知识图谱,研究主要集中在四个方面,即词性标注、实体抽取、关系抽取以及图谱构建。词性标注。首先,依据论文和中英文的结构特点,提取文本中具有特殊特点的实体,经去重、排序,补充到自定义词典;然后,运用HanLP的短语提取功能提取所有可能的短语,经源文本匹配,保留匹配度达到2及以上的短语,经实体规则的筛选,将最终剩下的实体补充到自定义词典中;最后,运用更新的自定义词典,将HanLP标注结果与人工标注的结果作对比,总结出该领域的通用规则,将运用通用规则提取的实体经人工筛选后补充到自定义词典,完成基于自定义词典的词性标注。实体抽取,本文主要是将图模型引入实体抽取,提出了一种基于改进TextRank算法的抽取方法。分别将基于节点长度和节点信息量的节点综合特征值和基于滑动窗口和互信息的边权值共同加权于传统的TextRank算法中,创建新的评分函数,通过不断迭代、设置阈值确定最终的实体抽取结果。实体关系。本文将研究分为分类关系和非分类关系。首先,改进了“is a”模型使其适用于中文的实体关系抽取,即,利用“是一”模型直接提取出文本的上下位关系,即分类关系;其次,基于共现关系抽取所有的实体对,在所有共现实体对的基础上,利用word2vec模型计算实体间的语义关系;再次,利用依存句法分析和规则获得实体间的并列关系、主宾关系、同义关系和聚集关系;最后,量化关系,经降序排列以及阈值分析,得到最终的实体关系。构建图谱。本文根据已经提取的实体以及实体间的关系,运用Pajek软件将知识图谱可视化展示。由于科学研究的不断发展,科技论文的产量与日俱增,因此,绘制知识图谱并不是一个终结性的工作,随着专业信息的不断增加,知识图谱结构也要不断更新,建立越发完善的知识体系。核心任务包括:语料库构建、分词标注、信息量计算、词长统计、TextRank、实体抽取、word2vec、句法分析、关系模型抽取、实体关系抽取、知识图谱构建等操作。

基于自然语言处理的能源电池领域的知识图谱构建

基于Flex和模糊理论的在线考试智能阅卷系统的研究与应用

这是一篇关于Flex,JavaEE,中文分词,句法分析,Chart算法,单项贴近度的论文, 主要内容为随着我国教育事业的发展和教育思想的进步,传统的考试方式暴露出越来越多的弊端,无纸化在线考试系统得到了广泛的普及和应用,但还存在许多问题,尤其在智能阅卷领域。目前,针对选择题、填空题和判断题等客观试题的自动阅卷技术已经非常成熟,被广泛的应用于大型考试系统中。但是,针对名词解释、简答题和论述题等主观题型的自动阅卷技术,由于涉及到人工智能、自然语言理解、模式识别等理论与技术的问题,所以至今还很不完善。国内对主观题的阅卷依然是人工阅卷,但随着学生的增加,人工阅卷会给教师带来许多额外的工作量。而计算机运算速度快、效率高、精度高,尤其适用于主观题的自动阅卷。因此,研究如何利用计算机来实现主观题的自动阅卷具有很大的现实意义。本文针对汉语自身的特点,将中文自动分词技术、句法分析中的Chart算法和模糊数学中的单向贴近度理论引入到主观题的智能阅卷系统中来。首先对中文分词的最大匹配法进行了研究与分析,采用一种改进的词典机制,提高了分词的效率和准确率,然后针对Chart算法容易产生冗余边和分析效率低的问题进行了改进,然后通过分析阅卷教师在评阅主观题时的思维方法,在模糊数学的理论基础上,引入了单向贴近度的概念,设计了一个对主观题进行评分的算法。本文将阅卷过程分解为三个主要步骤来进行：中文分词、句法分析和相似度计算。分词基于改进后的词典机制,采用最大匹配算法实现,句法分析采用了改进后的Chart算法,相似度计算采用单向贴近度算法。在分析了每一步的特点和任务之后,分别给出了使用算法的设计思想、算法描述和实现过程。然后系统地阐述了如何基于Flex构建RIA应用,并提出了Flex与JavaEE整合的解决方案,并基于该架构模拟实现了一个主观题智能阅卷系统,达到了很好的阅卷效果,具有较好的推广应用价值。

融合句法分析的专利因果关系抽取

这是一篇关于因果关系,句法分析,注意力机制,因果关联词的论文, 主要内容为因果关系反映了句子中实体之间的由因及果、先后相继的关系。而专利因果关系不仅能体现专利的技术核心,也有助于专利领域知识图谱构建。目前国内外针对因果关系识别已有了一定的研究工作,取得了一定的成果。但在当前因果关系的方法中,都普遍存在隐式因果关系抽取困难,边界识别不准的问题。针对这些问题本文做了深入研究,本文主要工作内容包括:(1)构建专利因果关联词表。针对隐式因果关系抽取困难问题,本文提出了专利中隐式因果关系的定义,并提取出能代表专利中隐式因果关系的连词。结合常规因果关系关联词构成种子词表。以《同义词词林》作为词库,扩展得到287个表示专利因果关系的词。(2)采用因果关联词与其它词语之间的相对位置差,解决因果关系边界识别不准的问题。本文将因果关系边界识别问题转化为识别因果关联词的作用范围,进而解决边界识别不准问题。(3)提出融合句法分析的Bi LSTM＿ATT＿CRF模型。在自然语言文本中,相关联的词和短语未必相邻,会出现长距离依赖现象。本文选取Bi LSTM(Bi-directional Long Short-Term Memory)结合句法分析来解决远距离词语之间依赖特征随句长消失的问题。通过引入注意力机制更合理地分配词向量特征与句法特征的权重比例,并利用CRF(Conditional Random Field)完成最后的因果关系识别任务。本文选取了化学类和生活类专利文本1537篇,抽取出4941条专利隐式因果关系句,以及显式因果关系句3571条。本文采用F1值作为抽取效果的评价指标,分别在CRF模型、Bi LSTM模型、Bi LSTM＿CRF模型、融合句法分析的Bi LSTM＿CRF模型以及本文提出的融合句法分析的Bi LSTM＿ATT＿CRF模型上进行实验。实验结果表示,在平均句长为31.5的语料中,融合句法分析的Bi LSTM＿ATT＿CRF模型F1值平均达到79.8%。抽取结果相对于其它对比实验,F1值有显著提升。