基于深度学习的全天空极光图像小样本分类与多标签分类研究
这是一篇关于全天空极光图像,极光图像分类,深度学习,小样本学习,多标签分类的论文, 主要内容为极光是由太阳风所携带的高能带电粒子和地球南北两极大气层互相撞击而形成的一种自然发光现象。对极光现象的深入研究不但有助于揭示地球与磁层动力学过程间的关联,还可以预测空间天气的变化。极光图像分类作为极光物理研究中的一个重要分支。近年来,随着深度学习技术的迅速发展,越来越多的研究人员将其应用到了极光图像分类任务中,并取得了显著的效果。目前的极光图像分类研究主要集中在有大量标记样本的常见极光类型上,分类性能严重依赖大量标记数据对深度神经网络参数进行监督训练,其对大量标记样本的需求制约着模型性能的发挥,标记样本不足会导致模型出现过拟合或性能不佳等问题。然而,在许多情况下,例如稀有极光或新发现的极光类型,在研究初期获得足够多的类别标签是不实际的,这严重阻碍了后续研究的相关进展。此外,由于极光是一种逐步演化的自然现象,其在南北极上空的演化过程中存在很多过渡状态,一幅极光图像中常常呈现出多种极光类型共存的现象。然而目前的极光图像分类研究都是基于单标签的形式展开的,每幅极光图像只标注了一种类型,仍存在一些其它的语义信息没有被标注出来。这不仅未能全面地描述出极光图像所蕴含的丰富语义信息,造成了图像资源的浪费,还会影响后续极光产生机制的研究。因此,本文以中国北极黄河站观测到的G波段(557.7nm)全天空极光图像数据为研究对象,开展极光图像小样本分类和多标签分类研究。在极光图像的小样本分类研究中,本文提出了一种基于小样本学习的极光图像分类方案,仅用少量标记样本实现了对极光新类别的快速分类。由于极光观测数据都是由地面的全天空成像仪收集的,类与类之间的域差很小。因此本文充分利用模型在以往极光图像分类研究中标记的常见极光类型数据上学习到的参数作为先验知识,将其整合到标记样本量较少的新类别上,用于对其有效表征。通过计算样本间的余弦相似度完成对新类别的自动识别,避免了因新类别标记样本过少而导致的过拟合现象。当每个极光新类别分别提供一个和五个标记样本时,本文所提方案在新类别数据集上的平均分类精度分别达到了87.14%和95.33%。极光图像检索和发生分布规律统计实验进一步证明了该方案不仅有效而且切实可行。大量实验结果表明,该方案为极光图像的自动分类和检索提供了一种新思路,特别是那些标记样本较少的类别。在极光的多标签分类研究中,本文根据极光数据的特点,结合Res Net、双线性特征和残差注意力机制,提出了一种多标签分类网络(Hierarchical Attention Network,HANet)实现了对极光图像的多标签自动分类。首先将极光图像送入在Image Net上预训练过的Res Net中提取不同卷积层的深层极光特征。一方面通过对不同卷积层提取到的特征进行跨层交互,借助层间的互补信息生成更细粒度的极光双线性特征,接着整合多个跨层双线性特征来增强模型的表征能力。另一方面利用残差注意力机制细化级联后的双线性特征,使得模型能够自适应地定位到各个极光类别的局部判别性区域。本文通过消融实验、特征可视化、以及将HANet与主流的多标签分类算法进行比较,证实了HANet在极光图像多标签分类任务上的有效性。
科技论文的领域信息挖掘与主题演进规律研究
这是一篇关于科技大数据,图神经网络,多标签分类,主题演进规律,交互可视化的论文, 主要内容为近年来,随着社会对科研投入的增大,各种领域的研究成果数量显著增加。各研究领域迅速发展,不同领域之间交叉融合,许多研究成果之间存在一定的依赖关系。如何有效挖掘科技论文的研究领域和主题演进规律具有重要的研究意义。本文基于注意力机制、图卷积网络、图注意力网络、层级标签分类网络、时间卷积网络等多种深度学习技术,对科技论文数据进行特征表示,利用层级多标签分类模型科技论文领域信息,并对研究领域内的各个主题进行演进规律的研究。通过微服务技术建立科技论文的领域信息挖掘与演进规律预测系统。本文完成的主要工作如下:(1)提出了科技论文数据获取与特征提取方法。针对科技论文的特征表示,提出了结合图卷积网络与BERT深度语义模型的科技文本语义特征表示模型,通过结合科技论文的关键词共现关系,描述论文与关键词之间的关联,构建了一个论文与关键词的异质网络,通过BERT获得所有结点的初始向量表示,并结合GCN网络将相邻结点的语义特征结合,提取空间信息,最终的输出作为科技论文的语义表示,实现了对论文的语义特征表示学习。(2)提出了基于图卷积网络的科技论文领域信息挖掘模型。一篇论文往往具有多个类别,例如在中图分类法中,类别之间具有层级关系,论文的类别呈现出层次结构,这就是一个典型的多标签层次分类任务。它对现有的模型提出了两个挑战:首先,现有模型不能很好地捕获论文之间的语义关系。其次,它们忽略了对标签的层次结构进行建模。本文提出了一种基于图注意力网络的分层标签注意力模型,该模型利用词的共现性来对论文的语义关系进行建模。使用多个线性层来建模类别层次结构,并通过注意力机制组合标签的每个层次结构,实现了对论文领域的层级多标签分类。(3)提出了基于空间增强与动态图卷积网络的科技论文研究主题演进规律预测模型。由于各个研究主题之间具有一定的关联关系,孤立地看待单个研究主题无法有效地挖掘这些研究主题之间的依赖。为了同时捕获研究主题之间的空间依赖以及时间变化,提出了一种基于空间增强与动态图卷积网络的研究主题趋势预测模型,本模型结合了图卷积神经网络(GCN)和时间卷积网络(TCN),GCN用于学习研究主题的空间表示,并利用空间依赖加强空间特征,TCN用于学习研究主题趋势的动态变化,并根据时间距离计算加权损失进行优化,实现对研究主题演进规律的挖掘。(4)实现了科技论文的领域信息挖掘与主题演进规律分析系统。系统集成了数据处理模块、学科查询模块、研究主题变化趋势模块。基于Springboot框架开发了可视化系统,并集成了 ElasticSearch检索引擎以及Redis缓存数据库,有效提升了系统各模块的性能,采用Echarts可视化插件进行可视化展示,提供了中英文论文成果的检索、论文学科的分布分析、研究主题关联图谱、研究主题演进规律预测等功能。系统各项功能完备,用户界面操作友好。
基于深度学习的航路环境感知技术研究与应用
这是一篇关于智能船舶,航路环境感知,目标检测,视频分类,多标签分类的论文, 主要内容为水路运输是国民经济的基础,作为水路的重要交通工具,船舶航行安全尤为重要。随着《智能船舶发展行动计划(2019-2021年)》、《中国制造2025》等文件的提出,智能船舶将是未来重要的发展方向之一。自主环境感知是智能船舶的重要功能。目前,船舶航行的环境信息主要通过海事雷达(Marine radar)、电子海图(Electronic Chart Display and Information System,ECDIS)、船舶自动识别系统(Automatic Identification System,AIS)等来获取。伴随计算机运算效率的提升,基于计算机视觉和深度学习的感知系统,可以作为有效的技术方案和手段来获取环境信息,为船舶导航提供服务。因此,本文利用深度学习技术对航路环境感知算法进行设计,并开发航路环境感知系统,以服务于智能船舶导航和海事监管。本文的主要研究内容如下:(1)水上目标检测是航路环境感知的核心。水上目标种类繁多,包括船舶、航标、桥梁以及其他障碍物等。为了保证船舶的安全,一个高效的检测算法是必不可少的。分析目前性能SOTA(State-Of-The-Arts)的目标检测算法,选择了兼顾精度与速度的单阶段(one-stage)目标检测算法YOLOv4作为本文检测算法的基线模型。为了使其更好地适用于水上目标检测,对其进行了改进。首先,利用参数重构技术对目标检测的骨干网络(Backbone)进行优化,在提高模型特征提取能力的同时,加快模型的推理速度。其次,利用注意力机制和跨层连接的思想对特征金字塔结构(Feature Pyramid Networks,FPN)进行改进,提高了模型的多尺度检测能力并进一步减小模型的参数量。最后,利用空洞卷积对原有的空间金字塔池化层(Spatial Pyramid Pooling,SPP)进行改进,弥补了原有的最大池化层信息丢失的缺陷,有效地扩大了模型的感受野。最终,本文提出了水上目标检测算法Ship YOLOv2,并在公开的水上目标检测数据集WSODD(Water Surface Object Detection Dataset)进行了实验。相比于已有的SOTA算法,Ship YOLOv2在保证实时推理速度的同时有着最好的检测精度。(2)航标是众多水上目标中一个特殊的类别,其作为重要的助航标志,在白天可以通过目标检测算法得到对应的助航信息。到了夜间,助航信息的获取主要来自航标灯质,其是一段具有动态信息的视频。因此,本文提出了一个新颖的多标签视频分类算法NMLNet来完成夜间航标灯质的识别。首先,NMLNet采用了双分支结构。输入的视频帧被分成RGB格式图像和V通道(Value)格式图像,作为NMLNet两个分支的输入。RGB分支用于进行航标灯的颜色标签识别,V通道分支用于航标灯的闪烁标签识别。其次,将通道注意力机制融入到轻量的特征提取算法Mobile Netv2中,作为闪烁标签分类的骨干网络(Backbone),用于完成颜色标签的分类任务。对于闪烁标签,利用基于CNN&LSTM的视频分类算法来完成识别。最后,根据航标灯质的分类规则,利用二元相关方法(binary relevance)对多标签识别结果进行融合。通过在自制的夜间航标灯质数据上进行实验,证明了本文提出的NMLNet可以有效地完成夜间航标灯质的识别任务。(3)基于Ship YOLOv2和NMLNet算法,开发了航路环境感知系统,可服务于智能船舶。根据系统功能需求,基于B/S架构利用Flask框架完成系统的后端开发,Vue框架完成系统的前端页面设计,利用My SQL完成系统数据库的构建,并通过Tensor RT技术对深度学习模型进行加速,提高系统的运行效率。论文提出的水上目标检测算法和夜间航标灯质识别算法实现了对水上目标的感知,设计开发的航路环境感知系统可提供基于图像和视频的水上目标检测、视频分类等功能,研究成果可以为智能船舶的航行提供有效的视觉感知服务,具有应用价值。
基于seq2seq的多标签文本类别生成算法
这是一篇关于文本类别识别,多标签分类,seq2seq,文本类别生成,文本分类的论文, 主要内容为文本类别的识别,广泛的应用于各个领域,常见的有应用于电商平台的商品自动识别、新闻资讯平台的新闻类别自动识别等。优秀的文本类别识别算法不仅可以节省大量的人力,还可以避免人工识别的主观性。文本类别的识别主要是包括单标签的识别和多标签的识别。相对于单标签的识别,多标签的文本类别的识别,应用更加广泛,但也更加具有挑战性。本文主要是讨论了多标签类别识别的研究意义以及发展现状。多标签文本类别识别目前主流的方法主要有两种,一种是使用分类模型对多标签类别进行分类,另一种是使用序列到序列(简称seq2seq)的生成模型来进行文本类别生成。文本多标签类别生成模型相对于分类模型能够更好的把握标签之间的联系。本文主要是针对现有的seq2seq的算法的缺点进行改进,提高模型的准确率。具体主要是针对以下几个缺点进行了改进:针对seq2seq模型中容易出现生成低频词作为生成标签的情况,在数据预处理阶段,使用命名实体识别的方法进行数据预处理,将识别之后的结果和原来的词向量或者字向量一起作为编码器的输入部分,增加网络的先验知识,防止解码器输出低频词。针对seq2seq模型容易出现序列重复生成的问题,对解码的结果使用判别器进行判断是否重复生成,使其可以对注意力机制进行限制。使模型在编码和解码的时候,避免重复关注同样的词,进而避免重复标签的生成。针对模型在测试阶段容易出现曝光偏差的问题,本文采取自强化学习的训练方式进行训练模型。模型在训练的时候,以最小化生成序列和标签之间的hanming-loss为目标,使模型生成的标签尽量的拟合到标准的标签上,生成更准确的标签序列。本文使用公开数据集,通过实验对比了常用的文本多标签分类模型以及seq2seq模型,证明本文改进的模型在多个评价指标上超过现有的模型。
融合知识图谱的智能诊断研究
这是一篇关于智能诊断,知识图谱,多标签分类,电子病历,融合知识的论文, 主要内容为随着人民群众对于医疗服务需求的增长,我国医疗卫生事业供需不平衡的矛盾日益凸显。医疗信息化的推行使各大医疗机构积累了海量的电子病历数据,形成了医疗领域的大数据。知识图谱近年来发展迅速,已成为知识驱动的智能应用的基础设施。基于电子病历大数据和知识图谱,将数据驱动与知识驱动相结合,有助于辅助医生决策,提高工作效率,是缓解医疗服务供需矛盾的重要途径。本文将智能诊断任务作为多标签分类任务进行处理,主要探讨将知识图谱融合到智能诊断任务中的有效方法,具体研究成果如下:(1)提出了一个采用信息增强策略和知识注意力的(Knowledge powered Attention and Information-Enhanced,KAIE)模型进行融合三元组信息的智能诊断研究。电子病历中的数值信息和包含主诉的关键信息对于诊断有着较为重要的作用,KAIE模型通过在输入部分对关键信息进行差异化处理将其与其他文本相区分,数值信息的引入采用多头注意力机制进行处理。对实体链接得来的三元组,提出采用知识图谱嵌入方法和多路注意力机制将知识图谱中的三元组信息与深度学习模型相融合。实验结果表明,相比于传统机器学习与常用深度学习模型,进行信息增强和融合知识图谱三元组信息的KAIE模型可以有效提高智能诊断的效果,相比于BERT模型,F1值提高了1.37%,达到了81.11%。(2)提出了一个基于图的结构知识感知的模型(Graph-based Structural Knowledge-aware Network,GSKN)进行融合图结构信息的智能诊断研究。知识图谱中除浅层的三元组信息外,三元组之间还包含着复杂的关系,这些关系可以表示为图结构类型的信息。在KAIE模型基础上,GSKN模型通过将三元组构建为知识图谱子图形式,并采用图卷积神经网络和交互注意力机制对其进行编码和融合。实验结果表明引入图结构信息的GSKN模型的诊断效果相比于KAIE模型取得了进一步的提高,F1值达到了81.42%。(3)基于上述智能诊断算法,构建了包含病历管理、病历质控、智能诊断等功能的智能诊断平台,该平台可以为医生提供病历质量控制和临床决策辅助。
科技论文的领域信息挖掘与主题演进规律研究
这是一篇关于科技大数据,图神经网络,多标签分类,主题演进规律,交互可视化的论文, 主要内容为近年来,随着社会对科研投入的增大,各种领域的研究成果数量显著增加。各研究领域迅速发展,不同领域之间交叉融合,许多研究成果之间存在一定的依赖关系。如何有效挖掘科技论文的研究领域和主题演进规律具有重要的研究意义。本文基于注意力机制、图卷积网络、图注意力网络、层级标签分类网络、时间卷积网络等多种深度学习技术,对科技论文数据进行特征表示,利用层级多标签分类模型科技论文领域信息,并对研究领域内的各个主题进行演进规律的研究。通过微服务技术建立科技论文的领域信息挖掘与演进规律预测系统。本文完成的主要工作如下:(1)提出了科技论文数据获取与特征提取方法。针对科技论文的特征表示,提出了结合图卷积网络与BERT深度语义模型的科技文本语义特征表示模型,通过结合科技论文的关键词共现关系,描述论文与关键词之间的关联,构建了一个论文与关键词的异质网络,通过BERT获得所有结点的初始向量表示,并结合GCN网络将相邻结点的语义特征结合,提取空间信息,最终的输出作为科技论文的语义表示,实现了对论文的语义特征表示学习。(2)提出了基于图卷积网络的科技论文领域信息挖掘模型。一篇论文往往具有多个类别,例如在中图分类法中,类别之间具有层级关系,论文的类别呈现出层次结构,这就是一个典型的多标签层次分类任务。它对现有的模型提出了两个挑战:首先,现有模型不能很好地捕获论文之间的语义关系。其次,它们忽略了对标签的层次结构进行建模。本文提出了一种基于图注意力网络的分层标签注意力模型,该模型利用词的共现性来对论文的语义关系进行建模。使用多个线性层来建模类别层次结构,并通过注意力机制组合标签的每个层次结构,实现了对论文领域的层级多标签分类。(3)提出了基于空间增强与动态图卷积网络的科技论文研究主题演进规律预测模型。由于各个研究主题之间具有一定的关联关系,孤立地看待单个研究主题无法有效地挖掘这些研究主题之间的依赖。为了同时捕获研究主题之间的空间依赖以及时间变化,提出了一种基于空间增强与动态图卷积网络的研究主题趋势预测模型,本模型结合了图卷积神经网络(GCN)和时间卷积网络(TCN),GCN用于学习研究主题的空间表示,并利用空间依赖加强空间特征,TCN用于学习研究主题趋势的动态变化,并根据时间距离计算加权损失进行优化,实现对研究主题演进规律的挖掘。(4)实现了科技论文的领域信息挖掘与主题演进规律分析系统。系统集成了数据处理模块、学科查询模块、研究主题变化趋势模块。基于Springboot框架开发了可视化系统,并集成了 ElasticSearch检索引擎以及Redis缓存数据库,有效提升了系统各模块的性能,采用Echarts可视化插件进行可视化展示,提供了中英文论文成果的检索、论文学科的分布分析、研究主题关联图谱、研究主题演进规律预测等功能。系统各项功能完备,用户界面操作友好。
层次多标签分类算法研究与应用
这是一篇关于多标签分类,层次多标签分类,神经网络,路径选择,层次损失的论文, 主要内容为在常见的分类任务中,一条样本通常属于类别标签之间没有关系的标签集合中的一个标签,而在更加复杂的分类任务中,一条样本可以属于多个标签,通常称为多标签分类。此外,还有一种情况是标签集合中的类别标签以分层的方式进行组织,并且必须将一条样本关联到这个层次结构中的单一路径,即所谓的分层分类。最后,在更复杂的场景中,类别标签同样被组织成一个层次结构,并且一条样本可以关联到这个层次结构的多条路径,即层次多标签分类问题,本文提出两种分类算法去解决这个问题。一种是基于路径选择的层次多标签分类算法,该算法为每一个父节点训练一个多类分类器。在分类阶段,当某条标签路径的概率较低时就将该节点所包含的子树剪去,以达到预测路径未到达叶子节点就终止的情况。该方法考虑层次结构中从根节点开始的所有可能路径,通过结合路径上的节点在层次结构中的层次和局部分类器的预测值来计算各条路径的得分,最后通过选择路径得分超过给定阈值的一条或者多条路径上的标签节点作为最后预测结果。另外一种是基于神经网络的层次多标签分类算法,该算法为层次标签树的每一层都单独训练一个神经网络模型,并将这些神经网络模型链接成神经网络链做为最终预测模型。同时,拼接各层神经网络的输出作为最终输出。最后,再分别通过单阈值选择和多阈值选择来预测最后的标签集。本文将层次多标签分类算法应用于大规模网络智能运维工作票分类任务,并开发基于B\S架构的层次多标签分类系统。实际的运行结果表明:本系统可以很好地实现层次多标签分类,并对多标签分类树和多标签分类结果进行有效可视化。
基于多标签分类的知识图谱实体类型预测系统的设计与实现
这是一篇关于实体类型预测,知识图谱补全,多标签分类,层次多标签分类的论文, 主要内容为实体类型是知识图谱的重要组成部分,在知识图谱的应用中起到了重要的作用,但知识图谱中普遍存在实体类型缺失与不完全等质量问题。为了解决这个问题,通常采用机器学习分类方法实现实体的类型预测,该类方法通过构造实体的特征生成数据集,训练以实体类型作为标签的分类器实现实体类型预测。目前基于分类的实体类型预测方法存在着一些局限性:分类器常为简单的单标签分类器、实体特征构造方法通用性差、输入特征为单一维度特征、未考虑知识图谱中类型的层次结构。针对这些不足,本文设计了一个基于多标签分类的知识图谱实体类型预测方法,能抽取实体的文本特征和链接特征,合理地利用这些特征进行分类,并考虑实体类型的层次结构。本文设计的方法主要包含三个阶段:在数据处理阶段,依照知识图谱文本信息和链接信息的不同,将其分为文本丰富型知识图谱和链接丰富型知识图谱,对于不同类型知识图谱采用不同的方法构造实体特征;在模型训练阶段,针对不同类型知识图谱特点设计了3个多标签分类模型,分别为:多标签文本分类模型TTPE、基于多特征的多标签分类模型MFTPE和层次多标签分类模型HTPE;在模型预测阶段,通过训练好的模型预测缺失和不完全的实体类型,并生成知识图谱的类型知识,从而补全缺失的类型信息。本文在单类型知识图谱SWCC、多类型知识图谱LinkedMDB、层次类型知识图谱AIFB和DBpedia上对方法的有效性进行了验证。此外,基于上述方法,本文实现了一个基于多标签分类的知识图谱实体类型预测系统。
基于多标签分类的知识图谱实体类型预测系统的设计与实现
这是一篇关于实体类型预测,知识图谱补全,多标签分类,层次多标签分类的论文, 主要内容为实体类型是知识图谱的重要组成部分,在知识图谱的应用中起到了重要的作用,但知识图谱中普遍存在实体类型缺失与不完全等质量问题。为了解决这个问题,通常采用机器学习分类方法实现实体的类型预测,该类方法通过构造实体的特征生成数据集,训练以实体类型作为标签的分类器实现实体类型预测。目前基于分类的实体类型预测方法存在着一些局限性:分类器常为简单的单标签分类器、实体特征构造方法通用性差、输入特征为单一维度特征、未考虑知识图谱中类型的层次结构。针对这些不足,本文设计了一个基于多标签分类的知识图谱实体类型预测方法,能抽取实体的文本特征和链接特征,合理地利用这些特征进行分类,并考虑实体类型的层次结构。本文设计的方法主要包含三个阶段:在数据处理阶段,依照知识图谱文本信息和链接信息的不同,将其分为文本丰富型知识图谱和链接丰富型知识图谱,对于不同类型知识图谱采用不同的方法构造实体特征;在模型训练阶段,针对不同类型知识图谱特点设计了3个多标签分类模型,分别为:多标签文本分类模型TTPE、基于多特征的多标签分类模型MFTPE和层次多标签分类模型HTPE;在模型预测阶段,通过训练好的模型预测缺失和不完全的实体类型,并生成知识图谱的类型知识,从而补全缺失的类型信息。本文在单类型知识图谱SWCC、多类型知识图谱LinkedMDB、层次类型知识图谱AIFB和DBpedia上对方法的有效性进行了验证。此外,基于上述方法,本文实现了一个基于多标签分类的知识图谱实体类型预测系统。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码海岸 ,原文地址:https://bishedaima.com/lunwen/46295.html