基于深度学习的协同显著性研究
这是一篇关于协同显著性,特征表达,组内共识表示,注意力机制,深度学习的论文, 主要内容为显著性目标检测是模拟人类的视觉特点提取单幅图像中最感兴趣的物体,即显著性物体。基于深度学习的协同显著性研究旨在检测多张图像中同时出现的显著性物体。该任务存在两大难点:(1)如何针对不同视觉场景中的不同物体得到鲁棒的特征表达。(2)如何通过这些特征表达进一步建模同组图像的共识关系,利用组内语义一致性来提升协同显著性检测的性能。现有的协同显著性研究对上述难点进行了深入研究,但因实际检测场景受到遮挡、形变、视角发生变化等复杂因素影响,现有的协同显著性方法的性能仍有提高的空间。为此,本文提出了两种基于深度学习的协同显著性算法,为协同显著性研究提供了新的思路。主要的工作内容及创新点如下:(1)提出了一种基于共注意力机制和编码器-解码器结构的协同显著性检测方法(AED-Net)。该方法先用通道注意力机制与空间注意力机制探索高层语义特征的通道域信息和空间域信息,得到鲁棒的高层语义表达;接着利用组内同类特征具有高度相似性的特点,通过对已增强的高层语义表达进一步探索得到精细的协同显著性线索;然后在整个解码过程中使用共注意力保持模块连接每一个编码-解码对用以保持协同显著性线索的稳定性;最后在网络中嵌入一个分类器帮助网络从高层语义特征中学习到协同显著性物体的类别信息。本文所提出的AED-Net算法充分利用了高层语义特征,在不同场景下均得到了鲁棒的特征表达,取得了很好的性能。(2)由于AED-Net对组内共识信息探索的不够充分,对该方法进行了结构改进与优化,提出了一种基于增强-定位-优化模式的协同显著性检测框架(ELR-Net)。首先对空间和通道注意力模块进行改进,使其能够突出协同显著性线索,并且更加轻量化;接着使用基于深度学习方法的单张显著性图指导深度特征得到单张图像的图内显著性线索;利用图内显著性线索与单张图像特征之间的密集相关性得到组内共识线索;结合组内共识线索与自优化策略对AED-Net方法所得到的协同显著性线索进行优化,使其能够维持特征相对于语义类别的独立性并能够充分利用全局感受野;最后对多尺度协同显著性线索进行融合,消除多尺度信息之间的语义鸿沟。与AED-Net方法相比,ELR-Net既充分利用了高层语义特征,又对组内共识线索进行了更深层次的探索,进一步提升了性能。(3)开展了充分的实验验证本文所提出的两种算法的先进性,本文对比了协同显著性和显著性的前沿算法,在当下最有挑战性的三个基准测试集上进行了定性与定量分析。定性分析表明:这两个方法均能对协同显著性区域进行有效分割。定量分析表明:这两个方法在所使用的五个评价指标上均取得了很好的性能;最后,本文对这两种方法的错误案例进行分析并给出了相应的解决对策。
基于RetinaNet的高分辨率遥感图像目标检测方法研究
这是一篇关于计算机视觉,高分辨率遥感图像,目标检测,特征表达,标签分配,回归损失的论文, 主要内容为随着我国高分卫星星座和众多遥测平台系统的完善和进步,高分辨率遥感图像的可获得性逐渐提升,并朝着大数据和多样化的方向发展,给高分辨率遥感图像解译提出了更高的技术要求。其中,目标检测作为高分遥感图像解译任务中的重要内容,在智能交通、军事国防、抢险救灾和城市规划管理等众多应用中表现出重要的研究价值。然而,随着高分数据多样化程度和应用需求的提升,高分遥感图像目标检测模型在面临复杂地物背景、多样化目标类型、跨尺度目标特性和不同的标注形式等实际情况时,依旧表现出有效性和鲁棒性上的局限。因此,面向上述现实条件,本文从典型目标检测模型Retina Net的基本原理出发,深入研究多类别、多尺度目标特征自适应表达方法、背景和目标信息有效解耦策略、正负样本标签分配及不同标注形式下损失函数设计思路等内容,分别从通用目标检测和有向目标检测两个方面展开研究。论文主要包括以下内容:论文首先阐述现有经典通用目标检测模型Retina Net的基本原理及相关概念,然后细致地剖析了其在有向目标检测任务中的相关改进措施。在全面分析本文所用实验数据集的相关特性后,充分验证Retina Net及其有向改进模型的适应性和有效性,为后文设计新的目标检测方法奠定理论和实验基础。在通用目标检测任务中,论文针对Retina Net应用于高分辨率遥感图像通用目标检测时在多类别、多尺度特征自适应表达能力和语义信息解耦能力上的问题,提出了联合动态特征提取网络和语义引导滤波机制的通用目标检测方法,通过自适应调整网络的感受野并提升不同尺度层级间特征的信息交互,改善了Retina Net在高分辨率遥感图像通用目标检测数据集上的检测性能。在有向目标检测方面,论文针对Retina Net的有向改进模型在高分辨率遥感图像中可能存在标签分配策略及有向回归损失适应性不足的两方面问题,在其基础上提出了联合目标空间-尺度约束标签分配策略和Wasserstein距离度量回归损失的有向目标检测方法,通过提升训练样本质量并缓解传统损失的适应性问题,实现了Retina Net扩展至有向目标检测任务的同时有效提升了其在高分辨率遥感图像有向目标检测数据集上的性能。
多源复杂特征的电梯成本数据表达及其价格预测
这是一篇关于特征表达,层次聚类,数据知识表示,成本估算,机器学习的论文, 主要内容为电梯制造企业目前面临两方面的状况,第一电梯需求的多元化,定制化、个性化需求下的电梯成本计算繁琐,第二电梯企业业务多源数据利用价值低,转化困难。企业在应对不同客户个性化需求,需要实现快速成本计算与电梯报价赢取客户。本文以电梯服务订单历史数据集为研究对象,基于知识图谱的知识体系提出了层次聚类的数据表示方法,实现了原始业务数据到机器学习使用的数据集的转化,基于数据均衡和基于阈值的特征选择方法完成数据改善提升数据模型性能,基于动态规则的映射方法完成原始输入的快速模型预测。最后基于知识图谱技术架构和机器学习框架平台相结合,在Python和Pycharm等开发环境下,设计并实现了电梯成本预测系统,并且使用电梯成本的测试数据集对本系统的核心流程进行检验。本文具体工作和贡献如下:(1)基于知识图谱的知识体系完成电梯成本相关的实体属性抽取,完成电梯成本的最初原始数据集构建;基于知识图谱的知识技术体系,提出了基于层次聚类的数据表示方法,将原始数据表示成能够被机器学习算法识别和学习的数据。(2)基于Tensorflow机器学习框架,使用DNN神经网络算法构建出了电梯成本数据的数据模型,并且结合数据均衡和基于特征贡献度的阈值特征选择方法对数据进行优化,进而完成数据模型的性能提升;在预测阶段,提出了动态规则的数据映射方式,实现原始数据到模型输入的准确数据的转化。(3)基于知识图谱的架构技术体系,结合Python和Pycharm集成环境,以及DjangoWeb框架结合以上技术流程设计了电梯成本预测系统的架构,并实现了电梯成本估算系统。基于企业生产和服务相关的数据进行数据决策是目前互联网和工业界等研究的热点话题,本文通过电梯企业中服务部门中的数据进行数据属性构建,并对数据知识表示以及数据建模进行研究,并应用于智能服务数据预测和决策系统。通过Python数据处理库和Tensorflow机器学习平台,对原始电梯数据集进行数据表示和数据建模,结合Django-Web框架完成了电梯成本系统构建,可以实现数据、模型、预测的管理、预处理、训练、查看等可视化操作。该系统的服务和交互方式以及预测准确性可以极大地满足当前使用人员的需求。
融合多种注意力机制的FM点击率预估模型研究
这是一篇关于点击率预估,特征表达,全阶段注意力机制的论文, 主要内容为随着互联网和大数据产业日益增长,推荐系统技术应运而生。近年来,点击率预估任务在广告推荐、商品推荐等诸多领域得到了广泛的关注,成为了推荐系统中十分重要的一部分。关于点击率预估模型的研究,许多机构和组织也提出了大量的传统浅层模型和基于深度学习的深层模型,并取得了一系列的优秀成果。本文通过对以往大量的点击率预估模型研究与分析后,发现目前常见的一些模型在特征表达上都存在一定的问题。有的忽略了对各阶段特征之间重要性权重的发掘,使得对标签影响较大和较小的特征具有相同的权重,从而导致模型拟合较慢且效果一般;有的缺乏对各阶段特征进行显式捕捉的能力,使得特征表达过程不透明,模型的可解释性较差;有的则没有完全考虑低高阶特征交互特性,为此捕捉到的特征信息不全,模型的总体性能较差。针对上述提出的挑战性问题,本文提出了一种新颖的解决方案,并设计了一种融合多种注意力机制的FM点击率预估模型,主要工作和创新点如下:首先,本文借鉴了自然语言处理中层次注意力机制的设计思想,创新性地提出了一种全阶段注意力机制方法:主要是针对模型初始嵌入特征阶段、二阶组合特征阶段和高阶组合特征阶段,分别采用不同注意力机制进行特征的捕获和权重分析。该方法充分考虑到了全部阶段的特征表达,同时以一种显性方式进行特征学习,因此具有很好的可解释性。其次,在点击率预估领域背景下,本文基于提出的全阶段注意力机制方法,构造了一种融合改进模型Auto Int+。该模型是在Auto Int模型原有的多头注意力机制的基础上,结合了SENET注意网络,旨在达到两种注意力相互促进的目的。然后,考虑到Auto Int+模型中低阶组合特征表达的局限性,本文对模型进行了进一步改进,即利用Attention和经典的点击率预估模型FM,代替原模型中的残差网络对低阶组合特征进行学习。从而得到了本文提出的MAFM模型(一种融合多种注意力机制的FM点击率预估模型)。最后,本文在两种不同的数据集下,对所提出的模型进行了对比实验和消融实验。对比实验结果表明,相比于以往的比较模型,本文提出的Auto Int+和MAFM模型,在性能评价指标、训练时间复杂度、可解释性等方面都具有一定的优越性。同时,消融实验的结果也进一步地证明了本文提出的全阶段注意力机制的有效性和可行性。综上,本文构建了一种融合多种注意力机制的FM点击率预估模型。根据全阶段注意力机制思想,在模型特征的不同阶段,引入不同的注意力机制进行特征学习。同时基于Auto Int模型进行了逐步融合与改进,大大增强了模型中各阶段特征的表达能力,获得了更优的性能和更强的可解释性。
基于RetinaNet的高分辨率遥感图像目标检测方法研究
这是一篇关于计算机视觉,高分辨率遥感图像,目标检测,特征表达,标签分配,回归损失的论文, 主要内容为随着我国高分卫星星座和众多遥测平台系统的完善和进步,高分辨率遥感图像的可获得性逐渐提升,并朝着大数据和多样化的方向发展,给高分辨率遥感图像解译提出了更高的技术要求。其中,目标检测作为高分遥感图像解译任务中的重要内容,在智能交通、军事国防、抢险救灾和城市规划管理等众多应用中表现出重要的研究价值。然而,随着高分数据多样化程度和应用需求的提升,高分遥感图像目标检测模型在面临复杂地物背景、多样化目标类型、跨尺度目标特性和不同的标注形式等实际情况时,依旧表现出有效性和鲁棒性上的局限。因此,面向上述现实条件,本文从典型目标检测模型Retina Net的基本原理出发,深入研究多类别、多尺度目标特征自适应表达方法、背景和目标信息有效解耦策略、正负样本标签分配及不同标注形式下损失函数设计思路等内容,分别从通用目标检测和有向目标检测两个方面展开研究。论文主要包括以下内容:论文首先阐述现有经典通用目标检测模型Retina Net的基本原理及相关概念,然后细致地剖析了其在有向目标检测任务中的相关改进措施。在全面分析本文所用实验数据集的相关特性后,充分验证Retina Net及其有向改进模型的适应性和有效性,为后文设计新的目标检测方法奠定理论和实验基础。在通用目标检测任务中,论文针对Retina Net应用于高分辨率遥感图像通用目标检测时在多类别、多尺度特征自适应表达能力和语义信息解耦能力上的问题,提出了联合动态特征提取网络和语义引导滤波机制的通用目标检测方法,通过自适应调整网络的感受野并提升不同尺度层级间特征的信息交互,改善了Retina Net在高分辨率遥感图像通用目标检测数据集上的检测性能。在有向目标检测方面,论文针对Retina Net的有向改进模型在高分辨率遥感图像中可能存在标签分配策略及有向回归损失适应性不足的两方面问题,在其基础上提出了联合目标空间-尺度约束标签分配策略和Wasserstein距离度量回归损失的有向目标检测方法,通过提升训练样本质量并缓解传统损失的适应性问题,实现了Retina Net扩展至有向目标检测任务的同时有效提升了其在高分辨率遥感图像有向目标检测数据集上的性能。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码客栈 ,原文地址:https://bishedaima.com/lunwen/54389.html