基于二值神经网络的遥感图像分类与检测方法研究
这是一篇关于遥感图像,图像分类,目标检测,二值神经网络的论文, 主要内容为随着遥感技术的快速发展,遥感图像分类和目标检测任务在城市规划、环境监测、林业农业保护等领域有着重要的研究价值。传统的基于手工特征构建的遥感图像分类与检测模型识别效果不理想,具有明显的局限性。近年来,深度学习的兴起大力推动了遥感图像分类与检测任务的进一步发展,越来越多的深度学习模型被应用在遥感图像处理领域。然而这些复杂的深度卷积神经网络模型具有大量的权重参数,导致其占用存储空间大,消耗计算资源多,难以满足实时性的应用需求。因此需要对网络模型进行压缩以获得轻量化模型,提高计算效率。现有的模型压缩方法主要分为轻量化结构设计、知识蒸馏、模型剪枝以及网络量化等。其中网络量化方法更加有助于深度神经网络模型部署在边缘设备上,因此本文采用网络量化中最具潜力的二值神经网络来实现模型的轻量化设计,通过将传统的卷积操作替换为位运算大幅减少了模型计算量,有效平衡了模型性能与计算成本,对人工智能的应用扩展具有重要意义。本文的主要研究内容如下:(1)针对遥感图像分类模型计算资源与功耗需求大的问题,本文提出了一种基于改进Mobile Net V1的二值神经网络分类模型CABNN(Channel Attention Binary Neural Network)。该方法首先对Mobile Net V1模型进行修改并二值量化,通过引入具有可学习系数的激活函数以及利用近似Sign函数进行反向传播过程中的梯度计算,保留了更多网络中的信息,减少了量化误差。然后本文引入了轻量化的通道注意力机制,通过对不同的通道重新赋予不同的权重以强化重要信息,弱化非重要的信息,提升网络捕获关键信息的能力。为了验证该模型的有效性,本文在四个公开的遥感图像分类数据集上进行了大量实验,实验结果表明本文所提出的模型在计算资源有限的情况下具有更好的综合性能。(2)针对遥感图像目标检测比分类任务更加关注局部特征,常规的网络二值化方法很难直接应用于目标检测任务的问题,本文提出了一种基于信息瓶颈理论的二值神经网络目标检测模型Bi SSD(Binary SSD)。该方法首先在目标检测任务中引入信息瓶颈理论,通过限制高层特征图的信息量,最大化特征图与目标检测之间的互信息来消除冗余信息,减少误报情况。其次对原始的SSD模型进行二值量化,对于检测头部分仍保留实值,以便进行精确检测。然后引入坐标注意力机制,通过在通道注意力中嵌入位置信息,有效增强了特征表达能力,有助于网络能够更加准确的对目标进行定位和识别。为了验证该模型的有效性,本文在两个公开的遥感图像目标检测数据集上进行了实验,实验结果证明本文所提出的模型可以更好地在模型检测精度与计算成本之间取得平衡。
基于BNN的图像分类算法及其硬件实现
这是一篇关于图像分类,CNN,BNN,FPGA加速,通用验证测试平台的论文, 主要内容为在海量图像信息存在的今天,卷积神经网络(Convolutional Neural Networks,CNN)作为一种端到端的图像特征提取器,被广泛应用到诸如图像分类等计算机视觉的各个领域。CNN计算量大、时间复杂度高、存储密集和功耗高,而终端设备资源有限、实时性要求高且需要控制成本,很难实现CNN算法落地,为了部署落地需要设计复杂度低的网络结构和高效硬件架构。现场可编程逻辑门阵列(Field Programmable Gate Array,FPGA)具有并行计算模块,有利于高速高吞吐地处理图像数据,可作为CNN算法部署的平台。二值网络(Binary Neural Network,BNN)是量化后的卷积神经网络,将数据量化为-1(0)或+1,量化后采用单比特计算,消耗更少的存储资源和计算资源。为改善传统测试床(testbench,TB)效率低和通用验证方法学(Universal Verification Methodology,UVM)周期长的缺点,本文设计了通用的算法验证测试平台。本文在现有相关研究的基础上,给出了适合FPGA硬件实现的网络Res Net26-HW,设计了复杂度较低的网络结构和高效并行流水硬件架构,节省了计算资源、存储空间和访存功耗。具体包括:(1)在PyTorch平台上搭建适合硬件实现的RBNN-Res Net网络。针对传统网络难以部署在硬件上的问题,采用二值量化方法压缩网络结构;针对二值量化牺牲的网络精度,设计矩阵旋转方案减小固有角度偏差引起的误差,结合比例因子进一步降低二值向量和全精度向量之间的范数差距;训练时采用均值方差归一化方法对输入数据进行预处理,合理调整图集像素点之间的大小差异;采用全卷积网络设计方法,以步进代替传统池化层,减少网络卷积计算量和非线性计算量。本文给出了二值训练和推理过程并在cifar-10数据集上进行训练和测试,得到适合硬件实现的Res Net18-HW和Res Net26-HW,这两种网络的Top_1分类精度分别为92.2%和86.5%,Res Net26-HW精度相对较低,但是其参数量相比Res Net18-HW降低了21倍,更适合于硬件实现。(2)在FPGA上部署Res Net26-HW网络。针对CNN硬件实现的计算瓶颈,设计二值网络基本运算器,数据类型由fp32量化为binary,将存储成本和运算成本从9(9)(209reg+XOR/add8/mul24)降低到(9)reg(6)R9+XO;针对CNN硬件实现的存储带宽限制,设计输出数据重利用方法和cache缓存机制,并利用矩阵分治的思想实现片上全网络部署;采用Z字滑窗模式解决传统滑窗滑动效率低的问题,减少滑动时选择器的数量;采用基于FIFO预存储的方法设计残差块电路,减少访存次数、降低访存功耗;采用基于Block的设计实现网络层间流水,提高整个网络的处理速度。本文使用高级综合工具(High Level Synthesis,HLS)设计电路并在FPGA加速套件U250上进行加速,结果显示硬件实现的网络和软件实现的网络中间结果、分类结果和分类精度一致,FPGA资源占比为30%,工作频率可达200MHz,较CPU和GPU加速比分别达到60倍和2倍,达到资源、速度和功耗的平衡。(3)在U250板卡上搭建通用的算法验证测试系统。针对传统验证方法效率低和周期长的问题,设计上位机同板卡的通信系统,分别打通图像数据下行和上行传输过程,使用通用的片上传输协议进行高速数据传输,集成上层软件共同构建算法验证测试系统;系统和待测设计(Design Under Test,DUT)接口可选择不同传输协议,适配不同算法模块,提高系统的通用性。本文接口协议为帧行同步-数据-随路时钟,采用该系统对本文算法作正确性验证,系统入口数据率可达3Gbps,达到实时性的要求。
岩石类别与强度的智能图像识别应用研究
这是一篇关于岩石类别,岩石强度,深度学习,图像分类的论文, 主要内容为岩石类别与强度参数快速准确的获取对于建设工程至关重要。然而,一方面过去传统力学试验都存在着耗时长,经济效益差等问题;另一方面现阶段基于岩石图像智能识别研究中,研究者往往只进行了岩石类别的图像识别研究,未能进行岩石强度的智能图像识别研究。基于此,本文运用深度学习理论,采集了大量岩石宏观图像(智能手机拍摄)和岩石微观图像(电子工业显微镜拍摄),建立了岩石类别与强度的智能图像识别模型,并开发了相应岩石智能图像识别应用软件,能够从岩石图像直接得到岩石类别与强度范围。本文主要研究内容和结论如下:1.采集深度学习训练所需要的数据集。为研究哪种规格的岩石图像对岩石参数识别更有效,以重庆地区最常见的几种岩石(泥岩、泥质砂岩、砂质泥岩、砂岩、灰岩)为研究对象,分别对岩石宏观图像和岩石微观图像进行研究。针对岩石宏观图像,使用智能手机拍摄制备好的岩样的横截面,并对拍摄完毕的岩石立马进行岩石单轴抗压强度试验,根据岩石强度划分为9个等级,与岩石宏观图像对应形成训练数据样本集,共采集到不同强度等级和不同岩石类别的宏观图像数据集10506组。针对岩石微观图像,使用工业电子显微镜采集到不同岩石类别的岩石微观图像数据集8514组。2.针对采集到的岩石宏观图像数据集进行深度学习建模训练。基于Res Net残差卷积神经网络构建了岩石类别智能图像识别模型和岩石强度参数智能识别模型。对岩石宏观图像进行深度学习训练的结果进行分析,发现岩石宏观图像智能识别模型的岩石类别识别准确率可达89.2%,强度识别准确可达78.3%。依据训练完的模型,进一步开发了一款微信小程序软件,可以在手机上快速检测岩石类别及其强度参数。3.针对采集到的岩石微观图像数据集进行深度学习建模训练。基于inception v3卷积神经网络建立岩石类别图像识别深度学习模型。对岩石微观图像进行深度学习训练的结果进行分析,发现验证集中模型识别的准确率可达76%,并且在诸如泥岩与砂质泥岩这种岩石宏观图像难以区分的岩样,该模型依然有70%以上的准确率。
面向微流化学的流体安全监测算法研究
这是一篇关于微流控,过程安全,红外热成像,深度学习,图像检测,图像分类的论文, 主要内容为随着全球材料化学领域相关技术的不断发展,微流控技术凭借高通量、低成本、低污染等优势得以普及。微流控芯片及其连接管线在实验时需要满足气密性要求,不可预测的气液泄漏将会对实验人员的安全造成危害。为了降低微流实验室的安全风险,现有的安全监测手段主要依靠人工先验知识与传感器数据分析。人工手段存在着个体差异无法维持客观性;传感器数据分析手段成本较高难以实际应用。因此,结合部分微流化学制备流程,基于计算机视觉方法与红外热成像技术构建了泄漏安全监测算法,并通过横向对比实验验证了算法的可行性。本文的主要研究内容如下:(1)微流流体风险(Fluid risk of microflow,FRM)数据集。基于微流管道存在的气液泄漏风险,构建一个微流气液泄漏数据集。针对微流反应芯片存在的气体泄漏,共收集了微流化学实验场景中2种不同气体泄漏源、4种泄漏流量、2种拍摄距离总计115200帧的图像数据集;针对发生在微流管线上的液体泄漏,共收集了2种不同角度、2种泄漏流量总计57600帧的图像数据集。数据集共计172800张图片,分别以红外灰度图像格式与RGB图像格式保存,上述数据集全部用于后续网络训练。(2)基于红外羽流特征的气液泄漏检测算法。基于微流控系统中泄漏气液的羽流特征构建检测算法。在YOLO目标检测框架的基础上引入小目标检测层,形成S-YOLO框架。使用FRM数据集进行训练和测试,实验结果证实本文提出的算法可以有效地检测微流设备的细小流体泄漏,平均识别精度为85.45%。基本满足微流实验泄漏风险的检测需求。(3)基于微尺度红外特征的液滴泄漏检测算法。根据上述算法在微尺度红外液滴检测方向的不足,提出一种基于微尺度红外特征的液滴泄漏检测算法。以DETR框架作为基准框架,以Deformable DETR框架作为改进方向,分别复现以上框架并将其运用到微尺度液滴泄漏检测任务中。通过引入多种注意力机制、偏移量学习与多尺度特征融合方法,最终提出SEDE-DETR算法,大幅提高网络训练的收敛速度与检测效率。使用FRM数据集中的液体泄漏部分对网络进行横向对比训练,证实此算法可以有效弥补先前方法的不足,对泄漏液体的识别精度为89.52%。(4)基于红外特征的气体泄漏流量检测算法。从气体泄漏的纹理特征与红外特征角度出发,结合气体流量危险等级的分类标准,提出了一种基于红外特征的气体流量检测算法。以ResNet模型作为基准模型,提出基于注意力瓶颈模块的改进模型SETB-Net与基于特征融合的改进模型SETB-Fusion。分别使用上述三种分类模型对FRM数据集中的气体泄漏部分进行横向对比训练,证实本文提出的SETB-Fusion算法对泄漏气体的流量检测效果最好,最佳距离下的检测精度为98.17%基于微流管道存在的气体与液体泄漏风险,构建微流流体风险数据集,分别从气体与液体的红外羽流特征构建安全监测算法,最终通过实验结果证实本文提出的算法均可对微流气液泄漏进行有效检测与分类。
基于深度学习的图像推荐算法研究与实现
这是一篇关于深度学习,图像推荐,目标检测,图像分类,降维,推荐系统,多属性图像的论文, 主要内容为随着信息技术和电子商务的快速发展,电商平台中图像数据量迅速增长。对于电商平台而言,快速从海量的图像数据库中发现用户可能感兴趣的商品图像并推荐给用户,能够有效地提高电商平台的服务质量,提高竞争力。而传统的图像推荐算法是使用基于文本的推荐方法,图像的标注过程需要耗费大量的时间和人力,费时费力效率较低,且图像标注受人类主观因素影响较大。如何提高电商图像的推荐效率成为一个亟待解决的实际问题。近些年来,深度学习成为了人工智能研究热点,已经在图像分类、目标检测和自然语言处理等领域取得了较好的应用效果。本文针对基于深度学习的图像推荐算法进行了研究,提出了一种基于图像内容的推荐算法,该算法主要包含三个深度神经网络,目标是使用深度学习技术弥补传统的图像推荐方法的不足,降低人类主观因素影响和拍摄环境的影响。本文主要研究的内容是多属性图像分类、目标检测算法的优化和基于卷积神经网络特征的降维算法,并以此基础设计了一个图像推荐原型系统,并应用于电商图像推荐中。本文取得的主要创新性成果如下:(1)提出了一种基于改进卷积神经网络的多任务学习方法。该方法借鉴了迁移学习中参数迁移的思想,用于解决传统卷积神经网路无法对商品图像包含的多个属性同时进行分类的问题。针对数据集中特定类型商品较少,存在类别不平衡的问题,提出了一种基于Mixup算法的过采样策略。同时对图像多个属性复杂程度与CNN输出特征矩阵稀疏率的关系进行了研究,并使用改进Grad-CAM算法对图像多个属性识别关键区域进行了可视化分析,提高了网络的可解释性。(2)提出了一种基于自适应池化的Faster-RCNN算法用于商品目标检测。该算法是用于解决传统池化方式不能有效提取电商图像中褶皱、纹理等细节特征的问题。所设计的池化算法基于传统的最大池化模型进行了改进,并将其应用于目标检测算法Faster-RCNN中。实验表明,这种算法对褶皱、纹理信息复杂的商品图像具有更好的识别效果。(3)提出了一种基于深度学习的图像哈希编码算法。该算法首次将多线性主成分分析法应用于卷积神经网络提取特征的降维,目标是解决卷积神经网络提取的图像特征维度过高且各特征之间存在较强相关性的问题,并结合局部敏感哈希算法进行图像哈希编码用于图像检索。实验表明,相较于传统降维方法,多线性主成分分析法对于卷积神经网络提取特征具有更好的降维效果。(4)研究并设计了一个图像推荐原型系统。该系统以本文设计的三个深度神经网络为基础,使用Python语言编写实现。本文将该系统应用于电商图像推荐中,取得了较好的推荐效果。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码客栈 ,原文地址:https://bishedaima.com/lunwen/47865.html