细粒度轻量级快餐菜品AI识别技术研究
这是一篇关于菜品识别,旋转目标检测,目标检测,细粒度图像分类的论文, 主要内容为随着计算机视觉技术的大规模应用,图像识别技术已经开始遍布人们的日常生活,并带来了巨大的便利。与此同时,一些食堂和快餐餐厅也逐渐紧跟时代的步伐,使用图像识别技术进行菜品识别,实现菜品的自动识别计价与收银。然而传统机器学习和深度学习方案为了保证菜品识别的准确率而限定死餐厅的菜单,这与中餐菜品菜系多样性以及菜品配料具有的时令性特点相悖,严重降低了顾客的用餐体验,弊端较为明显。目前面向快餐、大食堂的基于图像识别的菜品识别收银机系统还存在以下问题:(1)中式菜品烹饪方式复杂、原料多变,相同菜品不同厨师制作时的配料占比不同,差异较大;不同菜品在外形上也会出现很相似的情况,因此如何识别菜品目标间细微的差别,从而达到精细区分的目标,成为不得不攻克的难点。(2)传统菜品识别定位模型均使用矩形框进行定位,但实际场景中常见椭圆形和长条形餐盘,矩形框定位容易将相邻餐盘局部内容框入,严重影响识别精度。(3)当新菜品出现时,需重新训练并更换菜品模型才能具有对新菜品的识别能力,然而现有的基于图像识别的菜品识别收银机系统的模型更新只能由专业的系统维护人员操作,不具有便捷性,无法及时对新菜品进行有效识别。因此,如何实现菜品识别模型的快速训练和及时更换成为困扰该类应用的另一个难点。针对以上问题,本文的主要工作如下:(1)将菜品识别拆分为菜品检测和菜品分类两个独立的步骤,以简化模型更换流程。在菜品检测阶段,提出一个轻量级菜品旋转目标检测网络LR-Center Net,在模型体量减小为YOLO-v3的1/28.3的同时仍能保持较好的识别精度,获取到更精准的菜品位置信息;在菜品分类阶段,提出一种基于注意力机制的弱监督双线性细粒度菜品分类网络AB-CNN,在自制中式快餐数据集Chinese Fast Food-65中取得了85.9%的准确率,实现了对菜品的精细区分。(2)将LR-Center Net网络和AB-CNN网络进行结合,构建细粒度轻量级快餐菜品AI识别模型,并基于该模型开发了菜品识别自助收银机系统,实现菜品识别模型的快速训练、随时更换,在多家餐厅得到了实际的应用并取得令人满意的效果。
基于深度学习的蚕茧分类识别技术研究
这是一篇关于蚕茧识别,深度学习,特征融合,细粒度图像分类的论文, 主要内容为蚕茧是高级纺织原料,为了保证纺织品质量在缫丝之前会对蚕茧进行分类识别。近些年,随着缫丝企业对蚕茧分类识别准确率的要求越来越高,人工识别蚕茧类别的方法己经很难满足企业连续生产的要求。因此如何提升蚕茧分类识别准确率成为企业关注与研究的重点。为了提升蚕茧分类识别的准确率,本文主要对基于深度学习的蚕茧分类识别技术进行了研究。研究成果如下:提出了基于无监督的区域定位与特征融合的蚕茧图像分类识别方法。该方法首先利用预训练的Res Net50网络模型无监督的定位蚕茧区域,然后沿着图像高度方向将蚕茧区域进行两等分,并将蚕茧区域和两等分后的图像输入到神经网络进行训练与分类,最后对分类后的上车茧与黄斑茧再使用图像处理技术进行重分类。实验结果表明,本章提出的方法比VGGNet19和Res Net50的分类识别准确率分别高出1.2%和0.6%。提出了基于非局部注意力机制和多尺度感受野融合的蚕茧图像分类识别方法。本章引入了多尺度感受野融合模块、非局部模块、通道注意力模块以提升Res Net50模型在蚕茧分类中的表现。大量的消融实验证明本章提出的方法较原始Res Net50有明显的精度提升。实现了基于Efficient Det的蚕茧图像分类识别方法。本章首先利用左下角填充算法构建了适用于多蚕茧同时分类识别的数据集,然后使用该数据集训练Efficient Det网络模型。实验结果表明,Efficient Det D2网络对蚕茧检测准确率达到最高并且优于YOLO v5s和SSD网络模型的检测准确率。
基于注意力引导的细粒度图像分类算法研究
这是一篇关于细粒度图像分类,注意力机制,图卷积神经网络,Transformer的论文, 主要内容为图像分类是人工智能在现代工业界最为热点的应用方向,而细粒度图像分类相比于通用图像分类,具有类内差异大和类间差异小的特点。相比于强监督的人工标注的人力耗费,仅仅需要图像标签的弱监督细粒度图像分类成为了学术界主流的研究方向。且主要的研究方向可以分为基于CNN的部件定位和特征融合方法,部件定位侧重于挖掘图像最具有判别力的图像区域,然后充分利用区域中的特征进行细粒度图像分类,特征融合方法侧重于端到端提取图片的特征。通过对比分析经典的网络模型,本文设计并实现了更优秀的细粒度图像分类算法模型。本文的主要工作可以总结为如下三个方面:(1)细粒度图像分类经典算法研究。本章分别研究了基于部件定位的NTS-Net算法、基于特征融合的HBP算法和基于视觉注意力的MA-CNN算法。详细研究了每个代表算法的基本框架原理和模型具体实现细节,分析代表算法的优缺点,结合常用细粒度图像分类数据集对比分析不同算法的精度,最后对如何提取具有判别力的特征进行思路分析和总结。(2)基于注意力机制和图卷积神经网络的细粒度图像分类算法。从特征的重要性出发,将CBAM模块嵌入ResNet-50骨干网络中,来提取输入图像最重要的特征区域,通过部件注意力池化模块来提取部件的特征矩阵,转为后续所需的节点表示,加入图卷积神经网络来探索区域特征向量之间的内部语义关联,以获得更好的识别能力。最后通过消融实验和对比实验验证了本章设计算法的合理性及有效性。(3)基于自注意力的细粒度图像分类算法。本章分析了第三章算法的优缺点,考虑到视觉Transformer对比ResNet-50,其拥有的自注意力机制更能提取图片的全局特征,本章提出了基于特征融合Transformer的细粒度图像分类算法,通过空洞卷积来扩大感受野,捕获多尺度上下文信息,直接使用特征分层的思想将不同膨胀率的空洞卷积的输出分层相加,即将不同感受野相加,充分发挥ResNet和Transformer结构的优势,兼顾图像的局部特征和全局特征。最后通过消融实验和对比实验验证了本章设计算法的合理性及有效性。
基于遥感影像的陕西榆林草原生态监测系统的设计与实现
这是一篇关于遥感图像,深度学习,注意力机制,细粒度图像分类,草原生态监测的论文, 主要内容为草原生态作为地球生态系统的重要组成部分,对维护国家生态安全、推进生态文明建设具有不可替代的基础性、战略性作用。草原资源监测是草原生态监测管理的一个重要环节,其主要目的是摸清楚草原资源家底情况,构建草原资源管理“一张图”,以便于综合评价草原资源现状,进而为科学开展环境保护、修复、利用与管理等后续工作提供强有力的数据支撑,因此必须把生态监测作为草原资源的基础性工作来看待。本文针对陕西榆林地区的草原生态监测任务所面临的林草分类问题,结合细粒度图像分类的研究方法,在传统的DeepLab V3+算法上进行改进,将CBAM注意力机制模块集成到原始网络中,提升其提取可用于区分林草的细粒度特征的能力。实验表明,相较于传统的DeepLab V3+,改进后的算法m IOU从62.80%提升到63.25%,并在林地和草地的区分上有更好的效果。接着在该深度学习模型的基础上开发用于草原生态监测的可视化系统。本文的主要研究以及相关结论如下:(1)基于DeepLab V3+算法设计一个能完成大规模遥感图像解译任务,且能精确划分林草的高精度语义分割模型。作为语义分割领域中的经典算法,DeepLab V3+在遥感图像的语义分割方面有很好的效果,所以本文选择该算法作为基础算法模型。为了能够在林地与草地这两类相似的地物上取得更好的分类效果,在算法的改进过程中借鉴基于注意力机制的细粒度图像分类算法领域的研究成果。本研究一方面改进DeepLab V3+算法的特征提取网络,另一方面在其空洞空间金字塔池化(ASPP)前添加CBAM模块以提取图像的细节特征。加入注意力机制可以提高算法的自适应能力,使其对林地与草地之间的细微差别更加敏感,从而实现对林草的精准分类,满足草原生态监测的需求。通过实验发现,相较于现有的语义分割模型,本研究所提出的改进算法在林地与草地的识别效果上具有更高的准确度。(2)调研现有的生态监测系统,结合本研究所面向的特定应用场景,设计并实现了基于遥感影像的草原生态监测系统。在进行需求分析和总体设计的过程中发现除了基于语义分割模型计算研究区内草原分布与占比外,关注特定类别的地物,监测是否有人类活动痕迹等也应该是系统的重要功能。据此,本文除了训练用于林草精确分类的地物分类算法,还训练了多个深度学习模型,应用于不同的解译任务,通过实验验证,所训练的模型都可以达到预期的效果。本研究设计的系统具有以下功能模块:地物分类模块、目标检测模块、目标提取模块、变化检测模块以及数据集管理功能模块。本研究在开发过程中使用Python语言,利用Pytorch深度学习框架实现并训练、部署各个功能模块所需要的算法。系统的前端使用Vue框架,后端使用Django框架。最后展示了系统的主要功能界面和测试方案,可以确认系统的基本功能正常,系统界面简洁美观。
细粒度轻量级快餐菜品AI识别技术研究
这是一篇关于菜品识别,旋转目标检测,目标检测,细粒度图像分类的论文, 主要内容为随着计算机视觉技术的大规模应用,图像识别技术已经开始遍布人们的日常生活,并带来了巨大的便利。与此同时,一些食堂和快餐餐厅也逐渐紧跟时代的步伐,使用图像识别技术进行菜品识别,实现菜品的自动识别计价与收银。然而传统机器学习和深度学习方案为了保证菜品识别的准确率而限定死餐厅的菜单,这与中餐菜品菜系多样性以及菜品配料具有的时令性特点相悖,严重降低了顾客的用餐体验,弊端较为明显。目前面向快餐、大食堂的基于图像识别的菜品识别收银机系统还存在以下问题:(1)中式菜品烹饪方式复杂、原料多变,相同菜品不同厨师制作时的配料占比不同,差异较大;不同菜品在外形上也会出现很相似的情况,因此如何识别菜品目标间细微的差别,从而达到精细区分的目标,成为不得不攻克的难点。(2)传统菜品识别定位模型均使用矩形框进行定位,但实际场景中常见椭圆形和长条形餐盘,矩形框定位容易将相邻餐盘局部内容框入,严重影响识别精度。(3)当新菜品出现时,需重新训练并更换菜品模型才能具有对新菜品的识别能力,然而现有的基于图像识别的菜品识别收银机系统的模型更新只能由专业的系统维护人员操作,不具有便捷性,无法及时对新菜品进行有效识别。因此,如何实现菜品识别模型的快速训练和及时更换成为困扰该类应用的另一个难点。针对以上问题,本文的主要工作如下:(1)将菜品识别拆分为菜品检测和菜品分类两个独立的步骤,以简化模型更换流程。在菜品检测阶段,提出一个轻量级菜品旋转目标检测网络LR-Center Net,在模型体量减小为YOLO-v3的1/28.3的同时仍能保持较好的识别精度,获取到更精准的菜品位置信息;在菜品分类阶段,提出一种基于注意力机制的弱监督双线性细粒度菜品分类网络AB-CNN,在自制中式快餐数据集Chinese Fast Food-65中取得了85.9%的准确率,实现了对菜品的精细区分。(2)将LR-Center Net网络和AB-CNN网络进行结合,构建细粒度轻量级快餐菜品AI识别模型,并基于该模型开发了菜品识别自助收银机系统,实现菜品识别模型的快速训练、随时更换,在多家餐厅得到了实际的应用并取得令人满意的效果。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕业设计货栈 ,原文地址:https://bishedaima.com/lunwen/52340.html