基于视觉系统的六轴机械手的设计与实现——视觉系统的设计与实现
这是一篇关于机器视觉,DSP,智能摄像机,目标定位的论文, 主要内容为本文研究了能够测量不同形状目标物形态参数的机械手视觉系统的设计与实现,介绍了机器视觉发展现状以及发展前景,叙述了检测技术可视化的基本原理,设计了机械手抓取控制系统。在机械手视觉系统硬件设计中,提出了一种基于智能摄像机的智能机器人视觉系统设计方案;在软件设计中采用Blob算法原理编写了应用程序,以求取任意形状目标物的中心坐标及其任一斜边与坐标轴之间的夹角,从而实现对微小或缓慢运动的目标物定位。系统硬件平台是内含TMS320C64XX系列DSP的智能摄像机。利用VC智能摄像机来完成场景图像的采集及量化任务,并利用其自带的嵌入式操作系统及开发平台编写了相应的目标定位程序。本系统具有集成度高,硬件设备体积小,重量轻,安装调试方便,软件处理速度快,处理质量高等优点;大量的实验结果证明,该系统能满足实际项目中对目标姿态信息的需要,目标识别率为100%,最大相对误差小于10%。 本系统具有广阔的应用前景,用户可通过开发不同的应用程序,以用于不同的工业机器视觉应用领域,尤其是图像测量,表面检测,汽车制造业,产品包装和印刷检测,运动分析与跟踪等领域。目前,该系统已完成软、硬件的安装及调试工作,调试结果已经达到了预期的效果。 主要工作如下: 1、查阅国内外有关的文献资料,了解机器视觉和图像处理方面的发展及现状; 2、介绍了机器视觉概念和系统的组成及发展趋势;数字图像处理的基础理论; 3、对机械手视觉系统硬件系统进行了设计与实现,其中包括购买硬件设备前的市场调研,硬件的选型、最终方案的确定及调试; 4、对机械手视觉系统软件系统进行了设计与实现,其中包括不同形状目标物中心坐标的求取方法及目标物某一斜边与x轴之间的夹角的求法,具体包括对常见方法的论述以及本课题中所采用的方法;并对所编写的软件进行了调试,将其固化到智能摄像机内置的DSP芯片上,同时对不同形状目标物进行了实验验证; 5、指出了测量过程中主要的误差来源,并对实验结果与实际值相比较进行了误差分析; 6、对机械手抓取目标物的控制系统进行了设计、编程及仿真实验,分析了存在误差的原因。仿真结果表明文中所设计的机械手抓取控制系统能够正常工作,所提出的抓取控制算法简单、实用。
基于图像细粒度分类的中餐菜品识别系统
这是一篇关于菜品识别,目标定位,细粒度分类,破坏与重构,注意力机制,BiFPN,Swin,级联操纵的论文, 主要内容为菜品识别有广阔应用前景,如自助食物售卖、食品营养评估及分析、热量测量及美食推荐系统等。中餐菜品种类复杂、不同种类菜品之间相似度高、同类菜品具有多种形态,因此中餐菜品识别是计算机视觉领域一个有挑战性的难题。本文立足于中餐菜品图像中常具有多目标的特点,基于中餐菜品分类数据集Chinese FoodNet,补充了多目标的中餐菜品图像,通过级联中餐菜品位置检测模型与中餐菜品细粒度分类模型,开发了可在移动端应用的多/单目标中餐菜品识别系统。主要工作包含以下几个方面:(1)中餐菜品位置检测模型Ca-BiYoLo-Swin。由于目前公开的大型数据集仅有中餐分类数据集,完成多目标检测任务还需图像中目标位置信息,本文在YOLOv5-S的基础上,优化检测网络对位置信息敏感度与推理速度,得到CaBiYoLo-Swin。在特征提取阶段,将坐标注意力机制嵌入CSP1模块提高模型在空间中捕获远程依赖关系的能力和对空间位置信息的敏感度;在特征融合阶段,在CSP2模块中引入swin编码参数,增强特征图内部的空间语义信息,并使用BiFPN思想改进原有FPN结构,提高模型泛化能力。针对GPU平台,使用卷积优化Focus切片操纵;使用串联同等大小池化核优化SPP结构。实验结果表明,Ca-Bi Yolo-Swin网络相比原YOLOv5-S能更快捷有效的定位出CFood-Loc数据集目标区域。(2)中餐菜品细粒度分类模型DCL-EfficientNetV2。针对中餐菜品类内差距大,类间差距小,图像种类特征难提取的问题,提出DCL-EfficientNetV2模型。为了更好提取图像中的类别特征,在数据处理阶段引入破坏分支,将特征图打乱并重构;加入对抗性损失函数,提高网络对判别性区域特征的学习能力降低噪音影响;网络结构设计中使用Efficient V2-S提取图像特征并在MBconv模块中采取不降维局部跨信道交互策略;采用Softpool下采样方法,更好的保留特征图细节信息。训练阶段,采用区域对齐网络引导骨干网络通过端到端训练对局部区域之间进行相关性建模,帮助骨干网络理解目标。本文使用Chinese FoodNet进行测试,Top-1准确率为82.6%,Top-5准确率为96.7%,优于现有主流模型识别准确率。相比原破坏重构方法和EfficientNetV2-S,在经典细粒度数据集CUB-200-2011,Cars196和Aircrafts100数据集上,正确率分别提升3.5%、1.2%、1.7%和4.2%、2.9%、6%。(3)基于移动端的中餐菜品识别系统。为了便于应用本系统,开发了移动端的用户界面,并通过网络访问中餐菜品位置检测模型和中餐菜品细粒度分类模型得到检测结果,为管理员提供菜品信息管理;为用户提供注册登录,(多/单)中餐识别,原料、营养查询,上传图像功能。性能稳定,有较高实用性。
汽车轮胎字符识别方法研究及分组系统设计
这是一篇关于汽车轮胎,字符识别,分组系统,图像预处理,目标定位的论文, 主要内容为汽车轮胎字符是轮胎生产厂家在生产中通过模具压印在轮胎侧表面用于记录参数信息的字符,包含产地、工厂代码和生产日期等信息。为了保证流向市场的轮胎不是存放时间较长轮胎,厂家会在出库之前采用人工识别字符的方式,挑选出存放超过一定期限的轮胎。若轮胎存放超过一定期限,会导致橡胶老化,影响使用安全,对客户及厂家会造成巨大损失。如果采用自动识别技术对轮胎字符进行识别并对超期轮胎分组,则不仅可以减少人力物力的消耗,而且可以实现厂家对轮胎的追溯与管理。针对上述问题,本文设计了汽车轮胎字符识别与分组系统,主要工作内容集中在如下几方面:首先针对工厂仓库环境和轮胎成像特点,对整个系统进行结构设计,并选取合适的相机、镜头和光源等搭建出图像采集装置,对汽车轮胎进行实时采集。对采集到的图像进行图像预处理操作,增强轮胎字符区域与背景区域对比度,并通过极坐标转换将轮胎圆环区域转为矩形区域。之后对轮胎字符进行定位,由于DOT标识字符与被识别字符相对位置固定,通过定位DOT字符来确定被识别字符的位置信息,分别使用模板匹配、Faster R-CNN、Yolov4和改进Yolov4进行定位对比实验。经实验发现,替换Yolov4的主干网络,并引入注意力机制对Yolov4进行改进,对定位速度具有很大提升,每秒传输帧数达到101.4789,准确率达到97.76%,表明改进后的Yolov4对本文轮胎字符定位具有良好效果。其次对定位之后的轮胎字符进行识别,将字符图像提取多种特征送入支持向量机进行模型训练。针对经典LeNet-5网络提出改进,提出了引入BN层,添加Inception模块等改进方法。使用基于支持向量机、LeNet-5网络和改进LeNet-5网络进行识别实验,最终发现改进LeNet-5网络识别准确率有所提高,达到99.4%,相比于经典LeNet-5网络提升了3.3%,识别速度达到64毫秒每张。最后在Qt软件平台进行系统软件设计,系统加载预训练好的模型,可实现在线识别检测,能够在主界面直接查看识别结果和分组结果,并可以将识别数据上传至数据库,实现远程的操作查看,方便轮胎追溯管理。
汽车轮胎字符识别方法研究及分组系统设计
这是一篇关于汽车轮胎,字符识别,分组系统,图像预处理,目标定位的论文, 主要内容为汽车轮胎字符是轮胎生产厂家在生产中通过模具压印在轮胎侧表面用于记录参数信息的字符,包含产地、工厂代码和生产日期等信息。为了保证流向市场的轮胎不是存放时间较长轮胎,厂家会在出库之前采用人工识别字符的方式,挑选出存放超过一定期限的轮胎。若轮胎存放超过一定期限,会导致橡胶老化,影响使用安全,对客户及厂家会造成巨大损失。如果采用自动识别技术对轮胎字符进行识别并对超期轮胎分组,则不仅可以减少人力物力的消耗,而且可以实现厂家对轮胎的追溯与管理。针对上述问题,本文设计了汽车轮胎字符识别与分组系统,主要工作内容集中在如下几方面:首先针对工厂仓库环境和轮胎成像特点,对整个系统进行结构设计,并选取合适的相机、镜头和光源等搭建出图像采集装置,对汽车轮胎进行实时采集。对采集到的图像进行图像预处理操作,增强轮胎字符区域与背景区域对比度,并通过极坐标转换将轮胎圆环区域转为矩形区域。之后对轮胎字符进行定位,由于DOT标识字符与被识别字符相对位置固定,通过定位DOT字符来确定被识别字符的位置信息,分别使用模板匹配、Faster R-CNN、Yolov4和改进Yolov4进行定位对比实验。经实验发现,替换Yolov4的主干网络,并引入注意力机制对Yolov4进行改进,对定位速度具有很大提升,每秒传输帧数达到101.4789,准确率达到97.76%,表明改进后的Yolov4对本文轮胎字符定位具有良好效果。其次对定位之后的轮胎字符进行识别,将字符图像提取多种特征送入支持向量机进行模型训练。针对经典LeNet-5网络提出改进,提出了引入BN层,添加Inception模块等改进方法。使用基于支持向量机、LeNet-5网络和改进LeNet-5网络进行识别实验,最终发现改进LeNet-5网络识别准确率有所提高,达到99.4%,相比于经典LeNet-5网络提升了3.3%,识别速度达到64毫秒每张。最后在Qt软件平台进行系统软件设计,系统加载预训练好的模型,可实现在线识别检测,能够在主界面直接查看识别结果和分组结果,并可以将识别数据上传至数据库,实现远程的操作查看,方便轮胎追溯管理。
基于图像细粒度分类的中餐菜品识别系统
这是一篇关于菜品识别,目标定位,细粒度分类,破坏与重构,注意力机制,BiFPN,Swin,级联操纵的论文, 主要内容为菜品识别有广阔应用前景,如自助食物售卖、食品营养评估及分析、热量测量及美食推荐系统等。中餐菜品种类复杂、不同种类菜品之间相似度高、同类菜品具有多种形态,因此中餐菜品识别是计算机视觉领域一个有挑战性的难题。本文立足于中餐菜品图像中常具有多目标的特点,基于中餐菜品分类数据集Chinese FoodNet,补充了多目标的中餐菜品图像,通过级联中餐菜品位置检测模型与中餐菜品细粒度分类模型,开发了可在移动端应用的多/单目标中餐菜品识别系统。主要工作包含以下几个方面:(1)中餐菜品位置检测模型Ca-BiYoLo-Swin。由于目前公开的大型数据集仅有中餐分类数据集,完成多目标检测任务还需图像中目标位置信息,本文在YOLOv5-S的基础上,优化检测网络对位置信息敏感度与推理速度,得到CaBiYoLo-Swin。在特征提取阶段,将坐标注意力机制嵌入CSP1模块提高模型在空间中捕获远程依赖关系的能力和对空间位置信息的敏感度;在特征融合阶段,在CSP2模块中引入swin编码参数,增强特征图内部的空间语义信息,并使用BiFPN思想改进原有FPN结构,提高模型泛化能力。针对GPU平台,使用卷积优化Focus切片操纵;使用串联同等大小池化核优化SPP结构。实验结果表明,Ca-Bi Yolo-Swin网络相比原YOLOv5-S能更快捷有效的定位出CFood-Loc数据集目标区域。(2)中餐菜品细粒度分类模型DCL-EfficientNetV2。针对中餐菜品类内差距大,类间差距小,图像种类特征难提取的问题,提出DCL-EfficientNetV2模型。为了更好提取图像中的类别特征,在数据处理阶段引入破坏分支,将特征图打乱并重构;加入对抗性损失函数,提高网络对判别性区域特征的学习能力降低噪音影响;网络结构设计中使用Efficient V2-S提取图像特征并在MBconv模块中采取不降维局部跨信道交互策略;采用Softpool下采样方法,更好的保留特征图细节信息。训练阶段,采用区域对齐网络引导骨干网络通过端到端训练对局部区域之间进行相关性建模,帮助骨干网络理解目标。本文使用Chinese FoodNet进行测试,Top-1准确率为82.6%,Top-5准确率为96.7%,优于现有主流模型识别准确率。相比原破坏重构方法和EfficientNetV2-S,在经典细粒度数据集CUB-200-2011,Cars196和Aircrafts100数据集上,正确率分别提升3.5%、1.2%、1.7%和4.2%、2.9%、6%。(3)基于移动端的中餐菜品识别系统。为了便于应用本系统,开发了移动端的用户界面,并通过网络访问中餐菜品位置检测模型和中餐菜品细粒度分类模型得到检测结果,为管理员提供菜品信息管理;为用户提供注册登录,(多/单)中餐识别,原料、营养查询,上传图像功能。性能稳定,有较高实用性。
基于深度特征的细粒度图像检索方法研究
这是一篇关于卷积神经网络,细粒度图像检索,局部特征,目标定位的论文, 主要内容为细粒度图像检索是图像检索领域中具有广阔前景的课题,可应用于电商图像搜索、科研动植物图像搜索等领域。随着深度学习在计算机视觉上的成功应用,出现了许多基于深度学习的细粒度图像检索算法,但这些算法忽略了部分局部细节信息,导致了检索性能瓶颈。本文面向该问题,对细粒度图像检索方法展开研究,主要工作和贡献如下:(1)针对全局特征对细粒度图像描述不充分,忽略细节信息,造成检索性能瓶颈的问题,设计了一种融合全局与局部特征的三分支网络模型。该网络由一条全局分支和两条用于提取不同粒度局部特征的局部分支构成,其中,局部分支采用了切分特征图的策略,通过将特征图切分成不同数量的小块,使网络关注到局部区域上不同粒度的细节特征。考虑到细粒度图像的特点,本文提出了两种切分特征图的实现方式,一种是等分切分,另一种是根据感受野大小有重叠的切分。此外,为了对嵌入空间中的特征距离做出约束,引入了深度度量学习损失函数对网络进行训练。在网络完成训练之后,利用该网络模型分别提取全局特征和局部特征,通过晚融合将提取出的全局与局部特征融合,再进行检索。实验结果表明:与MPFE模型相比,本文设计的三分支网络实现简单,在鸟类数据集CUB-200-2011上的召回率(Recall@1)提高了 2.9%,在车类数据集Cars-196上的召回率(Recall@1)提高了4.1%。(2)针对三分支网络存在的局限性,设计了一种由目标定位模块和判别性特征提取模块组成的网络模型。首先,为了减少复杂背景的干扰,该网络在特征提取前引入目标定位模块,通过对卷积特征描述子进行筛选,将主要对象从背景图像中分离出来,滤除大部分的背景干扰。其次,由于利用切分特征图来提取局部判别性特征,会导致一些分块中只有极少量的目标对象信息,不利于网络的训练学习和整体性能的提升。为解决该问题,网络引入判别滤波器组作为局部特征检测器,通过判别滤波器组可以在原始特征图上直接提取局部判别性特征。实验结果表明:对比三分支网络模型,该模型在鸟类数据集CUB-200-2011上的召回率(Recall@1)提高了5.4%,在车类数据集Cars-196上的召回率(Recall@1)提高了 1.6%。(3)本文基于提出的算法设计了一款简易的检索软件,实现了检索结果的可视化。用户也可对结果做出反馈,以便更准确地查找到所需要的内容。该系统页面简洁,检索结果准确,可以较好地体现所提出方法的实用性和有效性。
基于UWB的煤矿井下数字孪生定位关键技术研究
这是一篇关于智慧矿山,数字孪生,目标定位,扩展粒子滤波的论文, 主要内容为煤矿井下目标位置信息是实现智慧矿山的重要支撑保障。受条件限制,井下定位算法的评估大都基于仿真环境,未能充分考虑实际巷道环境及定位基站部署等因素对定位精度的影响。此外,由于井下环境复杂恶劣,在地面效果良好的定位技术无法直接应用到井下。针对上述问题,本文设计了煤矿井下数字孪生定位系统框架,为定位算法评估提供矿井孪生环境,并且基于超宽带(Ultra Wide Band,UWB)/惯性量测单元(Inertial Measurement Unit,IMU)提出改进定位算法,以提升井下目标定位性能。主要研究内容如下:(1)针对井下定位算法难以实地评估,而基于高斯噪声假设的仿真实验又不能保证评估结果真实性的问题,提出一种煤矿井下数字孪生定位系统框架。该框架包括物理空间、数字空间、孪生服务、孪生数据和连接五部分,可以实现井下环境、测距信息的实时获取,并为用户提供孪生环境定制、孪生定位实验等服务。为了在孪生环境下还原UWB基站实际测距误差,在数字空间中提出测距行为模型,有效刻画了遮挡物和距离对测距精度的影响。(2)针对扩展粒子滤波(Extended Particle Filter,EPF)算法存在粒子分布不合理和粒子贫化的问题,首先提出基于目标加速度的AF-EPF算法,利用粒子三轴加速度概率,结合权重偏移参数对粒子状态进行偏移,提高粒子多样性。进一步,研究基于巷道拓扑约束和目标运动约束的粒子筛选优化策略,利用巷道结构特点以及IMU获取的加速度信息对粒子进行约束,提出AF-TP-EPF算法。通过实验验证了上述算法相比EPF的优越性。(3)在上述研究的基础上,开发了煤矿井下数字孪生定位系统,实现了孪生漫游、孪生环境定制和孪生定位实验等功能。针对煤矿井下复杂环境和实际孪生服务需求,基于Vue生命周期和Promise机制完成变量优化和模型分层同步加载,采用Web Socket和JSON进行实时通信和算法调用,借助键鼠监听事件实现孪生体拾取、目标操控和碰撞检测,提高了系统性能和用户体验。该论文有图47幅,表9个,参考文献85篇。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设工厂 ,原文地址:https://bishedaima.com/lunwen/52463.html