面向生成对抗网络训练的数据增强策略的研究与实现
这是一篇关于图像生成,数据增强,自动搜寻算法,小样本学习的论文, 主要内容为在信息日益丰富的现代社会中,图像在传递信息方面扮演着难以替代的角色。随着深度学习技术的不断发展,图像生成在各个领域发挥的作用愈发重要而影响深远。生成的高质量图像可以弥补原图像集样本量的不足,以使得所训练的模型达到更好的精度和效果。其中,一些特殊类型的图像,如特定人物、珍稀动植物等,相应的生成任务有着样本量小、采集难度大的特点,而在图像生成领域发挥着不可替代作用的生成对抗网络在样本容量受限的情况下性能会大幅下降。目前,学界针对这一问题,有基于迁移学习和基于数据增强两个方向的研究,其中基于数据增强方向的可微增强技术取得了很好的效果,但其数据增强策略是固定的,并不能很好地适配不同类型的数据集。本文在可微增强技术的基础上,提出了一种自动搜寻数据增强策略的训练方法,而不对损失函数和模型的网络结构做出改变。通过实验对比,明显提高了所训练出的生成对抗网络模型的效果。并结合该方法,设计并实现了一套基于生成对抗网络的小样本图像生成系统。本文具体工作内容如下:结合可微增强技术和在图像识别领域取得显著成果的数据增强策略自动搜寻算法PBA,提出了一种适用于生成对抗网络训练的数据增强策略自动搜寻算法PBAG。实验表明,该算法训练出的模型,相较于手动选取增强策略的训练方法,及基于迁移学习的小样本图像生成方法相比,都取得了更好的效果,能够生成更优质的图像。此外,针对神经网络的训练过程对计算机配置要求过高、调参繁琐以及数据需要可视化等问题,本文结合该方法,设计并实现了一套B/S架构的基于生成对抗网络的小样本图像生成系统,以满足深度学习的研究人员扩充小样本图像数据集和管理图像生成任务相关内容的需求。
基于U-Net的致密砂岩储层岩石薄片图像分割方法研究
这是一篇关于致密砂岩薄片,图像分割,数据增广,U-Net,图像生成的论文, 主要内容为致密砂岩图像分割是地质学中的一项重要任务。这项任务能够帮助科研人员准确刻画储层孔隙结构以及流体运聚机理,大大降低勘探开发难度,对于非常规油气储集层的评估和勘探具有重要的应用价值。传统方法通过人工目视对致密砂岩图像进行分割,存在主观性强、效率低下等问题。因此,研究致密砂岩图像自动分割方法能够提高图像分割效率,同时节约人力成本,对于该领域的发展具有重要意义。近年来,深度学习算法在图像分割领域取得了显著成果。然而这类算法仍存在两个主要限制:首先,基于深度学习的图像分割模型需要大量的训练样本来学习尽可能多的可区分特征。然而,受限于数据采集难度较大、标注成本较高以及隐私保护等原因,导致致密砂岩图像样本稀少,难以满足深度学习算法的训练需求。此外,传统的卷积神经网络在提取图像全局信息和长距离依赖关系方面存在不足,容易导致成分识别不准确或分割精度较低等问题。为了解决上述问题,本文以语义分割方法为基础,结合数据变形方法和数据过采样图像增广方法,设计了一种致密砂岩图像增广分割模型,并对模型组成进行了详细的分析和实现。本文的主要研究内容包括以下三个方面:1.针对致密砂岩图像数据量少、多样性不足以及标注成本高的问题,本文提出一种结合自动数据增广算法(Auto Augment)和样式生成对抗网络(Style GAN)的混合图像数据增广方法。首先,为提高数据多样性,本文改进了样式生成对抗网络的样式控制方式和自适应增广强度调整周期,提出基于自注意力的样式生成对抗网络(SA-Style GAN),生成高质量的致密砂岩图像。其次,为扩大数据规模,重新设计自动增广算法的增广策略搜索空间并改进搜索算法,提出基于自适应随机自然梯度法的自动数据增广算法(ASNG-AA),自动搜索最优增广策略,实现带标签的数据增广。最后,为验证增广效果,使用U-Net作为验证算法,通过设计对比试验,证明该方法在生成图像质量和提高模型泛化能力方面具有明显优势。2.针对传统卷积神经网络图像全局信息和长距离依赖关系提取能力不足的问题,提出了一种基于CBAM-Transformer的U-Net致密砂岩图像分割网络(CBAM-Transformer U-Net,CTU-Net)。首先,在U-Net网络中引入通道与空间注意力模块(CBAM),增强模型对全局上下文信息的感知能力。其次,在解码器中添加Transformer模块,帮助模型更好地捕获长距离依赖关系。此外,使用Dice损失函数替代传统的交叉熵损失函数,以减少因数据不平衡而导致的错误分割,从而提高模型的分割准确性。最后,为验证模型的性能,使用增广后的致密砂岩图像训练CTU-Net和其他对比算法,并在测试集上进行分割实验。实验结果表明,CTU-Net模型表现出了最佳的分割性能。3.针对地质领域致密砂岩图像分割业务需求,设计并实现了致密砂岩图像分割系统。该系统以CTU-Net图像分割模型为基础,通过实际应用,验证本文所提方法的有效性。通过与三种基于U-Net的语义分割方法进行比较,实验结果表明,本文提出的致密砂岩图像增广分割模型在识别与分割效果上取得了明显的提升。各成分的识别准确率均在87%以上,分割误差率在16%以下,能够有效实现致密砂岩图像的识别与分割。致密砂岩图像分割系统能够快速自动地对图像进行分割,并分析分割结果,大大提高了工作效率。同时,该模型还可以有效减少由于错误分割而引起的地质特征误判、储层预测错误等后续问题,具有较高的应用价值。
知识图谱指导的场景图像生成
这是一篇关于场景生成,图像生成,深度学习,生成对抗模型的论文, 主要内容为作为计算机视觉领域的研究热点,图像生成任务具有巨大的理论研究价值与实际应用潜力,其中,场景图像生成由于需要同时考虑多个物体以及物体间复杂的交互关系,更具挑战性。然而,当前大多数方法均从复杂的文本描述、场景图、场景布局中生成场景图像,往往需要用户或是详细阐述物体属性及关系,或是构造专业性较强的结构场景图,或是固定物体间的布局关系,因而用户友好性不足。为了给用户提供便捷化的场景图像生成方式,本文基于知识图谱,设计了直接从物体标签生成场景图像的Label2im模型,旨在利用源自图谱的知识信息提升场景图像生成质量。本文围绕场景图像生成过程的各项挑战展开研究,融合知识图谱设计了场景图选择、场景图表示、布局预测、图像生成等模块,实现了“标签—场景图—布局—图像”的生成。针对知识图谱在图像生成任务中的应用进行了有效探索。具体而言:1)针对由于缺乏物体间关系信息导致的场景布局不合理等挑战,本文设计了场景图选择模块,促使模型在知识图谱中自动搜索关系并构建多样化场景图,补充常识性关系信息;2)针对标签域与图像域间存在难以学习的跨域鸿沟等挑战,本文设计了场景图表示模块,融合知识图谱的知识表示,为跨域映射学习充分的特征,加深模型对物体及关系的充分理解;3)针对如何保证生成场景图像与输入内容间的语义一致性等挑战,本文设计了三元组注意力模块,在利用级联细化网络进行图像生成的过程中,加入源自知识图谱的三元组知识特征的指导,提升生成模型对于语义信息的关注。本文设计了对比实验、消融实验与附加实验。对比实验从定量评估与定性评估两个角度验证了本文方法的优异性能;消融实验利用模块的消融设置及实验分析证明了所提出模块的有效作用;附加实验探索了本文方法在不同应用情景下的更多细节与不足之处,从而充分展示、分析并验证了本文方法能够基于给定标签生成高质量的场景图像。
直播虚拟试衣服装售卖系统的设计与实现
这是一篇关于虚拟试衣,服装售卖系统,视频直播处理,图像生成的论文, 主要内容为随着互联网技术和移动设备的不断发展和普及,电商和物流早已逐渐融入人们的日常生活。人们可以足不出户从电商平台购买到自己想要的衣服,尽管如此,现有的电商系统仅为用户提供了衣服的商品展示或特定模特的试穿图片,这会带来与实体店购物最明显的不同,即用户很难判断此商品是否适合自己的身材,这样可能会导致用户放弃购买或不必要的退换商品。为解决这一问题,本文结合视频直播技术和虚拟试衣技术,设计并实现了直播虚拟试衣服装售卖系统,希望用户可以在短暂的视频延迟下观看到自己试穿特定衣服的直播视频。在视频直播中完成虚拟试衣的过程如下。首先,从视频直播流中实时地采集用户图像,将图像中提取的用户身材、姿势和试穿衣服作为深度学习网络的输入。然后对试穿衣服进行变形,进而生成用户试穿某件衣服的图像。最后,将生成的图像作为视频直播流的帧推送至流媒体服务器,此时用户从服务器拉取直播流后可观看到试穿衣服的直播视频。本系统利用了深度学习生成网络的生成结果以及视频直播的实时性,为用户带来了更佳的购物体验。系统通过图像分割技术,将用户图像分割成若干部分,可以保留除衣服以外的其他用户信息。通过人物姿势估计,可以保留用户的姿势和身材信息。在保证图像生成真实性的前提下将形变好的衣服合成到用户身上。本系统为提高用户网络购物满意程度提供了一种新的方法。
知识图谱指导的场景图像生成
这是一篇关于场景生成,图像生成,深度学习,生成对抗模型的论文, 主要内容为作为计算机视觉领域的研究热点,图像生成任务具有巨大的理论研究价值与实际应用潜力,其中,场景图像生成由于需要同时考虑多个物体以及物体间复杂的交互关系,更具挑战性。然而,当前大多数方法均从复杂的文本描述、场景图、场景布局中生成场景图像,往往需要用户或是详细阐述物体属性及关系,或是构造专业性较强的结构场景图,或是固定物体间的布局关系,因而用户友好性不足。为了给用户提供便捷化的场景图像生成方式,本文基于知识图谱,设计了直接从物体标签生成场景图像的Label2im模型,旨在利用源自图谱的知识信息提升场景图像生成质量。本文围绕场景图像生成过程的各项挑战展开研究,融合知识图谱设计了场景图选择、场景图表示、布局预测、图像生成等模块,实现了“标签—场景图—布局—图像”的生成。针对知识图谱在图像生成任务中的应用进行了有效探索。具体而言:1)针对由于缺乏物体间关系信息导致的场景布局不合理等挑战,本文设计了场景图选择模块,促使模型在知识图谱中自动搜索关系并构建多样化场景图,补充常识性关系信息;2)针对标签域与图像域间存在难以学习的跨域鸿沟等挑战,本文设计了场景图表示模块,融合知识图谱的知识表示,为跨域映射学习充分的特征,加深模型对物体及关系的充分理解;3)针对如何保证生成场景图像与输入内容间的语义一致性等挑战,本文设计了三元组注意力模块,在利用级联细化网络进行图像生成的过程中,加入源自知识图谱的三元组知识特征的指导,提升生成模型对于语义信息的关注。本文设计了对比实验、消融实验与附加实验。对比实验从定量评估与定性评估两个角度验证了本文方法的优异性能;消融实验利用模块的消融设置及实验分析证明了所提出模块的有效作用;附加实验探索了本文方法在不同应用情景下的更多细节与不足之处,从而充分展示、分析并验证了本文方法能够基于给定标签生成高质量的场景图像。
直播虚拟试衣服装售卖系统的设计与实现
这是一篇关于虚拟试衣,服装售卖系统,视频直播处理,图像生成的论文, 主要内容为随着互联网技术和移动设备的不断发展和普及,电商和物流早已逐渐融入人们的日常生活。人们可以足不出户从电商平台购买到自己想要的衣服,尽管如此,现有的电商系统仅为用户提供了衣服的商品展示或特定模特的试穿图片,这会带来与实体店购物最明显的不同,即用户很难判断此商品是否适合自己的身材,这样可能会导致用户放弃购买或不必要的退换商品。为解决这一问题,本文结合视频直播技术和虚拟试衣技术,设计并实现了直播虚拟试衣服装售卖系统,希望用户可以在短暂的视频延迟下观看到自己试穿特定衣服的直播视频。在视频直播中完成虚拟试衣的过程如下。首先,从视频直播流中实时地采集用户图像,将图像中提取的用户身材、姿势和试穿衣服作为深度学习网络的输入。然后对试穿衣服进行变形,进而生成用户试穿某件衣服的图像。最后,将生成的图像作为视频直播流的帧推送至流媒体服务器,此时用户从服务器拉取直播流后可观看到试穿衣服的直播视频。本系统利用了深度学习生成网络的生成结果以及视频直播的实时性,为用户带来了更佳的购物体验。系统通过图像分割技术,将用户图像分割成若干部分,可以保留除衣服以外的其他用户信息。通过人物姿势估计,可以保留用户的姿势和身材信息。在保证图像生成真实性的前提下将形变好的衣服合成到用户身上。本系统为提高用户网络购物满意程度提供了一种新的方法。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕业设计驿站 ,原文地址:https://bishedaima.com/lunwen/47803.html