基于深度学习的时空预测模型在交通领域的研究及应用
这是一篇关于时空预测,深度学习,Involution网络,动态卷积,微服务的论文, 主要内容为近年来随着城市化进程的不断推进,智能城市的建设也成为当下热点,其中的时空预测有着巨大的现实意义。准确预测城市各个区域的人流量,对于防止公共安全事件的发生有着重要的作用,准确预测城市各个区域的出行需求,对于出租车公司提前进行出租车调度有着重要价值。本文针对时空数据的特征,利用深度学习,构建了两个时空预测模型,并在此基础上设计并实现了城市区域出租车需求预测系统。本文的工作包含以下三个方面:(1)基于对时空数据的分析,并针对CNN网络模型在时空数据挖掘中的不足,将新的网络结构Involution和SE-Net引入到预测模型中,提出一个CNN网络模型和Involution混合的时空预测模型ST-Res Invo Net,并将ST-Res Invo Net应用到城市区域人流量预测和城市区域出行需求预测,在两个真实数据集上进行模型的对比实验,根据实验结果显示,本文提出的ST-Res Invo Net预测效果最好。(2)针对使用固定尺寸卷积核建模空间依赖在时空预测中的不足,将动态卷积核机制引入到预测模型中,提出一种能动态选择卷积核尺寸的时空预测模型ST-DKNet,并将ST-DKNet应用到城市区域人流量预测和城市区域出行需求预测,在两个真实数据集上进行模型的对比实验,根据实验结果显示,本文提出的ST-DKNet预测效果最好。(3)以本文提出的时空预测模型为核心,基于微服务架构设计并实现了城市区域出租车需求预测系统。该系统实现了如下功能:城市区域出租车需求预测、轨迹数据和天气数据的采集、处理和存储、出租车需求预测结果的可视化展示和消息投递、出租车的管理和地图可视化展示、模型训练以及部署、训练日志的存储和查询、平台数据收集和可视化展示。
基于深度学习的时空预测模型在交通领域的研究及应用
这是一篇关于时空预测,深度学习,Involution网络,动态卷积,微服务的论文, 主要内容为近年来随着城市化进程的不断推进,智能城市的建设也成为当下热点,其中的时空预测有着巨大的现实意义。准确预测城市各个区域的人流量,对于防止公共安全事件的发生有着重要的作用,准确预测城市各个区域的出行需求,对于出租车公司提前进行出租车调度有着重要价值。本文针对时空数据的特征,利用深度学习,构建了两个时空预测模型,并在此基础上设计并实现了城市区域出租车需求预测系统。本文的工作包含以下三个方面:(1)基于对时空数据的分析,并针对CNN网络模型在时空数据挖掘中的不足,将新的网络结构Involution和SE-Net引入到预测模型中,提出一个CNN网络模型和Involution混合的时空预测模型ST-Res Invo Net,并将ST-Res Invo Net应用到城市区域人流量预测和城市区域出行需求预测,在两个真实数据集上进行模型的对比实验,根据实验结果显示,本文提出的ST-Res Invo Net预测效果最好。(2)针对使用固定尺寸卷积核建模空间依赖在时空预测中的不足,将动态卷积核机制引入到预测模型中,提出一种能动态选择卷积核尺寸的时空预测模型ST-DKNet,并将ST-DKNet应用到城市区域人流量预测和城市区域出行需求预测,在两个真实数据集上进行模型的对比实验,根据实验结果显示,本文提出的ST-DKNet预测效果最好。(3)以本文提出的时空预测模型为核心,基于微服务架构设计并实现了城市区域出租车需求预测系统。该系统实现了如下功能:城市区域出租车需求预测、轨迹数据和天气数据的采集、处理和存储、出租车需求预测结果的可视化展示和消息投递、出租车的管理和地图可视化展示、模型训练以及部署、训练日志的存储和查询、平台数据收集和可视化展示。
基于改进U-Net的医学图像分割方法
这是一篇关于多类型病灶分割,DTA-UNet,动态卷积,注意力机制的论文, 主要内容为医学图像分割方法可以辅助医生对病灶做出更快的量化与诊断,并给出更加准确的治疗方案。然而在实际的临床应用中,不同疾病类型、不同影像类型以及不同病例之间的差异使得医学图像分割模型的鲁棒性与泛化能力表现不佳。U型网络(U Network,U-Net)虽然是一种通用型的病灶分割框架,但仍存在特征表达能力有限、分割不够精准的问题,构建一个具有多类型病灶分割的通用模型极具挑战。为此,本文提出了一种基于动态卷积分解(Dynamic Convolution Decomposition,DCD)和三重注意力(Triplet Attention,TA)相结合的DTA-UNet(Dynamic convolution decomposition and Triplet Attention U-Net,DTA-UNet)模型,并在三种不同类型的医学影像数据集上实现了多种疾病的精确分割。本文的主要研究内容如下:(1)针对Attention U-Net中常规卷积导致特征表达能力不足的问题,提出了基于DCD的Attention U-Net分割算法。该算法使用DCD替换其编码-解码过程中的全部常规卷积,以参数量换取性能提升,在脑卒中分割数据集上交并比(Intersection over Union,Io U)、Dice相似系数(Dice Similarily Coefficient,DSC)和精确率(Precision,Pre)分别提升了0.0321、0.0328和0.0500,豪斯多夫距离(Hausdorff Distance,HD)降低了0.1137。实验结果表明,DCD的引入可以有效提高Attention U-Net的特征表达能力。(2)针对Attention U-Net单一跳跃连接导致全局上下文信息提取不足的问题,提出了基于TA的Attention U-Net分割算法,有效捕获了长距离依赖关系,突出了病变区域和病变边界,弱化了背景等无关信息的影响。注意门(Attention Gate,AG)和TA相结合方式在于输入AG模块的两个特征图是经过TA修正后的,这样可以强化相同的感兴趣区域,对于感兴趣区域产生不同的特征信息进行保留,以便结合后续分割过程中遇到相同区域的特征信息。在脑卒中分割数据集上,Io U、DSC和PRE分别提升了0.0247、0.0225和0.0611,HD下降了0.1102。实验结果表明,AG和TA相结合的方式有利于模型更加关注病变区域,更加有利于脑卒中的精准分割。(3)基于上述两种算法的成功,将上述DCD和TA同时引入Attention U-Net,提出了一种通用型病变分割框架DTA-UNet,在脑卒中、新冠肺炎和皮肤病变三种不同疾病分割任务上与6种先进的方法进行了对比,各项指标均取得较好结果,其中DSC分别提升了0.0431,0.0672和0.0161,HD分别下降了0.0928,0.3947和0.3305。实验结果表明DTA-UNet具有不错的鲁棒性能。
基于轻量级卷积神经网络的图像型火灾检测算法研究
这是一篇关于火灾检测,深度学习,目标检测,轻量级网络,动态卷积的论文, 主要内容为火灾是日常生活中极具破坏力的灾害,及时发现并报警具有十分重要的意义。与基于传统传感器的火灾检测方法相比,基于视觉的火灾检测方法具有准确度高、响应速度快、应用范围广、报警信息丰富等诸多优点。早期的图像型火灾检测方法基于颜色、形状、纹理等传统特征,难以适应复杂环境下的火灾检测。随着深度学习技术快速发展,基于卷积神经网络和目标检测的火灾检测方法逐渐成为研究热点。然而,现有基于深度学习的火灾检测方法在检测精度、误报抑制和模型复杂度方面难以取得平衡。为此,本文提出了一种基于轻量级卷积神经网络的火灾检测方法,较好地解决了上述问题。轻量级火灾检测网络以FCOS为基础网络,降低其通道数并引入Ghost Net作为主干网络,从而实现网络轻量化。在主干网络中引入动态卷积,在不增加网络宽度和深度的情况下提高其对形态多变的火焰的特征提取能力。增加空间注意力模块,优化网络空间特征表达,同时利用H-Swish激活函数优化网络的学习能力。对于损失函数,利用颜色权重改进分类损失函数,提高训练过程中对火焰颜色区域的关注度,并将中心度作为回归损失的权重,提高中心区域特征的贡献。此外,在火灾检测网络之前引入运动前景检测,形成完整的火灾检测算法。本文建立了场景丰富、标注规范的火灾检测数据集,并在自建和公开数据集进行了一系列消融实验和对比实验。轻量级火灾检测网络在自建火灾数据集的平均精确率为92.0%,参数量为4.58M,浮点计算量为31.45G。完整的火灾检测算法在公开数据集中火灾视频的平均真正例率为99.23%,干扰视频的平均真负例率为99.21%。在真实监控场景进行较长时间测试,算法未产生误报且响应速度较快。实验结果表明本文算法对多种场景的火灾均有较好的检测效果,在检测精度、误报抑制和模型复杂度方面具有优势,具有较高的应用价值。
基于深度学习的文本无关说话人识别方法研究
这是一篇关于说话人识别,深度学习,选择性卷积模块,数据增强,动态卷积的论文, 主要内容为说话人识别技术是一种利用说话人语音特征的差异来区分不同说话人的身份的技术。如今随着5G时代的到来,该技术在手机语音助手,智能家居等方面得到了广泛应用。随着人工智能技术的不断发展,基于深度学习的说话人识别成为研究者们的热门研究方向。然而如何提升网络自适应度、探究网络性能与网络参数兼容性等一些问题依然值得深入探讨和研究,该文关于基于深度学习的文本无关说话人识别方法进行分析和研究,具体研究内容如下:首先,为了提升网络对帧级语音特征的自适应能力和全局聚合信息能力,设计了一种基于多头注意力池化的自适应多尺度说话人识别方法。网络中融合一维选择性卷积模块、Res2Net和通道注意力机制设计了一种层内自适应多尺度模块用来提取更具表征能力说话人特征,该模块的应用在特征融合阶段实现了多种感受野的融合。最后使用多头注意力池化提取话语级说话人特征,有效提升了说话人识别系统的性能。其次,为了使网络既能聚合全局信息又能聚合临近上下文信息,设计了一种基于Contextual Transformer的说话人识别模型。网络在残差网络基础上加入Cot Transformer模块,有效地提升了网络性能。除此之外,在输入网络之前首先对输入频谱图进行不同方法的数据增强,更有利于网络的训练。在网络损失函数方面,选取基于元学习的原型损失函数和基于Softmax的全局分类损失函数共同训练网络,不同对比实验结果表明该网络可提升系统识别准确率。最后,为了均衡网络深度与参数量,设计了一种基于时域动态卷积的深度倒残差说话人识别方法。网络内设计了一个动态深度倒残差瓶颈块,使网络在深度增加时拥有相对较小的网络模型参数。模块中还加入了更适应于说话人识别的时域动态卷积,网络结构设计了三种不同深度的说话人识别网络,加入不同数量聚合卷积核的时域动态卷积,最后通过各种消融对比实验证明了本章方法的有效性。
基于改进U-Net的医学图像分割方法
这是一篇关于多类型病灶分割,DTA-UNet,动态卷积,注意力机制的论文, 主要内容为医学图像分割方法可以辅助医生对病灶做出更快的量化与诊断,并给出更加准确的治疗方案。然而在实际的临床应用中,不同疾病类型、不同影像类型以及不同病例之间的差异使得医学图像分割模型的鲁棒性与泛化能力表现不佳。U型网络(U Network,U-Net)虽然是一种通用型的病灶分割框架,但仍存在特征表达能力有限、分割不够精准的问题,构建一个具有多类型病灶分割的通用模型极具挑战。为此,本文提出了一种基于动态卷积分解(Dynamic Convolution Decomposition,DCD)和三重注意力(Triplet Attention,TA)相结合的DTA-UNet(Dynamic convolution decomposition and Triplet Attention U-Net,DTA-UNet)模型,并在三种不同类型的医学影像数据集上实现了多种疾病的精确分割。本文的主要研究内容如下:(1)针对Attention U-Net中常规卷积导致特征表达能力不足的问题,提出了基于DCD的Attention U-Net分割算法。该算法使用DCD替换其编码-解码过程中的全部常规卷积,以参数量换取性能提升,在脑卒中分割数据集上交并比(Intersection over Union,Io U)、Dice相似系数(Dice Similarily Coefficient,DSC)和精确率(Precision,Pre)分别提升了0.0321、0.0328和0.0500,豪斯多夫距离(Hausdorff Distance,HD)降低了0.1137。实验结果表明,DCD的引入可以有效提高Attention U-Net的特征表达能力。(2)针对Attention U-Net单一跳跃连接导致全局上下文信息提取不足的问题,提出了基于TA的Attention U-Net分割算法,有效捕获了长距离依赖关系,突出了病变区域和病变边界,弱化了背景等无关信息的影响。注意门(Attention Gate,AG)和TA相结合方式在于输入AG模块的两个特征图是经过TA修正后的,这样可以强化相同的感兴趣区域,对于感兴趣区域产生不同的特征信息进行保留,以便结合后续分割过程中遇到相同区域的特征信息。在脑卒中分割数据集上,Io U、DSC和PRE分别提升了0.0247、0.0225和0.0611,HD下降了0.1102。实验结果表明,AG和TA相结合的方式有利于模型更加关注病变区域,更加有利于脑卒中的精准分割。(3)基于上述两种算法的成功,将上述DCD和TA同时引入Attention U-Net,提出了一种通用型病变分割框架DTA-UNet,在脑卒中、新冠肺炎和皮肤病变三种不同疾病分割任务上与6种先进的方法进行了对比,各项指标均取得较好结果,其中DSC分别提升了0.0431,0.0672和0.0161,HD分别下降了0.0928,0.3947和0.3305。实验结果表明DTA-UNet具有不错的鲁棒性能。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码客栈网 ,原文地址:https://bishedaima.com/lunwen/54183.html