基于对比学习的知识图谱问答系统研究
这是一篇关于知识图谱,问答系统,对比学习,BERT的论文, 主要内容为在这信息飞速膨胀的时代,互联网已经成为一个庞大信息储存库,要在众多数据中找到想要的信息相当困难,通常会使用搜索引擎来辅助完成。然而使用关键字进行搜索的搜索引擎会返回大量的相关信息链接,其中包括了很多无用的信息甚至广告,使得用户浪费了大量的时间和精力去筛选信息。基于知识图谱的问答系统(Knowledge Base Question Answering,KBQA)是对其的改进方向之一,KBQA使用自然语言处理(Natural Language Processing,NLP)技术分析用户咨询问句的语义信息,理解用户查询的主体以及意图,再通过知识图谱进行准确的返回答案,而不是大量信息链接,大幅度提升用户检索效率。目前,用户问句形式复杂多变,语义模糊且存在实体别名等情况,使得计算机很难准确找到知识库中对应的实体和理解用户的咨询意图。本文基于对比学习(Contrastive Learning,CL)优化用户句子的语义向量表示,对开放域知识图谱问答系统和限定域知识图谱问答系统进行分析和研究,主要所做工作内容如下:(1)针对在开放域KBQA领域,问句中实体存在的缩写、别名、嵌套以及问句与知识库中结构化语义之间的差距,且大多数研究都将实体消歧和关系匹配视为独立子任务导致的误差传递,使得整体系统准确率不佳的问题。本文在BERT模型的基础上结合对比学习提出了一个语义联合模型(Semantic union model,SUM),将实体消歧和关系匹配结合在一个统一的框架下。其可以通过实体所连关系来给实体消歧提供信息,并同时完成实体消歧和关系匹配任务,避免误差传递,提升系统的整体性能。仿真实验的结果表明基于对比学习的语义联合模型在开放域知识图谱问答系统领域有一定提升。(2)利用医药疾病知识构建KBQA,并针对目前限定域KBQA领域问题数据获取难、意图类别不均衡和存在噪声等情况,导致模型无法准确识别用户意图的问题,将传统意图识别的分类任务转化为语义相似度计算任务,使用基于对比学习的模型进行微调,通过对比损失,得到更有区分度的语义向量表示,进而更准确识别用户意图,提升知识图谱问答系统的准确率。仿真实验的结果表明基于对比学习的模型在限定域知识图谱问答系统领域有一定提升。
基于对比学习的面部表情识别方法研究
这是一篇关于人脸表情识别,对比学习,人脸检测,Transformer,注意力机制的论文, 主要内容为面部表情是人类沟通中帮助理解他人意图的重要因素之一。目前面部表情分析已经成为计算机视觉和人工智能领域的重要方向,面部表情识别技术在驾驶员疲劳驾驶检测、服务机器人、课堂学生听课质量评估、广告宣传片设计等领域具有广阔应用。人脸表情识别系统的任务是针对给定的人脸图像,输出该图像对应的表情类别。目前受控环境下的人脸表情识别准确度较高,真实环境下的人脸表情识别存在姿态变换、遮挡、光照差异等多种因素的影响,导致人脸表情识别的准确性较低。为了更好地降低真实场景中各类因素对识别效果的影响,提高表情识别准确率,本文具体研究工作如下:(1)基于对比学习的人脸表情识别算法研究。采用对比学习的方法实现人脸表情识别,针对现实条件下的人脸表情识别存在姿态变换、遮挡、光照差异等因素影响,在Mo Co v2框架的基础上,增加原图像和经过遮挡增强后图像的正样本对对比,通过对正样本进行随机数据增强操作,增加正样本图像类型,增强模型在真实环境下的识别效果;将基于Transformer的Vi T-small网络作为主干特征提取网络,提高模型提取特征能力;将该识别模型在Image Net数据集上进行预训练,将预训练模型应用于表情识别数据集进行微调,以提高表情识别任务的分类准确率。结合对比学习预训练,在表情识别公共数据集RAF-DB、FERPlus、Affect Net-7、Affect Net-8数据集上分别取得89.02%、90.84%、64.94%、60.63%的识别准确度,与一些表情识别流行算法进行比较,通过实验验证了本文算法的有效性。(2)自然条件下人脸表情识别系统开发。针对自然条件下的人脸表情识别需求,本文开发了人脸表情识别系统,主要包括人脸采集、人脸检测、图像预处理、特征提取、表情分类五个步骤。通过摄像头等硬件设备收集人脸图片,采用Retina Face人脸检测框架并使用轻量化的Mobile Net V3-small网络作为主干网络检测人脸区域,为了使模型在通道和空间维度上都能关注重要特征,并且能够更加关注位置信息,本文采用轻量高效的注意力机制CANet替代Mobile Net V3-small中的SENet,然后对检测到的人脸图像进行数据增强等图像预处理操作,使用对比学习训练好的Vi T-small网络进行表情信息提取,并将提取的特征用于表情分类,输出分类结果。最后,进行实验分析以评估系统的识别效果。
基于对比学习的图像生成系统的设计与实现
这是一篇关于对比学习,语义交互,掩码图像编码器,双向多模态解码器的论文, 主要内容为图像生成是指运用人工智能技术,根据给定的数据进行单模态或跨模态生成图像的过程。图像生成技术在虚拟现实、数字艺术、医学成像等领域具有广泛的应用前景,具备重要的研究价值。由文本生成图像任务需要在生成图像时,保证图像和文本之间语义一致性以及图像的多样性。目前对文生图任务中语义一致性和生成图像多样性问题有两类解决方案:一种利用注意力机制对图像和文本进行跨模态特征融合。然而这种模态间的直接特征融合可能会造成信息丢失;另一种思路通过引入对比损失来提高模型对语义的理解,在同一图像的不同文本描述之间或者不同文本生成的图像之间计算对比损失。但缺少对图文之间语义关系的理解。针对上述问题,本论文提出了一种基于对比学习的图像生成算法CLIG。通过在图文之间加入对比损失作为约束,增强图像和文本语义之间的交互,生成与文本语义一致性更强且具有丰富多样性的图像。另外,本论文基于CLIG设计开发了基于对比学习的图像生成系统。本论文的主要工作包括以下三个部分:(1)提出了基于对比学习的图像生成算法CLIG。首先使用对比学习方法,将语义相关的图像和文本进行特征对齐,捕获两者之间的内在关联。同时,利用知识蒸馏中的Soft-Target思想,使用动量模型生成伪目标作为额外的监督,提高对比学习的性能。此外,本论文使用掩码图像编码器替换了传统的图像编码器,促使模型学到更丰富的图像特征并提高性能。最后,本论文使用双向多模态解码器取代了以往模型中的单向多模态解码器,使模型可以从多个方向关注图像信息,并且可以并行生成图像。(2)基于对比学习的图像生成系统的设计与实现。首先,对基于对比学习的图像生成系统进行需求分析。然后,对系统的概要设计以及数据库结构进行设计。本论文采用B/S架构实现基于对比学习的图像生成系统中的关键模块。该系统能够跨越“语义鸿沟”,为用户提供个性化的图像定制服务。并提供多样的可视化选项和良好的交互体验。(3)对本论文所提出的算法和系统进行实验验证。实验结果显示,相对于对比模型,本论文算法在CUB和MS COCO数据集上均有性能提升,代表语义一致性的指标R-Precision表现最好,CLIG算法分别在两个数据集上提升了 2.26%-15.9%和2.1%-10.2%。多样性实验和语义理解实验中,本论文算法生成的图像具有较好的多样性和语义一致性。基于对比学习的图像生成系统实现了预期,能够满足用户需求。
基于深度学习的脑部医学图像配准研究
这是一篇关于脑部医学图像配准,深度学习,注意力机制,轮廓特征,对比学习的论文, 主要内容为医学图像配准作为医学图像分析领域的主要方向,具有重要研究意义和临床应用价值,在疾病诊断、手术引导和放射性治疗等方面得到广泛应用。虽然基于深度学习的方法有效促进了当前医学图像配准研究的发展,但是其在配准精度上还有很大提升空间。本论文从配准中的图像特征选择和优化着手,基于脑部医学图像配准,提出了基于注意力机制的轮廓弱监督脑部配准模型和基于对比学习和注意力机制的脑部配准模型,其主要创新工作如下:(1)现有配准网络多为基于U-Net的编解码结构,编码器与解码器进行跳跃连接时,未对输入解码器的特征进行权重优化,对局部信息关注度不够,使生成的形变场细节信息不完整,导致图像的一些局部信息丢失。通过在配准网络中引入基于跳跃连接的通道注意力机制,实现了特征的权重筛选,弥补了现有配准方法的不足。这种注意力机制的引入在特征融合过程中能更加准确地捕捉到细节的形变信息,提高配准结果的精度。(2)通过在相似度损失函数中增加轮廓特征损失函数7)48)0)(92)),以轮廓特征信息作为额外几何约束。增加该损失函数能够降低配准图像之间存在灰度值差异造成的影响,同时能够更准确地度量生成的配准图像与参考图像间的相似度。(3)传统的对比学习方法,通常是在特征提取的最后一个阶段计算对比损失,忽略了各阶段特征信息之间的差异。本文通过在配准网络下采样过程进行多阶段对比,对各个阶段的特征计算对比损失,弥补了传统对比学习方法的不足,优化了特征提取方法,提高了配准网络的鲁棒性和稳定性。结合以上三点本文提出了基于注意力机制的轮廓弱监督脑部配准方法(CACF)和基于对比学习和注意力机制的脑部配准方法(CACC)。在LPBA40数据集上的实验结果证明,这两种方法与当前主流方法比较,能够有效提升脑部医学图像配准的精确度。
采用时间信息的多行为序列推荐研究
这是一篇关于推荐系统,序列推荐,多行为推荐,动态推荐,对比学习的论文, 主要内容为推荐系统帮助用户缓解信息过载带来的压力并满足用户的个性化需求,已广泛应用于各行各业。目前推荐系统仍然存在以下挑战:(1)大多数方法忽略了用户和项目的动态变化,没有充分利用交互的时间信息;(2)已有研究通常对用户和项目之间的单一交互行为数据进行建模,未能充分利用多行为数据;(3)推荐系统的数据集往往存在数据稀疏、数据不平衡以及数据噪声等问题。针对上述问题,本文研究如何充分利用用户-项目交互类型的多样性和动态性以提升推荐性能,主要进行了以下工作。(1)利用用户和项目交互的时间信息和多行为数据,提出Dy MBRec模型。首先将用户的历史交互序列分为项目序列、时间序列和行为序列;然后结合绝对位置,分别通过时间感知的自注意力模块和行为感知的自注意力模块进行权重计算,得到时间相关和行为相关的嵌入表示;最后将两个嵌入表示以加权方式得到最终的用户偏好嵌入表示,并进行下一项推荐。在两个真实的具有时间信息的多行为数据集上的实验表明,Dy MBRec与相关的推荐模型相比获得了更优的推荐性能。(2)为了解决推荐中的数据稀疏和数据噪声问题,将对比学习引入多行为序列推荐,提出CL-MBRec模型。首先使用基于时间间隔和项目相关性的数据增强方法对多行为序列数据进行增强;然后通过多行为序列编码器生成序列嵌入表示,同时运用对比学习保持增强序列与原始序列的高度相似性;接着用多任务训练优化多行为序列推荐的下一项预测目标和对比学习目标;最后根据得到的用户交互序列嵌入表示进行下一项推荐。在两个真实的具有时间信息的多行为数据集上的实验验证了CL-MBRec中多行为数据增强的有效性。
结合图神经网络的推荐算法研究与实现
这是一篇关于推荐系统,图神经网络,深度学习,对比学习,多任务学习的论文, 主要内容为移动互联网时代,海量信息的出现在为用户带来更大更全视野的同时,也带来了信息爆炸的问题。如何帮助用户从这些纷繁复杂的信息中快速高效地筛选出需要的信息成为了所有互联网企业亟待解决的问题。而近年来大数据与神经网络技术的出现,使得从海量数据中提取并利用信息成为了可能。于是,基于大数据的推荐系统应运而生,并迅速成为了互联网企业的重要增长引擎。推荐系统中的数据类型多样,结构复杂,除了规整的欧几里得空间数据之外还存在着类似图结构的非欧空间数据。这些结构难以利用但蕴含着丰富的信息。图神经网络的出现为高效提取图结构信息提供了可能,其强大的表征能力能将推荐系统引入一个全新的领域。因此,在推荐系统中引入图神经网络有着非常广阔的前景与巨大的价值。本文基于对图神经网络及推荐算法的调研,提出了两种结合图神经网络的推荐算法及一套工程系统。在算法层面,本文提出了两种改进:1、针对推荐系统中的召回、排序链路提出了一种通用图推荐算法HGCNNCL。该算法采用图卷积神经网络采样聚合用户-商品二部图中用户/商品的高阶邻居信息生成节点表征。在此基础上,HGCNNCL引入了超图思想与对比学习思想,通过构建新的正负样本及多任务学习加强算法的表征能力。算法通用性上,在召回阶段HGCNNCL可以通过预训练得到节点向量表征并在线上使用向量召回;在排序阶段可以对HGCNNCL稍加改造成为一个端到端的算法,通过下游任务的直接监督使向量训练更为充分。2、针对当前推荐系统中存在的用户与商品间存在少量交互且用户有特征缺失的场景,提出了基于特征重构的冷启动图推荐算法GCMCSR。该算法在进行推荐任务的同时进行特征重构任务,并以此缓解冷启动问题。在实际的推荐阶段,该算法可以作为一个级联算法加入服务,提供推荐意见的同时将重构所得的用户特征补充至后续推荐算法中。同时,本文设计并搭建了一个轻量级的推荐系统,可以帮助算法开发者模拟线上推荐场景。该系统采用React和Django为架构搭建,使用MySQL数据库进行数据存储交互,并整合多种召回、排序算法,可以帮助开发者更直观观察算法上线效果。针对HGCNNCL,本文设计了召回、排序两阶段实验。两阶段共设置了四个真实世界数据集、五种不同评估指标及十一种对比方法,实验结果证明,该算法适用于推荐流程的各个阶段,且相较业界常用算法效果均有提升。对于GCMCSR,本文在四个真实世界数据集上与五种方法进行了对比实验。同时,针对冷启动场景还设计了特征重构实验。两组实验结果证明了 GCMCSR能在提升推荐效果的同时缓解冷启动问题。最后,本文完成了轻量级推荐系统的开发上线,在模拟线上环境中实现了个性化推荐、用户行为分析、算法效果分析等功能。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设海岸 ,原文地址:https://bishedaima.com/lunwen/46208.html