基于多视角学习的推荐系统欺诈攻击检测研究
这是一篇关于推荐系统,攻击检测,深度学习,多视角学习,模糊决策的论文, 主要内容为推荐系统能够有效的缓解互联网迅猛发展带来的信息过载问题,然而欺诈攻击的出现给推荐系统安全提出了挑战,严重影响了推荐结果的可信性及真实用户在推荐系统中的用户黏性。为抵御欺诈攻击对推荐系统的影响,攻击检测方法受到广泛关注。目前,已有检测方法往往依赖专家知识人工提取检测特征或基于深度学习自动获取某一视角下的检测特征,在此基础上通过硬分类检测攻击用户,导致检测性能受限。因此,本文围绕基于多视角学习、深度学习的特征提取等方面展开深入研究。(1)提出基于CNN和犹豫模糊集的欺诈攻击检测方法CNN-HFS。首先对每个用户分别从评分值、评分偏好和评分时间这三个视角抽取三个行为矩阵,利用双三次插值法对三个矩阵进行缩放得到对应的密集评分矩阵、密集偏好矩阵和密集时间矩阵;然后,将每个用户任意视角下的密集矩阵视为一个图像,在三个不同视角下分别训练CNN分类器,并计算任意用户在每个视角下属于攻击用户类的隶属度;最后,引入犹豫模糊集对多视角下的检测结果进行综合决策,根据决策结果识别出攻击用户。(2)提出基于Bi LSTM与三支决策的欺诈攻击统一检测框架Bi-TWD。首先,将每个用户评级行为轨迹划分为多个子序列,每个子序列生成一个窗口特征向量,将所有窗口特征向量按时序先后组合为用户组合向量;其次,利用Bi LSTM进一步提取低维用户表示向量,并计算每个用户的可疑度;最后,基于用户的可疑度,根据三支决策理论将用户划分为正域、负域和边界域,通过对边界域的用户聚类分析,提升攻击检测性能。为了验证CNN-HFS方法和Bi-TWD方法有效性,在合成数据集和真实数据集上进行了大量验证,选取精度、召回率和F1-measure值3个评价指标进行实验评估。实验结果表明,本文所提两种方法明显优于其对比方法,可以获得更高的检测性能。
基于伪孪生网络的跨语言知识图谱实体对齐研究
这是一篇关于跨语言实体对齐,知识图谱,伪孪生网络,门控循环单元,多视角学习的论文, 主要内容为随着问答系统、辅助决策、语义搜索和个性化推荐等应用的不断发展,人们对大规模统一多语言知识图谱的需求愈发迫切,因此越来越多的研究开始关注跨语言知识图谱的融合问题。而跨语言知识图谱实体对齐旨在识别两个不同语言构建的知识图谱之间的共同实体,是目前实现跨语言知识图谱融合的一种行之有效的方法。当前实体对齐的研究主要集中在知识图谱包含的文本、关系和结构三个视角,对属性视角的研究较少。因为属性视角的特征提取过程容易被噪声属性和实体通用属性干扰,且属性视角的信息较为分散,属性和属性值文本的构成较为复杂,都会导致属性视角的特征提取不充分。此外,对从多个视角获取的特征,简单地拼接不能有效结合各视角的特征优势,甚至降低原有特征的实体对齐效果。针对以上问题,本文设计了基于属性视角以及融合多视角的跨语言实体对齐模型,主要研究工作如下:(1)针对属性视角特征提取过程中存在干扰属性和属性特征提取不充分的问题,构建基于注意力的深度双向门控循环网络跨语言实体对齐模型(AB-GRU)。该模型通过预训练模型对属性和属性值的名称文本进行初始化,提升属性和属性值文本的表示效果;设计全局和局部注意力机制筛除噪声和通用属性,降低噪声属性对后续特征提取的干扰;构建深度双向门控循环网络聚合分散的属性视角特征,并减少输入序列的位置信息带来的影响,同时提取属性视角的深层特征。(2)针对跨语言知识图谱多视角特征融合质量低的问题,构建基于伪孪生网络的多视角跨语言实体对齐模型(PSN-MEA)。该模型在AB-GRU的基础上引入一个多层的图卷积网络提取实体对应的知识图谱结构视角的特征,在两层相邻的图卷积网络之间搭建一个高速公路门,精炼实体的名称文本特征和结构特征;构建的伪孪生网络可以通过构建统一的目标函数联合训练不同的深度神经网络,使学习得到的多视角特征之间拥有更好的区分性;设计基准多视角融合策略通过配置不同的权重融合文本、结构、属性三个视角的特征,进一步提升实体对齐的效果。本文在跨语言公开数据集DBP15K的3个子集ZH_EN、JA_EN、FR_EN上的实验结果表明,AB-GRU有效提升了属性视角的特征提取效果,PSN-MEA在保留ABGRU优势的基础上,有效融合多视角特征,与11个主流模型的实体对齐结果相比,在Hits@1、Hits@10和MRR三个评价指标上均优于其他模型。
基于伪孪生网络的跨语言知识图谱实体对齐研究
这是一篇关于跨语言实体对齐,知识图谱,伪孪生网络,门控循环单元,多视角学习的论文, 主要内容为随着问答系统、辅助决策、语义搜索和个性化推荐等应用的不断发展,人们对大规模统一多语言知识图谱的需求愈发迫切,因此越来越多的研究开始关注跨语言知识图谱的融合问题。而跨语言知识图谱实体对齐旨在识别两个不同语言构建的知识图谱之间的共同实体,是目前实现跨语言知识图谱融合的一种行之有效的方法。当前实体对齐的研究主要集中在知识图谱包含的文本、关系和结构三个视角,对属性视角的研究较少。因为属性视角的特征提取过程容易被噪声属性和实体通用属性干扰,且属性视角的信息较为分散,属性和属性值文本的构成较为复杂,都会导致属性视角的特征提取不充分。此外,对从多个视角获取的特征,简单地拼接不能有效结合各视角的特征优势,甚至降低原有特征的实体对齐效果。针对以上问题,本文设计了基于属性视角以及融合多视角的跨语言实体对齐模型,主要研究工作如下:(1)针对属性视角特征提取过程中存在干扰属性和属性特征提取不充分的问题,构建基于注意力的深度双向门控循环网络跨语言实体对齐模型(AB-GRU)。该模型通过预训练模型对属性和属性值的名称文本进行初始化,提升属性和属性值文本的表示效果;设计全局和局部注意力机制筛除噪声和通用属性,降低噪声属性对后续特征提取的干扰;构建深度双向门控循环网络聚合分散的属性视角特征,并减少输入序列的位置信息带来的影响,同时提取属性视角的深层特征。(2)针对跨语言知识图谱多视角特征融合质量低的问题,构建基于伪孪生网络的多视角跨语言实体对齐模型(PSN-MEA)。该模型在AB-GRU的基础上引入一个多层的图卷积网络提取实体对应的知识图谱结构视角的特征,在两层相邻的图卷积网络之间搭建一个高速公路门,精炼实体的名称文本特征和结构特征;构建的伪孪生网络可以通过构建统一的目标函数联合训练不同的深度神经网络,使学习得到的多视角特征之间拥有更好的区分性;设计基准多视角融合策略通过配置不同的权重融合文本、结构、属性三个视角的特征,进一步提升实体对齐的效果。本文在跨语言公开数据集DBP15K的3个子集ZH_EN、JA_EN、FR_EN上的实验结果表明,AB-GRU有效提升了属性视角的特征提取效果,PSN-MEA在保留ABGRU优势的基础上,有效融合多视角特征,与11个主流模型的实体对齐结果相比,在Hits@1、Hits@10和MRR三个评价指标上均优于其他模型。
基于伪孪生网络的跨语言知识图谱实体对齐研究
这是一篇关于跨语言实体对齐,知识图谱,伪孪生网络,门控循环单元,多视角学习的论文, 主要内容为随着问答系统、辅助决策、语义搜索和个性化推荐等应用的不断发展,人们对大规模统一多语言知识图谱的需求愈发迫切,因此越来越多的研究开始关注跨语言知识图谱的融合问题。而跨语言知识图谱实体对齐旨在识别两个不同语言构建的知识图谱之间的共同实体,是目前实现跨语言知识图谱融合的一种行之有效的方法。当前实体对齐的研究主要集中在知识图谱包含的文本、关系和结构三个视角,对属性视角的研究较少。因为属性视角的特征提取过程容易被噪声属性和实体通用属性干扰,且属性视角的信息较为分散,属性和属性值文本的构成较为复杂,都会导致属性视角的特征提取不充分。此外,对从多个视角获取的特征,简单地拼接不能有效结合各视角的特征优势,甚至降低原有特征的实体对齐效果。针对以上问题,本文设计了基于属性视角以及融合多视角的跨语言实体对齐模型,主要研究工作如下:(1)针对属性视角特征提取过程中存在干扰属性和属性特征提取不充分的问题,构建基于注意力的深度双向门控循环网络跨语言实体对齐模型(AB-GRU)。该模型通过预训练模型对属性和属性值的名称文本进行初始化,提升属性和属性值文本的表示效果;设计全局和局部注意力机制筛除噪声和通用属性,降低噪声属性对后续特征提取的干扰;构建深度双向门控循环网络聚合分散的属性视角特征,并减少输入序列的位置信息带来的影响,同时提取属性视角的深层特征。(2)针对跨语言知识图谱多视角特征融合质量低的问题,构建基于伪孪生网络的多视角跨语言实体对齐模型(PSN-MEA)。该模型在AB-GRU的基础上引入一个多层的图卷积网络提取实体对应的知识图谱结构视角的特征,在两层相邻的图卷积网络之间搭建一个高速公路门,精炼实体的名称文本特征和结构特征;构建的伪孪生网络可以通过构建统一的目标函数联合训练不同的深度神经网络,使学习得到的多视角特征之间拥有更好的区分性;设计基准多视角融合策略通过配置不同的权重融合文本、结构、属性三个视角的特征,进一步提升实体对齐的效果。本文在跨语言公开数据集DBP15K的3个子集ZH_EN、JA_EN、FR_EN上的实验结果表明,AB-GRU有效提升了属性视角的特征提取效果,PSN-MEA在保留ABGRU优势的基础上,有效融合多视角特征,与11个主流模型的实体对齐结果相比,在Hits@1、Hits@10和MRR三个评价指标上均优于其他模型。
基于伪孪生网络的跨语言知识图谱实体对齐研究
这是一篇关于跨语言实体对齐,知识图谱,伪孪生网络,门控循环单元,多视角学习的论文, 主要内容为随着问答系统、辅助决策、语义搜索和个性化推荐等应用的不断发展,人们对大规模统一多语言知识图谱的需求愈发迫切,因此越来越多的研究开始关注跨语言知识图谱的融合问题。而跨语言知识图谱实体对齐旨在识别两个不同语言构建的知识图谱之间的共同实体,是目前实现跨语言知识图谱融合的一种行之有效的方法。当前实体对齐的研究主要集中在知识图谱包含的文本、关系和结构三个视角,对属性视角的研究较少。因为属性视角的特征提取过程容易被噪声属性和实体通用属性干扰,且属性视角的信息较为分散,属性和属性值文本的构成较为复杂,都会导致属性视角的特征提取不充分。此外,对从多个视角获取的特征,简单地拼接不能有效结合各视角的特征优势,甚至降低原有特征的实体对齐效果。针对以上问题,本文设计了基于属性视角以及融合多视角的跨语言实体对齐模型,主要研究工作如下:(1)针对属性视角特征提取过程中存在干扰属性和属性特征提取不充分的问题,构建基于注意力的深度双向门控循环网络跨语言实体对齐模型(AB-GRU)。该模型通过预训练模型对属性和属性值的名称文本进行初始化,提升属性和属性值文本的表示效果;设计全局和局部注意力机制筛除噪声和通用属性,降低噪声属性对后续特征提取的干扰;构建深度双向门控循环网络聚合分散的属性视角特征,并减少输入序列的位置信息带来的影响,同时提取属性视角的深层特征。(2)针对跨语言知识图谱多视角特征融合质量低的问题,构建基于伪孪生网络的多视角跨语言实体对齐模型(PSN-MEA)。该模型在AB-GRU的基础上引入一个多层的图卷积网络提取实体对应的知识图谱结构视角的特征,在两层相邻的图卷积网络之间搭建一个高速公路门,精炼实体的名称文本特征和结构特征;构建的伪孪生网络可以通过构建统一的目标函数联合训练不同的深度神经网络,使学习得到的多视角特征之间拥有更好的区分性;设计基准多视角融合策略通过配置不同的权重融合文本、结构、属性三个视角的特征,进一步提升实体对齐的效果。本文在跨语言公开数据集DBP15K的3个子集ZH_EN、JA_EN、FR_EN上的实验结果表明,AB-GRU有效提升了属性视角的特征提取效果,PSN-MEA在保留ABGRU优势的基础上,有效融合多视角特征,与11个主流模型的实体对齐结果相比,在Hits@1、Hits@10和MRR三个评价指标上均优于其他模型。
基于伪孪生网络的跨语言知识图谱实体对齐研究
这是一篇关于跨语言实体对齐,知识图谱,伪孪生网络,门控循环单元,多视角学习的论文, 主要内容为随着问答系统、辅助决策、语义搜索和个性化推荐等应用的不断发展,人们对大规模统一多语言知识图谱的需求愈发迫切,因此越来越多的研究开始关注跨语言知识图谱的融合问题。而跨语言知识图谱实体对齐旨在识别两个不同语言构建的知识图谱之间的共同实体,是目前实现跨语言知识图谱融合的一种行之有效的方法。当前实体对齐的研究主要集中在知识图谱包含的文本、关系和结构三个视角,对属性视角的研究较少。因为属性视角的特征提取过程容易被噪声属性和实体通用属性干扰,且属性视角的信息较为分散,属性和属性值文本的构成较为复杂,都会导致属性视角的特征提取不充分。此外,对从多个视角获取的特征,简单地拼接不能有效结合各视角的特征优势,甚至降低原有特征的实体对齐效果。针对以上问题,本文设计了基于属性视角以及融合多视角的跨语言实体对齐模型,主要研究工作如下:(1)针对属性视角特征提取过程中存在干扰属性和属性特征提取不充分的问题,构建基于注意力的深度双向门控循环网络跨语言实体对齐模型(AB-GRU)。该模型通过预训练模型对属性和属性值的名称文本进行初始化,提升属性和属性值文本的表示效果;设计全局和局部注意力机制筛除噪声和通用属性,降低噪声属性对后续特征提取的干扰;构建深度双向门控循环网络聚合分散的属性视角特征,并减少输入序列的位置信息带来的影响,同时提取属性视角的深层特征。(2)针对跨语言知识图谱多视角特征融合质量低的问题,构建基于伪孪生网络的多视角跨语言实体对齐模型(PSN-MEA)。该模型在AB-GRU的基础上引入一个多层的图卷积网络提取实体对应的知识图谱结构视角的特征,在两层相邻的图卷积网络之间搭建一个高速公路门,精炼实体的名称文本特征和结构特征;构建的伪孪生网络可以通过构建统一的目标函数联合训练不同的深度神经网络,使学习得到的多视角特征之间拥有更好的区分性;设计基准多视角融合策略通过配置不同的权重融合文本、结构、属性三个视角的特征,进一步提升实体对齐的效果。本文在跨语言公开数据集DBP15K的3个子集ZH_EN、JA_EN、FR_EN上的实验结果表明,AB-GRU有效提升了属性视角的特征提取效果,PSN-MEA在保留ABGRU优势的基础上,有效融合多视角特征,与11个主流模型的实体对齐结果相比,在Hits@1、Hits@10和MRR三个评价指标上均优于其他模型。
基于深度学习的本体匹配方法及其优化算法研究
这是一篇关于本体匹配,深度学习,多视角学习,表示学习,黑箱优化,HORD算法的论文, 主要内容为自1989年Tim Berners Lee提出万维网后,人类便真正进入了信息爆炸式增长的时代。1.0时期的万维网由网页互相链接而成,但万维网中的网页内容都是通过文档呈现的。在万维网1.0时期,计算机将网页信息呈现给用户,但信息本身所包含的语义无法转化为计算机可理解的计算机语言,方便计算机进行理解、处理。为解决万维网1.0中的存在的以上问题,万维网之父Tim Berners Lee在2001年提出语义网,语义网是一个能够让计算机理解互联网中数据的语义信息,以及数据之间的逻辑关系,使得网页中的数据实现互相关联的数据智能网络。为了构建语义网,国际万维网组织(W3C)在2007年发起了开放链接数据项目,该项目旨在将推动万维网由网页互联走向成知识互联,也有助于推动语义网的发展。项目发起后,研究者们可以对语义数据进行关联和独立发布,从而形成了众多的知识库。本体可以看作知识库的结构框架,定义了概念与概念之间层次关系,形式化地定义了同一领域内共同认可的知识。由于知识库可以分布式地发布到万维网中,多个人对同一或相关联的领域知识构建的不同知识库,在发布数据时,个人的差异会导致对同一个概念命名不相同,取值范围不同等问题,即是本体的异构问题。本体异构问题,在两个本体合并过程中,会导致语义网中许多知识互相关联的缺失并且产生冗余信息。为解决本体异构的问题,自20世纪90年代末开始,国内外学者便开始了对本体匹配的研究,经过数十年的积累,已有大量的本体匹配方法被学者提出。这些方法大致可分为基于统计学习的方法和基于深度学习的方法。基于统计的方法需要借助人工构建特征,而该工作通常比较耗时且难以找到合适的特征;现有的基于深度学习的本体匹配方法克服了基于统计学习类方法中人工构建特征的困难,而忽略了本体本身的结构信息,本体本身的结构信息也包含了大量的语义,会直接影响本体匹配方法的性能。另一方面,基于深度学习的本体匹配方法采用的随机向量或者通过文本预训练模型得到的概念向量表示通常不符合概念在知识图谱中的表示。在知识图谱表示模型中,概念或者关系的表示非常依赖模型的参数。如何在知识图谱表示学习中找到更好的参数从而改善待匹配概念的表示并提高本体匹配的效果也是需要克服的问题。针对现有基于深度学习的方法存在的两个问题,一方面,本文提出了一个新的本体匹配模型MOMWH,MOMWH利用多视角的方法来提取概念信息,从概念的文本、概念在多个本体间的映射和概念所处的本体本身三个视角来计算概念的表示,从多视角不同的维度对待匹配的概念对进行计算,进而提升了本体匹配的性能,也有效减少人工对特征进行筛选的成本。另一方面,为解决如何找到更好参数得到概念向量表示的问题,来进一步提升本体匹配的性能,本文首次将黑箱优化和知识图谱表示学习进行结合。通过HORD算法自动调节多个表示学习模型的参数,进一步使得多视角表示学习模型可以学习更好的特征。最后,通过在真实的生物医学本体数据集上进行的多组实验,本文设计的方法超过了现有的研究,也在一定程度上解决了现有方法的问题。
基于深度学习的个性化新闻推荐方法研究
这是一篇关于新闻推荐,长短期用户表示,多视角学习,联合学习的论文, 主要内容为新闻推荐系统可以帮助用户在海量新闻中快速获取感兴趣内容,其要解决的关键问题在于获得准确的用户表示和新闻表示。用户的兴趣是随着时间变化的,有长期兴趣和短期兴趣;新闻含有的信息也分多种类别,如标题、类别、摘要等,而现有的方法往往基于单类别信息学习新闻的表示。目前,绝大多数推荐系统的研究重心放在如何提高推荐的准确率上,缺少对推荐结果的自然语言的解释,用户很难得知推荐结果的理由。如果在给出推荐结果的同时提供为什么推荐该结果的解释,这样不仅能够提升系统透明度,还能提高用户对系统的信任和接受程度。基于以上原因,本文主要的研究工作如下:(1)提出了一种融合长短期用户表示、多特征新闻表示的方法进行个性化新闻推荐。首先,采用基于协同注意力机制的多视角学习方法构建新闻编码器,从新闻的标题、分类、摘要特征中学习统一的新闻表示;其次,利用改进的新闻表示在基于长短期兴趣的用户编码器中进一步细粒度学习用户表示。在真实新闻数据集上的实验结果表明,该方法与其它推荐算法相比在准确率等指标上有明显提高。(2)提出了一种基于特征映射和多任务联合学习的可解释新闻推荐方法。首先利用特征映射,将不可解释的一般特征映射到可解释的方面特征,消除了在可解释推荐中对元数据的需求;同时通过一个联合学习模型平衡准确预测和生成解释这两个任务,在生成准确的推荐结果的同时利用两个任务间的隐式信息生成对应的解释语句,实现了推荐的准确性和良好的可解释性。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕业设计货栈 ,原文地址:https://bishedaima.com/lunwen/54518.html