基于并行图自编码器的miRNA-靶基因数据的新型双聚类分析方法研究
这是一篇关于双聚类,图自编码器,miRNA-靶基因,二进制数据的论文, 主要内容为传统的单聚类方法是依据样本的相似度,将具有相似属性或特征的样本归为一类。然而,随着样本数和特征数的大量增加,单聚类方法的时间成本变得难以想象。另一方面,大型数据集内部数据成分复杂且往往呈现稀疏性,单聚类方法不能很好地处理大型数据集的噪声干扰。基于低维数据全局搜索的单聚类方法不能很好地适应于高维数据和大型数据的聚类问题。为克服单聚类方法存在的缺陷,双聚类方法应运而生。不同于传统单聚类方法,双聚类方法是基于样本(行)和特征(列)间的局部关系,同时从样本和特征两个维度上进行聚类。近年来,双聚类方法发展迅速,在基因分析、文本聚类、推荐系统等领域得到广泛应用。双聚类方法常用于生物信息学中的基因表达数据的分析,相比于基因表达数据这类的表达量数据,生物大数据中存在的更多的是关系型数据,譬如mi RNA-靶基因数据。目前绝大部分的双聚类算法都是针对表达量数据而设计,面向二进制关系型数据的双聚类算法却鲜有探讨,因为表达量数据中存在非常丰富的数学信息而关系型数据仅仅包含0/1关系信息。为了挖掘关系型数据中的双聚类模块,本文基于大豆的mi RNA-靶基因数据(包括mi RNA-靶基因关系矩阵与靶基因图数据)提出了一种基于图自编码器的双聚类算法GAEBic,创新性地构建了并行图自编码器模型PGAE来捕获mi RNA-靶基因数据中靶基因间的联系,并提出了一种全新的非规则聚类策略Bi GAE以发现更加符合生物学意义的双聚类模块。PGAE模型的输入为靶基因图数据和靶基因属性数据,它的结构主要包括编码器和解码器。本文基于靶基因图数据比较了PGAE与Deep Walk、LINE、Node2Vec在靶基因连接预测任务上的性能,结果显示PGAE模型的性能明显优于Deep Walk、LINE、Node2Vec,具备可靠的图嵌入学习的能力。Bi GAE算法的输入为mi RNA-靶基因的二进制关系矩阵和靶基因的嵌入矩阵,其中靶基因嵌入矩阵用于衡量靶基因间的相似度。Bi GAE将靶基因嵌入矩阵作为度量矩阵,同时引入了非零覆盖率作为另一指标以确保发现双聚类模块是非规则的、更符合生物学意义的。本文基于大豆的mi RNA-靶基因关系数据比较了GAEBic与Spectral Biclustering、Bibit、Bimax算法的性能,在对四种双聚类算法的双聚类结果进行GO富集分析后发现GAEBic的双聚类结果的GO富集率明显高于其余三种双聚类算法,并且在富集的双聚类中,GAEBic的双聚类结果表现也优于其余三者。GAEBic算法探讨了双聚类分析在二进制数据领域的应用,为后来的研究者在双聚类分析上提供了一种可行的研究思路。
基于图神经网络的链接预测及电商智能推荐分析
这是一篇关于链接预测,图神经网络,图自编码器,图注意力网络,电子商务推荐的论文, 主要内容为随着互联网的蓬勃发展,出现了很多在线交易平台,电商购物逐渐成为人们的重要消费方式。新冠疫情的出现使线下购物受到了限制,线上购物成为消费者疫情期间特殊的消费方式。电子商务带来便利的同时,也带来了信息过载问题,低效地海选商品既浪费了时间,又降低了商品流通效率。因此提高商品推荐精度,具有特殊的研究意义。商品推荐已经成为缓解电商购物信息过载的重要方式,受到研究者的广泛关注,仍存在着推荐精度、数据稀疏、数据随机性等问题需要改善。链接预测提供了新的解决思路,电商购物中的商品推荐问题可映射为用户—商品二分网络中的网络链接预测问题。二分网络结构能体现出商品和用户的交易关系,网络的潜在连边对应用户今后的购买商品。如何有效利用网络链接预测方法预测用户—商品二分网络中的潜在连边,是电商推荐网络化的重要研究内容。本文梳理了网络链接预测及推荐方法的研究成果,介绍了网络链接预测相关知识,提出了基于图自编码器的链接预测模型,而后针对推荐场景的特点将模型进行调整,提出了基于图注意力网络的电商智能推荐模型,并在亚马逊电商数据上进行了推荐模型的应用和分析。本文研究工作主要有以下几个方面:(1)首先介绍了网络链接预测和推荐技术的研究现状,对复杂网络以及链接预测的基础理论进行了论述,并对图神经网络的概念和分类进行了介绍。(2)本文提出了基于图自编码器的链接预测模型,根据已知的网络结构对节点的特征向量进行编码学习,并对学习后的节点特征进行解码,探索节点特征和节点间形成链接的统计规律,分析拥有何种特征的节点之间容易形成链接。对社交网络数据集进行了实验,实验结果说明基于图自编码器的链接预测模型提高了预测精度。(3)针对数据随机性问题,本文提出了基于图注意力网络的电商智能推荐模型(ERM-GAT):(1)为让模型能够预测出用户对商品的评分,本文为二分网络附加了评分信息,使每条链接都有一个评分标签。模型可以依据相应的评分信息对二分网络进行链接预测。从而依据评分对未购商品进行排序后得到推荐列表。(2)由于用户历史记录的随机性,简单的编码学习不能避免无效数据的干扰,本文使用图注意力网络对节点特征进行智能学习,主动降低数据集中的无效记录的权重,提高电商推荐的智能性。(4)介绍了目前国际电子商务平台的现状及亚马逊平台的发展,并在亚马逊电商数据上进行了推荐模型的应用和分析。针对商品节点特征初始化的低效问题,本文提出了基于情感分类模型的节点初始化方法,依据商品描述文本和评价文本之间的情感差异,学习商品节点的特征向量。在应用中与基于随机游走、局部信息、协同过滤(MF)、Item2vec的模型进行了对比分析。应用结果证明ERM-GAT模型能够较好的完成推荐任务,准确度比其他模型有明显提高,并有效降低了数据随机性问题对推荐结果造成的影响。综上所述,本文将商品推荐问题转化为链接预测问题,利用两种图神经网络结构(图自编码器和图注意力网络)的相互辅助,实现了商品智能推荐。通过亚马逊电商平台数据上的应用证明了本文模型的有效性,并根据结果为电商平台提出了建议。
基于图自编码器的茶产品推荐研究
这是一篇关于图自编码器,茶产品,推荐系统,图注意力网络,评论文本,评分的论文, 主要内容为随着互联网的发展,电商平台上可以购买到的茶产品种类越来越多,信息更加丰富,同时还存在着大量的茶产品与用户的交互信息。更多的信息往往意味着更复杂的决策,面对这种信息过载问题,用户很可能会面临选择困难的窘境。推荐系统可利用用户行为数据主动为用户推荐合适的茶产品,在提升用户购物体验的同时,也提高了电商平台的销量。面对海量用户与茶产品信息,如何高效辅助消费者及时找到其感兴趣的茶产品,是一个值得研究的课题。当前的茶产品推荐模型中,未充分利用茶产品评论文本的特征,并且无法充分挖掘基于交互信息的用户特征和茶产品特征。图神经网络可以深度挖掘交互信息中数据特征。图自编码器作为图神经网络的一个重要组成部分,不仅具有了图神经网络的优点,还可以在编码、解码部分分别选择不同的神经网络。鉴于当前茶产品推荐存在的问题和图自编码器的优势,主要做了以下研究:(1)针对当前茶产品推荐中未充分利用茶产品的评论文本特征和无法充分挖掘用户和茶产品交互信息的用户特征和茶产品特征,提出了基于二阶邻域信息聚合的用户及茶产品语义特征提取模型。该特征提取模型以评论文本为交互信息,通过图注意力网络聚合二阶邻域信息的方式,实现茶产品语义特征和用户语义特征的提取,并通过实验证明该特征提取模型的有效性。(2)提出了基于图自编码器的茶产品推荐模型。该推荐模型编码器分为三部分,第一部分采用图卷积神经网络,提取以评分为交互信息的茶产品交互特征和用户交互特征;第二部分采用基于二阶邻域信息聚合的用户及茶产品语义特征提取模型,提取语义特征;第三部分则是在前两部分的基础上,分别将提取的茶产品和用户的特征进行拼接,全连接网络进行融合。最后,模型的解码器部分通过双线性解码器重构用户对茶产品的评分。通过真实数据集的相关实验表明,本文提出的基于图自编码器的茶产品推荐模型,充分利用了茶产品的评分信息和评论文本信息,不仅深度挖掘用户与茶产品的特征,而且从一定程度上提高了茶产品推荐的性能,与已有的其它模型相比,具有一定的优势。
自编码器在推荐系统中的应用研究
这是一篇关于推荐系统,评分预测,自编码器,图自编码器,变分推断,变分自编码器的论文, 主要内容为自编码器模型是机器学习领域内的一类重要模型,被广泛应用于多个领域并且展现出了惊人的效果。本文主要聚焦于几种适用于推荐系统的自编码器模型:经典自编码器、图自编码器和变分自编码器。针对个性化推荐系统的应用需求,本文对这三类自编码器模型进行改造并与其他推荐技术相结合,致力于提升现有推荐系统的性能。本文的主要研究工作和创新总结如下:(1)根据图自编码器的结构特点,提出了一种与社交影响力模型相结合的基于图自编码器评分预测方法。图自编码器对图结构中的消息传递模式有很好的特征抽取能力。该方法通过构建用户-项目的二分图,将评分预测任务转为链路预测问题,并合理的与全局影响力建模相结合,此外,本文也对模型的可解释性进行了分析。本文在公开数据集上对所提出的方法进行了广泛的实验,实验结果显示,本文提出的预测方法明显优于现有相关方法。(2)将经典自编码器的压缩编码范式应用于金融领域,提出了一种轻量级的非营利性众筹项目推荐框架。不同于现有的旨在提高投资回报率的推荐方法,该推荐框架致力于提高公益性众筹项目的投资成交率。实验表明基于该框架的推荐方法的预测准确率达到了该领域内的最前沿的性能。(3)对变分自编码器的隐空间结构进行了研究,提出了一种平衡编码器和解码器的混合推荐模型。首先,对于变分自编码器类推荐模型在训练优化过程中存在的后验崩溃问题,究其原因为优化不佳的编码器和表征能力太强的解码器之间的不匹配问题,即从数据流形到参数化的图之间映射不佳之问题,从而使得它们之间转换图的学习变得困难。针对这一问题,本文对编码器的隐空间进行改造,提出了能有效平衡编码器和解码器的推荐模型。实验结果表明,该方案能有效缓解后验崩溃问题。
基于遗传算法与图自编码器的社区隐藏方法研究
这是一篇关于社区隐藏,社区检测,遗传算法,图自编码器,隐私保护的论文, 主要内容为在日常生活中许多复杂系统都可以抽象为网络或者图,即由节点和边组成的数据结构,例如社交网络、生物网络、电子商务网络等。随着对网络性质的深入研究,人们发现许多实际网络都具有一个共同特点,即整个网络由若干个内部节点连接紧密外部节点连接稀疏的团体组成,这些团体一般被称为社区。社区发现是网络分析中的一项重要任务,主要目的是发掘网络中的社区,它有助于洞察网络的组成结构。良好的社区检测算法可以发现网络中真实的社区结构,给企业或组织带来巨大的益处,如构建推荐系统等。然而,社区本身包含了丰富的个人与团体的隐私信息,越来越精良的社区检测算法引发了人们对隐私泄露的担忧,社区隐藏问题也因此被提上日程。社区隐藏一般被表述为向网络中添加“不可见的扰动”(添加或删除少量链接)后,使得社区检测算法的性能显著下降或失效。当前,在众多社区隐藏研究中,针对全局的社区隐藏效果并不理想,并且没有体现网络的生成机制。为此,本文将基于向网络中添加尽可能少的扰动使得主流社区检测算法性能下降最大这一准则来开展研究工作,主要内容如下:(1)提出一个基于遗传算法并以归一化互信息(NMI)为适应度函数的社区隐藏算法。该算法通过引入添加了先验信息的基因池,以最小化NMI值为目标,保证了被攻击后网络中社区成员的分布与原始网络尽可能不同,实现了良好的社区隐藏效果。通过与多个基线算法对比,该算法在多个评价指标上达到了最优。并且根据可视化攻击结果,证明该算法能够实现间接攻击,充分体现了攻击的隐蔽性。此外,在进一步进行可移植性检验中,发现该算法在特定的社区检测算法上得到的对抗网络在推广到其他社区检测算法时,也表现出了良好的隐藏效果。(2)提出了一个基于图自编码器的社区隐藏模型。图自编码器作为一种生成模型可以反映网络的生成过程,显示节点之间的连接强弱,包含更为丰富的信息,这更有助于人们了解网络的潜在特征。该模型在分析社区检测算法和图神经网络本质的基础上,通过观察图自编码器生成社区的过程,选择对社区结构影响最大的链接进行重连,实现了对现有主流的社区检测算法的攻击,大大降低了社区检测结果的准确性。通过在多个真实数据集上进行实验,验证了本文提出的方法能够在仅改变极少链接的情况下,极大地降低大部分主流社区检测算法的准确性,扩充了社区隐藏算法的体系并且有效地实现了对个人和团体的隐私保护,同时也为设计更加鲁棒的高效社区发现算法提供了新的研究思路。
基于图自编码器的茶产品推荐研究
这是一篇关于图自编码器,茶产品,推荐系统,图注意力网络,评论文本,评分的论文, 主要内容为随着互联网的发展,电商平台上可以购买到的茶产品种类越来越多,信息更加丰富,同时还存在着大量的茶产品与用户的交互信息。更多的信息往往意味着更复杂的决策,面对这种信息过载问题,用户很可能会面临选择困难的窘境。推荐系统可利用用户行为数据主动为用户推荐合适的茶产品,在提升用户购物体验的同时,也提高了电商平台的销量。面对海量用户与茶产品信息,如何高效辅助消费者及时找到其感兴趣的茶产品,是一个值得研究的课题。当前的茶产品推荐模型中,未充分利用茶产品评论文本的特征,并且无法充分挖掘基于交互信息的用户特征和茶产品特征。图神经网络可以深度挖掘交互信息中数据特征。图自编码器作为图神经网络的一个重要组成部分,不仅具有了图神经网络的优点,还可以在编码、解码部分分别选择不同的神经网络。鉴于当前茶产品推荐存在的问题和图自编码器的优势,主要做了以下研究:(1)针对当前茶产品推荐中未充分利用茶产品的评论文本特征和无法充分挖掘用户和茶产品交互信息的用户特征和茶产品特征,提出了基于二阶邻域信息聚合的用户及茶产品语义特征提取模型。该特征提取模型以评论文本为交互信息,通过图注意力网络聚合二阶邻域信息的方式,实现茶产品语义特征和用户语义特征的提取,并通过实验证明该特征提取模型的有效性。(2)提出了基于图自编码器的茶产品推荐模型。该推荐模型编码器分为三部分,第一部分采用图卷积神经网络,提取以评分为交互信息的茶产品交互特征和用户交互特征;第二部分采用基于二阶邻域信息聚合的用户及茶产品语义特征提取模型,提取语义特征;第三部分则是在前两部分的基础上,分别将提取的茶产品和用户的特征进行拼接,全连接网络进行融合。最后,模型的解码器部分通过双线性解码器重构用户对茶产品的评分。通过真实数据集的相关实验表明,本文提出的基于图自编码器的茶产品推荐模型,充分利用了茶产品的评分信息和评论文本信息,不仅深度挖掘用户与茶产品的特征,而且从一定程度上提高了茶产品推荐的性能,与已有的其它模型相比,具有一定的优势。
基于图神经网络的链接预测及电商智能推荐分析
这是一篇关于链接预测,图神经网络,图自编码器,图注意力网络,电子商务推荐的论文, 主要内容为随着互联网的蓬勃发展,出现了很多在线交易平台,电商购物逐渐成为人们的重要消费方式。新冠疫情的出现使线下购物受到了限制,线上购物成为消费者疫情期间特殊的消费方式。电子商务带来便利的同时,也带来了信息过载问题,低效地海选商品既浪费了时间,又降低了商品流通效率。因此提高商品推荐精度,具有特殊的研究意义。商品推荐已经成为缓解电商购物信息过载的重要方式,受到研究者的广泛关注,仍存在着推荐精度、数据稀疏、数据随机性等问题需要改善。链接预测提供了新的解决思路,电商购物中的商品推荐问题可映射为用户—商品二分网络中的网络链接预测问题。二分网络结构能体现出商品和用户的交易关系,网络的潜在连边对应用户今后的购买商品。如何有效利用网络链接预测方法预测用户—商品二分网络中的潜在连边,是电商推荐网络化的重要研究内容。本文梳理了网络链接预测及推荐方法的研究成果,介绍了网络链接预测相关知识,提出了基于图自编码器的链接预测模型,而后针对推荐场景的特点将模型进行调整,提出了基于图注意力网络的电商智能推荐模型,并在亚马逊电商数据上进行了推荐模型的应用和分析。本文研究工作主要有以下几个方面:(1)首先介绍了网络链接预测和推荐技术的研究现状,对复杂网络以及链接预测的基础理论进行了论述,并对图神经网络的概念和分类进行了介绍。(2)本文提出了基于图自编码器的链接预测模型,根据已知的网络结构对节点的特征向量进行编码学习,并对学习后的节点特征进行解码,探索节点特征和节点间形成链接的统计规律,分析拥有何种特征的节点之间容易形成链接。对社交网络数据集进行了实验,实验结果说明基于图自编码器的链接预测模型提高了预测精度。(3)针对数据随机性问题,本文提出了基于图注意力网络的电商智能推荐模型(ERM-GAT):(1)为让模型能够预测出用户对商品的评分,本文为二分网络附加了评分信息,使每条链接都有一个评分标签。模型可以依据相应的评分信息对二分网络进行链接预测。从而依据评分对未购商品进行排序后得到推荐列表。(2)由于用户历史记录的随机性,简单的编码学习不能避免无效数据的干扰,本文使用图注意力网络对节点特征进行智能学习,主动降低数据集中的无效记录的权重,提高电商推荐的智能性。(4)介绍了目前国际电子商务平台的现状及亚马逊平台的发展,并在亚马逊电商数据上进行了推荐模型的应用和分析。针对商品节点特征初始化的低效问题,本文提出了基于情感分类模型的节点初始化方法,依据商品描述文本和评价文本之间的情感差异,学习商品节点的特征向量。在应用中与基于随机游走、局部信息、协同过滤(MF)、Item2vec的模型进行了对比分析。应用结果证明ERM-GAT模型能够较好的完成推荐任务,准确度比其他模型有明显提高,并有效降低了数据随机性问题对推荐结果造成的影响。综上所述,本文将商品推荐问题转化为链接预测问题,利用两种图神经网络结构(图自编码器和图注意力网络)的相互辅助,实现了商品智能推荐。通过亚马逊电商平台数据上的应用证明了本文模型的有效性,并根据结果为电商平台提出了建议。
基于图自编码器的茶产品推荐研究
这是一篇关于图自编码器,茶产品,推荐系统,图注意力网络,评论文本,评分的论文, 主要内容为随着互联网的发展,电商平台上可以购买到的茶产品种类越来越多,信息更加丰富,同时还存在着大量的茶产品与用户的交互信息。更多的信息往往意味着更复杂的决策,面对这种信息过载问题,用户很可能会面临选择困难的窘境。推荐系统可利用用户行为数据主动为用户推荐合适的茶产品,在提升用户购物体验的同时,也提高了电商平台的销量。面对海量用户与茶产品信息,如何高效辅助消费者及时找到其感兴趣的茶产品,是一个值得研究的课题。当前的茶产品推荐模型中,未充分利用茶产品评论文本的特征,并且无法充分挖掘基于交互信息的用户特征和茶产品特征。图神经网络可以深度挖掘交互信息中数据特征。图自编码器作为图神经网络的一个重要组成部分,不仅具有了图神经网络的优点,还可以在编码、解码部分分别选择不同的神经网络。鉴于当前茶产品推荐存在的问题和图自编码器的优势,主要做了以下研究:(1)针对当前茶产品推荐中未充分利用茶产品的评论文本特征和无法充分挖掘用户和茶产品交互信息的用户特征和茶产品特征,提出了基于二阶邻域信息聚合的用户及茶产品语义特征提取模型。该特征提取模型以评论文本为交互信息,通过图注意力网络聚合二阶邻域信息的方式,实现茶产品语义特征和用户语义特征的提取,并通过实验证明该特征提取模型的有效性。(2)提出了基于图自编码器的茶产品推荐模型。该推荐模型编码器分为三部分,第一部分采用图卷积神经网络,提取以评分为交互信息的茶产品交互特征和用户交互特征;第二部分采用基于二阶邻域信息聚合的用户及茶产品语义特征提取模型,提取语义特征;第三部分则是在前两部分的基础上,分别将提取的茶产品和用户的特征进行拼接,全连接网络进行融合。最后,模型的解码器部分通过双线性解码器重构用户对茶产品的评分。通过真实数据集的相关实验表明,本文提出的基于图自编码器的茶产品推荐模型,充分利用了茶产品的评分信息和评论文本信息,不仅深度挖掘用户与茶产品的特征,而且从一定程度上提高了茶产品推荐的性能,与已有的其它模型相比,具有一定的优势。
面向抗毁性的关键节点识别子系统的设计与实现
这是一篇关于图自编码器,图注意力网络,关键节点识别,链路预测,网络抗毁性分析的论文, 主要内容为近年来,随着互联网技术的飞速发展,网络规模日益扩大,网络运行数据呈指数型增长。由于网络的异质性,不同节点对网络发挥的作用也有巨大差异。在网络抗毁场景中,有些节点对网络的拓扑结构与通信功能有着更大影响,这样的节点被视作关键节点。对这些重要程度高的关键节点进行识别和保护,能够提高网络抗毁性,避免大规模的级联故障,保障网络通信业务的持续性。经典的网络关键节点识别方法主要包括基于网络结构的方法、基于迭代优化的方法、基于节点收缩和移除的方法等,上述方法分别考虑了邻居节点的数量、节点间的相互增强效应以及移除节点后对网络产生的影响来进行关键节点识别,但是存在如下问题:(1)这些方法均基于网络拓扑结构进行评价和识别,而网络拓扑结构在表示和建模节点信息上有一定局限性,无法从网络信息传播的角度分析失效节点的负载再分配带来的级联影响,导致一些重要的信息传播枢纽节点被忽略。(2)在复杂的高动态网络中,网络运维数据包括拓扑链接信息以及多维节点特征和链路特征,这些特征信息可以反映网络中信息的传播特性,提升关键节点识别的准确率与合理性。但是由于高动态网络运维信息及连通性的频繁变更,上述运维数据无法全面采集和及时上报,因此亟需对缺失的数据进行预测和补全。针对上述问题,本文提出了基于图神经网络的链路特征预测及关键节点识别算法,并设计实现了面向抗毁性的关键节点识别子系统,该系统能够高效、准确地实现高动态网络的信息预测以及面向抗毁性的关键节点识别。本文研究工作具体如下:(1)基于图神经网络的链路特征预测及关键节点识别方法。首先针对高动态网络中信息缺失导致现有识别方法无法全面利用网络节点和链路特征的问题,提出了基于空间融合图自编码器的链路特征预测方法。该方法中将自编码器划分为特征空间和结构空间,分别学习节点和链路属性的嵌入表示,并通过引入噪声、堆栈、库仑力等机制提升了模型的鲁棒性和学习能力,然后通过对空间特征进行融合解码,得到预测的网络节点和链路上的缺失信息。然后,在补全节点和链路信息的基础上,针对现有关键节点识别方法不能综合多指标反映节点对网络抗毁性影响力、缺乏失效节点的负载再分配带来的级联影响等问题,本文提出了基于图注意力网络的关键节点识别方法。该方法综合考虑了网络结构特征与信息传播特性等因素,定义了毁裂熵指标作为节点的关键性衡量尺度,然后提出基于注意力累加机制的识别方法,利用链路预测获取到的网络运维信息,结合图注意力网络进行面向抗毁性的关键节点识别。实验结果表明,与现有的关键节点识别算法相比,本文提出的识别方法得到的关键节点序列对网络的抗毁性影响最大,对关键节点的识别更准确。(2)面向抗毁性的关键节点识别子系统的设计与实现。本文根据提出的链路预测方法和关键节点识别方法,基于前端框架Vue、后端框架Spring Boot以及MySQL数据库,设计并实现了面向抗毁性的关键节点识别子系统。本文详细进行了需求分析、总体架构设计和功能模块设计,实现了数据处理与交互、网络运维信息预测、关键节点识别和通信故障预测等功能,并对系统功能和性能进行了测试。测试结果表明,本文系统能够高效实现数据交互、模型训练及相应的预测和识别等操作,满足面向抗毁性的关键节点识别子系统的功能和性能需求。
基于遗传算法与图自编码器的社区隐藏方法研究
这是一篇关于社区隐藏,社区检测,遗传算法,图自编码器,隐私保护的论文, 主要内容为在日常生活中许多复杂系统都可以抽象为网络或者图,即由节点和边组成的数据结构,例如社交网络、生物网络、电子商务网络等。随着对网络性质的深入研究,人们发现许多实际网络都具有一个共同特点,即整个网络由若干个内部节点连接紧密外部节点连接稀疏的团体组成,这些团体一般被称为社区。社区发现是网络分析中的一项重要任务,主要目的是发掘网络中的社区,它有助于洞察网络的组成结构。良好的社区检测算法可以发现网络中真实的社区结构,给企业或组织带来巨大的益处,如构建推荐系统等。然而,社区本身包含了丰富的个人与团体的隐私信息,越来越精良的社区检测算法引发了人们对隐私泄露的担忧,社区隐藏问题也因此被提上日程。社区隐藏一般被表述为向网络中添加“不可见的扰动”(添加或删除少量链接)后,使得社区检测算法的性能显著下降或失效。当前,在众多社区隐藏研究中,针对全局的社区隐藏效果并不理想,并且没有体现网络的生成机制。为此,本文将基于向网络中添加尽可能少的扰动使得主流社区检测算法性能下降最大这一准则来开展研究工作,主要内容如下:(1)提出一个基于遗传算法并以归一化互信息(NMI)为适应度函数的社区隐藏算法。该算法通过引入添加了先验信息的基因池,以最小化NMI值为目标,保证了被攻击后网络中社区成员的分布与原始网络尽可能不同,实现了良好的社区隐藏效果。通过与多个基线算法对比,该算法在多个评价指标上达到了最优。并且根据可视化攻击结果,证明该算法能够实现间接攻击,充分体现了攻击的隐蔽性。此外,在进一步进行可移植性检验中,发现该算法在特定的社区检测算法上得到的对抗网络在推广到其他社区检测算法时,也表现出了良好的隐藏效果。(2)提出了一个基于图自编码器的社区隐藏模型。图自编码器作为一种生成模型可以反映网络的生成过程,显示节点之间的连接强弱,包含更为丰富的信息,这更有助于人们了解网络的潜在特征。该模型在分析社区检测算法和图神经网络本质的基础上,通过观察图自编码器生成社区的过程,选择对社区结构影响最大的链接进行重连,实现了对现有主流的社区检测算法的攻击,大大降低了社区检测结果的准确性。通过在多个真实数据集上进行实验,验证了本文提出的方法能够在仅改变极少链接的情况下,极大地降低大部分主流社区检测算法的准确性,扩充了社区隐藏算法的体系并且有效地实现了对个人和团体的隐私保护,同时也为设计更加鲁棒的高效社区发现算法提供了新的研究思路。
面向抗毁性的关键节点识别子系统的设计与实现
这是一篇关于图自编码器,图注意力网络,关键节点识别,链路预测,网络抗毁性分析的论文, 主要内容为近年来,随着互联网技术的飞速发展,网络规模日益扩大,网络运行数据呈指数型增长。由于网络的异质性,不同节点对网络发挥的作用也有巨大差异。在网络抗毁场景中,有些节点对网络的拓扑结构与通信功能有着更大影响,这样的节点被视作关键节点。对这些重要程度高的关键节点进行识别和保护,能够提高网络抗毁性,避免大规模的级联故障,保障网络通信业务的持续性。经典的网络关键节点识别方法主要包括基于网络结构的方法、基于迭代优化的方法、基于节点收缩和移除的方法等,上述方法分别考虑了邻居节点的数量、节点间的相互增强效应以及移除节点后对网络产生的影响来进行关键节点识别,但是存在如下问题:(1)这些方法均基于网络拓扑结构进行评价和识别,而网络拓扑结构在表示和建模节点信息上有一定局限性,无法从网络信息传播的角度分析失效节点的负载再分配带来的级联影响,导致一些重要的信息传播枢纽节点被忽略。(2)在复杂的高动态网络中,网络运维数据包括拓扑链接信息以及多维节点特征和链路特征,这些特征信息可以反映网络中信息的传播特性,提升关键节点识别的准确率与合理性。但是由于高动态网络运维信息及连通性的频繁变更,上述运维数据无法全面采集和及时上报,因此亟需对缺失的数据进行预测和补全。针对上述问题,本文提出了基于图神经网络的链路特征预测及关键节点识别算法,并设计实现了面向抗毁性的关键节点识别子系统,该系统能够高效、准确地实现高动态网络的信息预测以及面向抗毁性的关键节点识别。本文研究工作具体如下:(1)基于图神经网络的链路特征预测及关键节点识别方法。首先针对高动态网络中信息缺失导致现有识别方法无法全面利用网络节点和链路特征的问题,提出了基于空间融合图自编码器的链路特征预测方法。该方法中将自编码器划分为特征空间和结构空间,分别学习节点和链路属性的嵌入表示,并通过引入噪声、堆栈、库仑力等机制提升了模型的鲁棒性和学习能力,然后通过对空间特征进行融合解码,得到预测的网络节点和链路上的缺失信息。然后,在补全节点和链路信息的基础上,针对现有关键节点识别方法不能综合多指标反映节点对网络抗毁性影响力、缺乏失效节点的负载再分配带来的级联影响等问题,本文提出了基于图注意力网络的关键节点识别方法。该方法综合考虑了网络结构特征与信息传播特性等因素,定义了毁裂熵指标作为节点的关键性衡量尺度,然后提出基于注意力累加机制的识别方法,利用链路预测获取到的网络运维信息,结合图注意力网络进行面向抗毁性的关键节点识别。实验结果表明,与现有的关键节点识别算法相比,本文提出的识别方法得到的关键节点序列对网络的抗毁性影响最大,对关键节点的识别更准确。(2)面向抗毁性的关键节点识别子系统的设计与实现。本文根据提出的链路预测方法和关键节点识别方法,基于前端框架Vue、后端框架Spring Boot以及MySQL数据库,设计并实现了面向抗毁性的关键节点识别子系统。本文详细进行了需求分析、总体架构设计和功能模块设计,实现了数据处理与交互、网络运维信息预测、关键节点识别和通信故障预测等功能,并对系统功能和性能进行了测试。测试结果表明,本文系统能够高效实现数据交互、模型训练及相应的预测和识别等操作,满足面向抗毁性的关键节点识别子系统的功能和性能需求。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕设港湾 ,原文地址:https://bishedaima.com/lunwen/52370.html