面向协同过滤的推荐攻击半监督检测方法研究
这是一篇关于协同过滤推荐系统,推荐攻击检测,半监督Fisher判别分析,SemiBoost的论文, 主要内容为随着大数据时代的到来,信息过载问题越来越受到广泛关注。协同过滤推荐系统被认为是解决信息过载问题的有效途径之一,被广泛应用在电子商务推荐等众多领域。然而,协同过滤推荐系统由于本身所具有的开放性,极易遭受推荐攻击,在这种攻击中,恶意用户出于自身商业竞争等目的,人为地向系统注入大量虚假用户概貌,以达到改变推荐结果的目的。为了检测推荐攻击,研究人员提出了无监督、有监督及半监督三类检测方法,其中,半监督检测方法的优势在于可以利用推荐系统中存在的大量无标记用户概貌提升检测性能。本文在综合分析国内外研究现状的基础上,对推荐攻击半监督类检测方法进行了一定的研究和探讨,以进一步提升半监督检测方法的检测性能。首先,针对已有半监督检测方法准确率较低的问题,本文提出了一种基于半监督Fisher判别分析的推荐攻击检测方法RAD-SFDA来提升半监督检测方法的准确率。该方法首先利用Fisher判别分析技术结合有标签用户概貌确定投影向量;然后,利用主元分析技术从有标签和无标签用户概貌建立的数据集中提取全局结构;最后,综合上述由有标签用户概貌确定的判别结构和由所有用户概貌确定的全局结构确定最佳投影向量,在最终的投影空间中训练贝叶斯分类器,利用训练好的贝叶斯分类器对测试集中的数据进行检测。其次,虽然上述提出的方法RAD-SFDA一定程度上提升了半监督检测方法的准确率,但该方法的检测稳定性不高,主要表现在该方法对高填充规模、高攻击规模的推荐攻击的识别能力不高。针对该问题,本文提出了一种基于集成学习SemiBoost的半监督检测方法RAD-SemiBoost,该方法首先根据用户概貌间的相似度对无标签用户概貌赋予伪标签并进行采样操作,然后将采样后带有伪标签的无标签用户概貌和有标签用户概貌共同训练个体分类器,最后,利用集成学习思想,将多次迭代的个体分类器组合成最终的集成分类器,利用最终的分类器对推荐攻击进行检测。最后,在协同过滤推荐领域标准的Movie Lens 10M数据集上,将本文方法与相关工作进行了实验对比,验证了本文所提方法的有效性。
基于用户评分偏移度和时间序列的群组攻击检测
这是一篇关于协同过滤推荐系统,多维用户评分偏移度,群组攻击,时间序列的论文, 主要内容为随着信息时代的到来,导致数据量不断增大,这样人们就需要花费大量的时间去筛选有用信息,这种现象就是“信息过载”。协同过滤推荐系统在很大程度上缓解了“信息过载”现象,但是由于其自身的开放性,使其在受到攻击时呈现出脆弱性导致推荐结果不准确。灰色组织的攻击具有一定的策略性,可以在短时间内改变推荐结果。因此,如何有效识别群组攻击,成为了急需解决的问题。本文从用户评分偏移与时间序列的角度入手,对群组攻击检测问题进行深入研究。本文主要内容如下。首先,针对现有的检测算法不能有效排除流行项目的干扰。本文提出一种基于用户评分偏移度的群组检测算法,算法中提出了两个新的群组攻击特征。利用k-means聚类算法分别根据两个群组攻击用户特征进行聚类,生成两个候选可疑群组,取两个候选群组的交集为可疑用户群组。根据群组攻击特征计算用户可疑度,并对可疑群组内用户进行可疑度排序。其次,传统的利用时间序列的检测算法,利用项目在一定时间内的评分数来进行序列构建,无法有效过滤掉目标项下的正常用户且无法有效分组攻击用户。本文提出一种基于时间序列的群组攻击检测算法,该算法构建项目时间序列并划分时间窗口,通过计算窗口评分占比和每个项目的评分熵,结合项目评分熵与窗口评分占比的乘积检测出群组攻击概貌。最后,在MovieLens100k、Netflix以及Amazon数据集上进行实验,验证本文所提群组攻击检测算法的有效性。
协同过滤推荐系统托攻击检测算法研究
这是一篇关于协同过滤推荐系统,托攻击检测,评分特征,数据交换,隐私保护的论文, 主要内容为随着移动互联网的发展,网络数据呈现海量增长,用户普遍受到信息过载的困扰。为了解决信息过载,提高用户获取信息的便利性,推荐系统被广泛应用于各种网络平台,目前最广泛的是基于协同过滤技术的推荐系统(Collaborative Filtering,CF)。协同过滤技术通过对用户历史评分进行统计获取目标用户的相似用户,根据相似用户的喜好对目标用户的喜好进行预测。但协同过滤技术的开放性使其极易受到托攻击的影响。攻击者通过向推荐系统中注入虚假用户来干扰推荐系统的预测结果,是推荐系统面临的主要问题之一。针对此问题,本文对集中式推荐系统中的托攻击检测以及分布式推荐系统中的隐私保护和托攻击检测问题进行了深入研究,具体的工作如下:(1)提出基于用户评分离散度的托攻击检测算法。通过分析真实用户和虚假用户评分的离散度分布情况,提出用户极端评分比、去极端评分方差和用户评分标准差三个特征作为用户评分离散度的衡量标准,将用户的评分离散度作为ID3决策树的分类属性,计算每个属性的信息增益率并选择信息增益度最大的属性作为根节点,根据所生成决策树对真实用户和虚假用户进行区分,从而实现对托攻击的检测。实验结果表明,基于用户评分离散度的托攻击检测算法对托攻击具有较好的检测效果同时算法具有良好的鲁棒性。(2)提出对隐私敏感的分布式推荐系统托攻击检测算法。首先在数据交换前对用户未评分的项目进行随机化填充,然后根据ADD模型进行数据交换。其次根据分布式协同过滤的特点对检测特定攻击模型的分类属性进行改进,在特定属性的交换过程中采用同态加密技术进行保护。最后获取全部用户分类属性后结合KNN算法将真实用户和虚假用户进行分类,实现在隐私保护的同时对托攻击进行检测。实验结果表明,对隐私敏感的分布式推荐系统托攻击检测算法能够在隐私保护的同时实现对托攻击用户的检测。本文研究推荐系统中的托攻击检测问题,包括集中式推荐系统和分布式推荐系统的托攻击检测。主要目的是:对推荐系统中的托攻击用户进行检测,降低托攻击对推荐系统的影响,保证推荐系统预测的准确性。并且考虑到分布式推荐系统中数据交换的隐私泄漏问题,在检测托攻击的同时保护用户隐私。实验结果表明,本文提出的算法对托攻击具有较好的检测效果。
推荐系统中基于群体行为特征分析的群组攻击检测方法
这是一篇关于协同过滤推荐系统,群组攻击检测,目标项,用户嵌入,聚类算法的论文, 主要内容为推荐系统作为现如今信息化时代的产物,帮助人们在没有确切需求或者数据量庞大时解决信息超载问题,为用户提供便携访问的高质量推荐。但是,由于推荐系统自身的脆弱性以及网络信息数据的繁杂性,推荐系统很容易遭到攻击,尤其是群组攻击对推荐系统造成很大的影响。这是因为攻击群组可以在比较短的时间内高效地改变推荐系统为用户提供的个性化推荐列表,进而影响整个推荐系统的可信度。因此,如何有效的检测出协同过滤推荐系统中的群组欺诈攻击是当前需要解决的重要问题。本文基于对群组攻击特性的分析,对协同过滤推荐系统的群组攻击检测进行了深入研究。首先,针对传统方法中无法有效区分目标项下攻击用户和正常用户的问题,本文提出一种基于目标项目分析的群组攻击检测算法。该算法首先通过对项目的评分数据进行分析,提出两个新的目标项目识别特征,并利用K-means聚类算法识别出可疑目标项。随后,按照时间间隔划分每个目标项的评分时间序列作为候选群组。最后,对于每个候选群组,定义一种新的群组可疑度计算方法,利用聚类算法检测出攻击群组。其次,针对现有同构网络无法全面表征用户行为的问题,本文提出一种基于用户嵌入的群组攻击检测方法。首先,通过分析用户的评分行为,构建用户-项目异构交互图,并利用Struc2Vec模型生成用户特征向量。然后,通过分析项目的评分情况,得到可疑目标项目。随后,对每个可疑目标项目下的用户,在向量空间中计算用户可疑度,并利用K-means算法对用户进行聚类,最终得到攻击群组。最后,在Amazon数据集和Netflix数据集上分别进行实验,并与现有的相关经典检测算法进行对比,验证了本文所提方法的有效性。
基于Hadoop平台的电影推荐系统的设计与实现
这是一篇关于非负矩阵分解,E2LSH,基于用户,协同过滤推荐系统,Hadoop的论文, 主要内容为随着互联网技术的发展,大数据时代的到来,出现了“数据过载”的现象,人们需要花更多的时间与精力来搜索信息。如何向用户推荐更有价值的信息,同时提高用户体验成为一个至关重要的问题。协同过滤推荐系统是一种典型的推荐系统,能够向用户推荐需要的信息,但随着用户量与物品数量的增加,该类系统存在低效和不易扩展的问题。为解决以上问题,本文结合非负矩阵分解算法(NMF)和精确欧氏局部敏感哈希算法(E2LSH)构建了基于用户的协同过滤推荐系统模型NE-UserCF(NMFE2LSH-UserCF)。然后,采用MovieLens数据集,对该模型的有效性与可靠性进行验证。最后,设计一个完整的结合NE-UserCF模型的推荐系统,并基于Hadoop平台对本文中设计的推荐系统进行实现。本文主要工作如下:(1)构建NE-UserCF模型。用NMF算法对用户-物品评分矩阵进行初步处理,保证降维后用户-物品评分矩阵的非负性特点,去除用户-物品评分矩阵中的无效特征和冗余特征,有效降低用户-物品评分矩阵的维度,加快相似用户的搜索,提高推荐效率。用E2LSH算法建立用户索引,对兴趣相似用户进行聚类,获得用户相似度矩阵,保证了索引结果的准确性和查全性。最后,采用基于用户的协同过滤推荐算法进行Top-N推荐。(2)验证NE-UserCF模型的可靠性。对NE-UserCF模型进行MapReduce实现后,选用MovieLens数据集进行离线批量训练,对模型的可靠性进行验证,验证表明该模型能有效提高推荐系统的准确率。(3)实现基于Hadoop平台的结合NE-UserCF模型的电影推荐系统。该系统的主要功能有:个人信息管理、电影信息管理、查看推荐结果与推荐结果管理等。在完成Hadoop平台的搭建、推荐系统平台搭建和算法部署后,基于Hadoop平台,实现结合NE-UserCF模型的电影推荐应用系统,达到了预期的推荐效果。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码客栈 ,原文地址:https://bishedaima.com/lunwen/56337.html