不平衡分布混合数据基于邻域粗糙集的特征选择方法研究
这是一篇关于不平衡分布,粒计算,邻域粗糙集,邻域互信息,特征选择的论文, 主要内容为特征选择是机器学习乃至人工智能研究的重要课题之一。基于利用邻域粗糙集进行特征选择已被证明是一种有效的方法。然而,现有算法对不平衡数据的敏感性是实际应用中的一个重要缺陷。本文讨论了如何利用邻域粗糙集来解决异构数据分布不均衡时的特征提取问题。特征选择算法可以应用于更广泛的领域,如欺诈识别、推荐系统等,但是由于现实世界中数据的分布并不总是一致的,这些领域的数据分布尤其分布不平衡,所以本文提出的特征选择算法可以在这些领域取得比较好的效果,本文提出的基于不平衡数据的研究算法能够使研究人员甚至工业界专业人员在处理实际应用中的问题时获得更有效的结果。具体来说,现今邻域粗糙集可以被广泛应用于数值数据的处理。然而,现有的邻域粗糙集在处理分类问题时大多不能很好地区分类别混合样本。也就是说,在处理不平衡分布的数据时,它不能有效地对类别进行分类。本文的创新工作如下。(1)针对数据不平衡问题,研究基于邻域熵的k近邻模型,并且定义了基于k近邻模型上的各种邻域熵和邻域条件互信息。然后,利用邻域条件互信息作为属性重要性的度量来进行特征选择,进而研究了基于邻域条件互信息的k最近邻域粗糙集属性约简算法。实验结果表明,提出的静态算法比现有的算法,特别是δ邻域粗糙集模型和k最近邻域粗糙集模型具有更好的效果,在20个数据集以及三个分类器下的60个精度结果比较中,有43个结果都优于其他算法。(2)探索动态机制下的k+近邻域粗糙集属性约简算法。在现实生活中,我们经常会遇到数据不断更新的情况,此时研究动态条件下的属性约简就成为一种必要。研究利用静态下的信息熵来定义一种新的邻域条件互信息,从而设计出新的在动态背景下可以在较短时间内获得一个可行属性集的属性约简算法。实验中比较了静态与动态两种算法的运行时间,发现加速比会随着增加对象集的增加而变大,到增加40%或50%对象集的时候,动态算法至少比静态算法快2倍,所以动态算法K+NCMI在运行时间上要优于静态算法。因此,当一个K+NDS中添加多个对象时,可以通过算法K+NCMI更有效地得到一个可行的约简。
基于粒球聚类的层次知识图谱构建研究
这是一篇关于层次知识图谱,粒球聚类,链接预测,实体结构相似性,粒计算的论文, 主要内容为知识图谱以其强大的语义处理能力和开放组织能力,为互联网时代的知识化组织和智能应用奠定了基础,在许多人工智能领域应用中发挥了重要作用,如搜索引擎、智能问答、语言理解等。知识图谱通常表现出层次和逻辑模式,这些模式保存在嵌入空间中,能提升知识问答和知识推理的效率。构建知识图谱层次结构,能够增强知识图谱表示学习的性能,还可以为知识图谱的下游任务提供数据和技术支持。现有的大多数工作都通过知识三元组、极坐标系、关系的语义层次关系、或者加入实体的类型、关系路径等信息利用知识图谱中的层次结构,改进现有的知识图谱嵌入模型,将层次结构集成到预测工作中。这些工作都取得不错成效的同时,忽略了实体之间的丰富关联。本文研究基于实体结构相似性,提出了一种无监督的基于粒球聚类(Ball k-means)的知识图谱层次构建方法,通过提高知识图谱中实体的嵌入质量,旨在实现提升链接预测的效果。构建层次知识图谱的关键在于层次实体结构的构建和自适应地确定知识图谱的最佳层次两个方面。(1)在层次实体结构的构建模型中,首先利用基于关系节点的struc2vec,通过对实体的结构领域进行建模,获取实体和关系的潜在表示;接着使用粒球聚类算法对实体,语义相似的实体形成的实体簇,进行聚类构建实体的层次结构,得到有层次的知识图谱;最后将层次结构的信息与实体的表示融合,增强实体的语义表达,提升链接预测的质量。(2)为了实现自适应地确定知识图谱的最佳层次,首先为无监督的层次知识图谱构建方法定义了层次的选择标准及聚类停止准则,再结合知识图谱的下游任务链接预测,借助链接预测任务的评价指标MRR、Hits@N来评估层次知识图谱的质量,最终确定层次知识图谱的最佳的层数k+1(含实体层)。为了验证本文模型的有效性,本文在三个数据集上进行实验,与五种不同的基准模型进行对比,实验结果证明本模型不仅为知识图谱构建了有效的层次结构,还提高了链接预测的效率。
基于粒球聚类的层次知识图谱构建研究
这是一篇关于层次知识图谱,粒球聚类,链接预测,实体结构相似性,粒计算的论文, 主要内容为知识图谱以其强大的语义处理能力和开放组织能力,为互联网时代的知识化组织和智能应用奠定了基础,在许多人工智能领域应用中发挥了重要作用,如搜索引擎、智能问答、语言理解等。知识图谱通常表现出层次和逻辑模式,这些模式保存在嵌入空间中,能提升知识问答和知识推理的效率。构建知识图谱层次结构,能够增强知识图谱表示学习的性能,还可以为知识图谱的下游任务提供数据和技术支持。现有的大多数工作都通过知识三元组、极坐标系、关系的语义层次关系、或者加入实体的类型、关系路径等信息利用知识图谱中的层次结构,改进现有的知识图谱嵌入模型,将层次结构集成到预测工作中。这些工作都取得不错成效的同时,忽略了实体之间的丰富关联。本文研究基于实体结构相似性,提出了一种无监督的基于粒球聚类(Ball k-means)的知识图谱层次构建方法,通过提高知识图谱中实体的嵌入质量,旨在实现提升链接预测的效果。构建层次知识图谱的关键在于层次实体结构的构建和自适应地确定知识图谱的最佳层次两个方面。(1)在层次实体结构的构建模型中,首先利用基于关系节点的struc2vec,通过对实体的结构领域进行建模,获取实体和关系的潜在表示;接着使用粒球聚类算法对实体,语义相似的实体形成的实体簇,进行聚类构建实体的层次结构,得到有层次的知识图谱;最后将层次结构的信息与实体的表示融合,增强实体的语义表达,提升链接预测的质量。(2)为了实现自适应地确定知识图谱的最佳层次,首先为无监督的层次知识图谱构建方法定义了层次的选择标准及聚类停止准则,再结合知识图谱的下游任务链接预测,借助链接预测任务的评价指标MRR、Hits@N来评估层次知识图谱的质量,最终确定层次知识图谱的最佳的层数k+1(含实体层)。为了验证本文模型的有效性,本文在三个数据集上进行实验,与五种不同的基准模型进行对比,实验结果证明本模型不仅为知识图谱构建了有效的层次结构,还提高了链接预测的效率。
基于粒球聚类的层次知识图谱构建研究
这是一篇关于层次知识图谱,粒球聚类,链接预测,实体结构相似性,粒计算的论文, 主要内容为知识图谱以其强大的语义处理能力和开放组织能力,为互联网时代的知识化组织和智能应用奠定了基础,在许多人工智能领域应用中发挥了重要作用,如搜索引擎、智能问答、语言理解等。知识图谱通常表现出层次和逻辑模式,这些模式保存在嵌入空间中,能提升知识问答和知识推理的效率。构建知识图谱层次结构,能够增强知识图谱表示学习的性能,还可以为知识图谱的下游任务提供数据和技术支持。现有的大多数工作都通过知识三元组、极坐标系、关系的语义层次关系、或者加入实体的类型、关系路径等信息利用知识图谱中的层次结构,改进现有的知识图谱嵌入模型,将层次结构集成到预测工作中。这些工作都取得不错成效的同时,忽略了实体之间的丰富关联。本文研究基于实体结构相似性,提出了一种无监督的基于粒球聚类(Ball k-means)的知识图谱层次构建方法,通过提高知识图谱中实体的嵌入质量,旨在实现提升链接预测的效果。构建层次知识图谱的关键在于层次实体结构的构建和自适应地确定知识图谱的最佳层次两个方面。(1)在层次实体结构的构建模型中,首先利用基于关系节点的struc2vec,通过对实体的结构领域进行建模,获取实体和关系的潜在表示;接着使用粒球聚类算法对实体,语义相似的实体形成的实体簇,进行聚类构建实体的层次结构,得到有层次的知识图谱;最后将层次结构的信息与实体的表示融合,增强实体的语义表达,提升链接预测的质量。(2)为了实现自适应地确定知识图谱的最佳层次,首先为无监督的层次知识图谱构建方法定义了层次的选择标准及聚类停止准则,再结合知识图谱的下游任务链接预测,借助链接预测任务的评价指标MRR、Hits@N来评估层次知识图谱的质量,最终确定层次知识图谱的最佳的层数k+1(含实体层)。为了验证本文模型的有效性,本文在三个数据集上进行实验,与五种不同的基准模型进行对比,实验结果证明本模型不仅为知识图谱构建了有效的层次结构,还提高了链接预测的效率。
基于舆情的城市暴雨内涝知识图谱关键技术研究
这是一篇关于知识图谱,知识图谱构建,城市暴雨内涝,粒计算,知识图谱推理的论文, 主要内容为城市暴雨内涝在我国是最普遍的自然灾害之一,给人们群众的人身、财产安全造成巨大威胁。传统收集灾情的途经难以在短时间内获得灾区的真实情况,而互联网第一时间涌现的大量来自灾区一线的舆情信息,能够为应急灾害响应与决策提供及时信息,对应急灾害救援有重要意义。本文基于互联网舆情信息,结合地学领域和自然灾害领域知识,引入粒计算理论构建多粒度的城市暴雨内涝知识图谱,研究顾及语义和结构信息的知识图谱推理方法,把知识图谱技术与互联网舆情信息结合,及时有效的获取灾情信息,为提高城市暴雨内涝的灾情响应与决策效率提供技术支撑。论文的主要研究工作如下:(1)多粒度城市暴雨内涝知识图谱的构建方法。针对城市暴雨内涝灾害快速构建领域知识图谱的需求,本文根据城市暴雨内涝的领域特征,基于自然灾害系统理论和简单事件模型,建立城市暴雨内涝事件六要素和属性表述五类别,自上而下设计城市暴雨内涝知识的本体库,引入粒计算理论建立知识图谱的分层递阶商空间模型,构建基于本体的多粒度城市暴雨内涝知识图谱,为知识图谱推理奠定基础。(2)顾及语义和结构信息的知识图谱推理方法。面对城市暴雨内涝灾情及时预警需求,针对已有知识推理方法关系图卷积神经网络(Relational Graph Convolutional Network,R-GCN)只收集到知识图谱节点特征,未能收集利用知识图谱结构信息和实体描述信息等问题,本文提出顾及语义和结构信息的知识图谱推理方法,利用SR-GCN+GSA(Semantic Relational-Graph Convolutional Network+Graph SAmple and aggregate)模型学习邻域实体的节点特征、实体描述的语义信息和知识图谱的结构信息,能够提高知识图谱推理的准确性。(3)城市暴雨内涝灾情预警的案例分析。基于本文研究的基于舆情的城市暴雨内涝知识图谱的构建方法和知识图谱推理方法,以“郑州‘7.20特大暴雨’城市内涝”为具体实例,通过实验与分析,验证本文提出的多粒度城市暴雨内涝知识图谱构建方法和顾及语义和结构信息的知识图谱推理模型在城市暴雨内涝灾害预警中的有效性。
基于粒计算的电影推荐系统设计
这是一篇关于粒计算,电影推荐系统,推荐算法,粒层次,粒度分析的论文, 主要内容为随着互联网的飞速发展,各类信息层出不穷,人类已步入大数据时代。信息时代带来便捷的同时,也同样带来了信息过载的问题。个性化推荐系统可以有效的解决信息过载的问题,在电子商务、电影、音乐推荐等领域均发挥着巨大作用。尽管应用场景不同,但其基本组成架构类似,具有较强的可移植性和适配性。本文选取了电影推荐的场景,借助粒计算模拟人脑处理复杂问题的方式,将其应用到推荐系统的核心——推荐算法中。本文的主要工作如下:(1)分析了常见推荐算法的流程,总结了常规相似度计算的优缺点,并根据用户评分习惯的不同,利用粒计算中粗细粒子聚合分解的研究方法,对用户群体进行分类。(2)利用粒度分析的求解思想,提出了分层粒化聚类算法。算法分成离线和在线两部分:离线部分根据U-I评分矩阵对所有用户分层粒化,直到生成最终的推荐聚类,在线部分利用生成的聚类进行推荐。(3)本文利用Django这一轻量级开发框架,实现了基于粒计算的电影推荐系统。数据存储使用My SQL,用户可以通过Web浏览器实现观看电影、查看推荐等人机交互操作。设计管理员模式,管理员可在后台增删电影,查看用户信息。针对系统各模块设计了测试用例并进行了功能测试。本文的创新点在以下几个方面:第一,将粒计算的指导思想融入到推荐系统中,根据粒化、粒度分析等原理简化推荐模型;第二,提出了基于用户评分习惯的相似度计算方法,消除了用户不同评分习惯带来的影响,解决了PCC方法在共同评分项目较少时对单个项目差异过于敏感的缺点,提高了推荐精度;第三,提出了分层粒化聚类算法,降低了算法复杂度,提高推荐精度。在与传统协同过滤算法进行对比后表明,本文提出的算法,推荐精度提高了2.90%、线上平均每个用户的推荐时间降低了5.04%。
基于粒计算的电影推荐系统设计
这是一篇关于粒计算,电影推荐系统,推荐算法,粒层次,粒度分析的论文, 主要内容为随着互联网的飞速发展,各类信息层出不穷,人类已步入大数据时代。信息时代带来便捷的同时,也同样带来了信息过载的问题。个性化推荐系统可以有效的解决信息过载的问题,在电子商务、电影、音乐推荐等领域均发挥着巨大作用。尽管应用场景不同,但其基本组成架构类似,具有较强的可移植性和适配性。本文选取了电影推荐的场景,借助粒计算模拟人脑处理复杂问题的方式,将其应用到推荐系统的核心——推荐算法中。本文的主要工作如下:(1)分析了常见推荐算法的流程,总结了常规相似度计算的优缺点,并根据用户评分习惯的不同,利用粒计算中粗细粒子聚合分解的研究方法,对用户群体进行分类。(2)利用粒度分析的求解思想,提出了分层粒化聚类算法。算法分成离线和在线两部分:离线部分根据U-I评分矩阵对所有用户分层粒化,直到生成最终的推荐聚类,在线部分利用生成的聚类进行推荐。(3)本文利用Django这一轻量级开发框架,实现了基于粒计算的电影推荐系统。数据存储使用My SQL,用户可以通过Web浏览器实现观看电影、查看推荐等人机交互操作。设计管理员模式,管理员可在后台增删电影,查看用户信息。针对系统各模块设计了测试用例并进行了功能测试。本文的创新点在以下几个方面:第一,将粒计算的指导思想融入到推荐系统中,根据粒化、粒度分析等原理简化推荐模型;第二,提出了基于用户评分习惯的相似度计算方法,消除了用户不同评分习惯带来的影响,解决了PCC方法在共同评分项目较少时对单个项目差异过于敏感的缺点,提高了推荐精度;第三,提出了分层粒化聚类算法,降低了算法复杂度,提高推荐精度。在与传统协同过滤算法进行对比后表明,本文提出的算法,推荐精度提高了2.90%、线上平均每个用户的推荐时间降低了5.04%。
基于粒计算的移动电子商务推荐系统研究
这是一篇关于移动电子商务,用户模型,粒计算,个性化推荐的论文, 主要内容为随着移动电子商务兴起,智能终端快速普及和社会网络广泛建立,并伴随着信息化领域的扩展、云计算理论的提出、语义学与本体论的兴起,人们已然进入大数据时代。然而,随着信息量的惊人膨胀,人们必须付出更大的成本才能在大量泛滥的信息中寻找到合适的信息。但是在信息检索、处理以及展示等方面相对于传统PC而言,移动终端有着明显的弱势。如何有效的分析用户需求,使用户不被信息的汪洋大海所淹没,以便捷高效的方式寻找用户的兴趣点,快速满足用户需求已成为移动电子商务研究的热点之一,移动电子商务推荐系统随之产生。与此同时,如何更好地适应移动电子商务所特有的移动性、虚拟性、个性化、极端数据、社会性等新兴特征也成为移动电子商务推荐系统研究的重点内容。作为信息处理的一种新的概念和计算范式,粒计算已经成为学术界近年来兴起的研究热潮。作为一种信息分类工具,粒计算的基本思想符合人们对实际客观世界的认知。通过发现和描述粒与粒之间的特定关系,粒的思想为移动电子商务推荐系统模型复杂数据问题的研究提供一条新的思路和方法。本文以移动电子商务推荐系统模型为研究对象,将粒度分析引入到移动电子商务推荐模型中,针对移动电商特性,借助推荐模型已有研究方法和手段,利用粒度分析中的粒化原则、合成原则、分层原则等,充分借鉴粒度分析中的基于结构化思维的哲学思想、基于结构化问题求解的方法论、基于结构化信息处理的计算模式,将多层次、多视角结构的思想引入到移动电子商务推荐系统模型中,构建一种基于粒计算的个性化推荐系统模型。在理论和方法上为移动电子商务推荐系统模型研究开辟一条新的途径,为解决实际问题提供科学依据。针对基于粒度分析的移动电商推荐的理论模型及方法,本文利用大众点评网成都站餐饮数据对个性化推荐模型进行实验分析,从推荐结果集合和属性粒子等方面分析推荐算法的准确度和多样性。本文研究不仅有望在理论和方法上为移动电子商务推荐系统模型研究难点开辟新的解决路径,而且可以拓展粒计算理论的应用领域,具有重要的理论和应用价值。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码客栈网 ,原文地址:https://bishedaima.com/lunwen/53797.html