基于活动外观模型的前列腺图像分割研究
这是一篇关于图像分割,活动外观模型,点集匹配,高斯混合模型,特征信息的论文, 主要内容为前列腺癌是中老年男性常见疾病,也是国内最常诊断的肿瘤。随着人口老龄化和国内饮食结构的改变,可以预见前列腺癌发病率将进一步增高,有可能成为21世纪我们过发病率最高的恶性肿瘤。因此,前列腺癌已成为研究的重点和热点之一。虽然目前前列腺癌的病因和发病机制尚不完全清楚,但是对于前列腺癌的主要治疗方法是放疗。在前列腺放射治疗过程中的第一步就是要把原始图像中前列腺和附近的组织有效的区别开来。在很多方面,前列腺图像的分割也具有着重要的意义,例如判断治疗的进展程度而计算每次放疗的剂量。 近年来,在图像分析领域基于模型的分割方法已经成为一种非常有效的分割方法。该方法是通过将一个包含形状和外观信息的模型匹配到新的待分割图像上去,这种分割是以一种自上而下的方式进行的。由于模型包含内在的先验信息,这种方法要比传统的低维方法更能够抵抗局部图像扭曲和其它的干扰信息。对于大批量生产的工业应用,单模板形状已经可以作为一个充分的模型,但是由于生物组织对象变化很大,这种方法就不能够再适用。因此在构建模型的过程中必须要包含最主要的变化信息,能够有效聚集这类信息的直接方法就是通过统计平均来训练大量的形状产生一个统计形变模型。 利用活动外观模型对前列腺图像进行分割,首先需要构建前列腺模型,然后再通过初始化和搜索算法调整模型的相关参数将其匹配到待分割的前列腺图像上去。构建模型的几个基本步骤是:形状表示、寻找形状对应关系、形状对齐、降维处理、形状模型、外观模型。其中对模型的质量影响最大的一步是寻找形状之间的解剖对应关系,但是由于三维形状结构的复杂性以及表示形状的标记点数量比较多,所以给寻找形状对应关系造成了很大的困难。 从理论上讲,自动计算对应关系的各种算法实际上就是在形状之间进行的一种配准。研究人员已经提出了多种建立形状之间对应关系的方法,如最近邻点迭代法、软分配海盗算法等等。在这些方法中,形状通常用数量不等的点集表示,并寻找最佳的相似变换。但相似变换对点集的形变进行了过度约束,对形状比较接近的训练集如骨骼等比较有用,匹配差异较大的形状则性能较差甚至错误。一致点漂移匹配方法采用不同的思路,不寻找相似变换,用于建立点集之间的对应关系效果良好。在该方法中,点集的空间位置分布采用高斯混合模型表达,将两个点集的匹配视为一个最大后验概率问题。 一般的点集匹配方法,都仅利用形状中点的空间位置信息进行形状点集匹配。然而,活动外观模型解释图像不仅利用形状信息还利用了图像特征,如纹理信息。形状中对应点的图像特征实际上也具有一定的关联,相关信息可能有助于进行点集的匹配。同时利用空间位置信息和图像特征信息进行点集匹配,有可能会使最终的活动外观模型更加准确、紧凑。基于此,本文提出在一致点漂移匹配方法中融入图像特征信息,利用图像特征实现对高斯混合模型的调整,使得图像特征近似点的匹配概率相对变大,以期提高点集匹配的精度和最终活动外观模型的分割精度。 使用三维前列腺和肝脏点集进行匹配的仿真实验,结果表明本文方法可有效减少匹配误差,其中肝脏点集匹配误差从1.84mm降低到1.54mm,前列腺点集匹配误差从0.83mm降低到0.60mm。利用本文提出的形状点集匹配方法建立活动外观模型,对三维前列腺CT图像进行分割,分割精度也有一定提高,即体素正确覆盖率从88.7%提高到90.2%。
融合评论信息的深度推荐模型研究
这是一篇关于推荐系统,基于评论的评分预测,高斯混合模型,深度学习,语言模型的论文, 主要内容为在大数据时代,人们能接触到的数据出现了几何级别的爆炸增长,与之带来的是信息过载问题。推荐系统作为解决信息过载的重要手段,它可以帮助人们从纷繁复杂的数据中找到其可能感兴趣的信息。推荐技术在过去几十年的时间内得到了飞快的发展,在电子商务、信息检索、新闻推送等领域获得了广泛的应用,但是现有推荐技术依旧存在很多历史问题,如数据稀疏问题、冷启动问题等。为了解决这些历史问题,在推荐系统中融入评论信息已经被证明是非常有效的方法,可以为用户偏好商品属性特征挖掘提供更多的支持。同时随着深度学习技术的飞速发展,深度学习其强大的处理复杂问题的潜力和能够处理大规模多维数据的能力也为推荐系统带来了新的突破点。为了提升推荐性能,主要要解决下面两个问题:一是如何从复杂的评论信息中提取能表征用户/商品的特征,二是如何将这些特征信息应用于推荐系统中。针对第一个问题,本文对比了词袋模型、概率主题模型、词向量模型等文本表示模型,最终使用神经网络搭建的词向量模型对评论文本信息进行建模,同时将语言模型整合进推荐系统中。本文将每个词表示为词嵌入的形式,随着模型训练动态更新词向量,与已有的使用词袋方法的主题模型相比,从文本中提取的特征属性能够更好得应用于评分预测推荐任务。针对第二个问题,本文所提出的神经高斯混合模型从评论文本中建模出用户偏好特征和商品属性特征,在并行的神经网络上层构建高斯混合层来捕获用户和商品间的交互,并通过不同的特征学习到评分信息和权重信息。这就是本文提出的B-NGMM 模型(Neural Gaussian Mixture Model with Bert for Review-based Rating Prediction),模型模仿了用户对商品的评分行为。最后为了验证本文构建的融合评论信息的深度推荐模型的推荐性能,在五个真实的Amazon评论数据集上对我们的模型进行了测试,实验结果表明,本文提出的B-NGMM模型在基于评论信息的评分预测任务中具有较好的推荐性能。
面向稀疏评分数据的电影推荐技术研究
这是一篇关于电影推荐,深度学习,协同过滤,聚类,矩阵分解,高斯混合模型的论文, 主要内容为随着互联网的不断发展,网络数据呈现爆炸式增长。虽然海量的数据给人们的生活的方方面面带来了巨大的便利,丰富了人们对于信息的需求,但是巨大的数据量增加了人们获取对自身有用信息的困难程度,造成了信息过载。电影信息也是如此,随着电影的数量不断增加,用户找到自己喜欢电影的难度不断增加。如何从种类繁多、数量巨大的电影数据中找到每一位用户喜欢的电影成为研究热点。电影推荐系统作为能够处理这种问题的有效办法之一,已经成为电影提供商和研究人员研究的重点。电影推荐系统的核心是电影推荐算法,电影推荐算法的研究主要关注两个方面:top-N列表推荐和评分预测。top-N列表推荐的研究重点在于如何为用户生成满意的电影推荐列表,而评分预测则更加关注预测用户对某些电影的评分。矩阵分解推荐算法因为易于实现和时间复杂度较低的缘故,在电影top-N列表推荐中被广泛使用。但是,传统的矩阵分解推荐算法存在以下问题:当评分数据过于稀疏时,矩阵分解推荐算法的推荐性能会下降。另一方面,基于内存的协同过滤算法因为思想简单、易于实现等优点在电影评分预测中被广泛的使用,但评分数据的稀疏性和相似度的计算方法会严重影响协同过滤算法评分预测准确性。本文针对这两个方面存在的问题展开研究,主要工作如下:1.针对评分数据稀疏性问题给矩阵分解推荐算法带来的影响,在深度矩阵分解推荐模型的基础上,提出一个非对称深度矩阵分解推荐模型。该模型是一种具有非对称神经网络架构的新型矩阵分解模型,它充分地考虑到显式评分和隐式反馈对推荐结果的影响作用,将显式评分和隐式反馈结合起来,提出一种新的交互矩阵填充方法,来提高稀疏评分数据的利用率,缓解评分数据稀疏性对模型的推荐准确性影响;考虑到用户和电影数量的差异,采用非对称的神经网络对交互矩阵进行学习,以得到更加合理的参数。在MovieLens-100K和MovieLens-1M数据集上,把本文提出的非对称深度矩阵分解推荐模型与相关研究成果进行对比实验,采用HR和NDCG作为评价指标,实验结果表明,所提出的推荐模型能更加准确地进行电影top-N列表推荐。2.针对评分数据稀疏性和相似度计算方法对协同过滤算法的影响,提出基于高斯混合模型和改进Jaccard相似度的协同过滤算法。首先,提出一种新的交互矩阵构建方法,使用高斯混合模型对评分数据进行聚类,依据聚类对象的不同,算法可以拆分为对用户聚类构建交互矩阵的算法一和对电影进行聚类构建交互矩阵的算法二,通过聚类结果给相应用户和电影打上所属簇的簇标签,依据用户、电影和它们所属的簇标签来分别构建新的用户-电影交互矩阵,以此来缓解评分数据稀疏性对协同过滤算法评分预测效果的影响;其次,分析Jaccard相似度存在的不足,它在计算相似性时仅考虑到用户是否对电影评分,忽略了评分分值对相似性度量的影响,因此,把三角相似度和Jaccard相似度进行结合,提出一种新的相似度计算方法来消除这种不足。在MovieLens-100K,MovieLens-1M和Yahoo!Webscope R4电影数据集上,把所提出的算法与四种现有的基于协同过滤的推荐算法进行对比实验,使用MAE作为评价指标,实验结果表明,相对于现存的四种基于协同过滤的推荐算法,所提出的算法得到评分预测结果更加准确。
知识图谱中多粒度关系链接技术研究
这是一篇关于知识图谱,关系链接,Beta分布,Gauss分布,高斯混合模型的论文, 主要内容为知识图谱作为一种存储大量结构化和半结构化知识的语义网络,当前正广泛应用于自然语言处理的各个领域。为了充分利用知识图谱中的知识来帮助计算机更好地理解自然语言文本,就需要在知识图谱和自然语言文本之间建立“桥梁”。这将有利于知识图谱的补充完善和一系列自然语言处理任务的完成,如知识抽取、自动问答、智能搜索引擎等。知识图谱中的知识主要有实体知识和实体间的关系知识。为了将知识图谱中的关系与文本中相应的自然语言表述关联起来,本文提出了一个基于Wikidata的多粒度关系链接系统(Multi-Granuality Relation Linking System for Wikidata,MGRLSW)。MGRLSW通过把自然语言文本中的表述实体之间属性关系的词语或词语序列映射到知识图谱中对应的属性上,来建立有效的关系链接。为了构建关系链接模型,本文主要完成了如下工作:1.自然文本往往是通过多种表达方式描述一种关系,为了将这种表达多、含义相似的关系“聚起来”,并且把不同的类别分开来,就需要对句子进行聚类,即把相似的表达归为一类。我们使用位置敏感的词语移动距离度量(Location Sensitive Word Mover’s Distance,LSWMD)算法计算句子之间的相似度,并使用DPC算法对其进行聚类,其中一个簇表示一个关系的某种相似表达。2.通过分析表示关系的词语分布,可以观察到它们遵循一定的规律,我们使用Beta分布,Gauss分布和Gaussion Mixtrue Model(GMM)来拟合词语的位置,并分别构建相应的BoD-beta模板,BoD-gauss模板和BoD-GMM模板。其中BoDGMM模板使用多粒度思想,将单个粒度的Gauss分布转化为多个粒度的Gauss分布,并从每个粒度层面上抽取特征,实现了多个粒度层的转化。最后将MGRLSW应用到关系分类任务上,与两种前沿方法进行对比,验证了模型的有效性。3.为了展示模型的主要功能,我们搭建了一个展示系统,提供给用户除实体知识之外更多的信息。实验结果表明MGRLSW是行之有效的。我们还可以将MGRLSW应用到关系预测、自动问答和智能搜索引擎等领域。关系链接的构建将进一步完善知识图谱,从而为人工智能提供更好的支撑作用。
煤电机组能效状态异常诊断系统研究
这是一篇关于能效状态,异常诊断,符号有向图,高斯混合模型的论文, 主要内容为随着电力发展进入“新常态”,电力装机过剩,煤电机组负荷率持续走低,供电煤耗率升高,同时机组频繁变负荷运行,牺牲部分机组性能完成深度调峰任务,导致机组性能劣化,影响其经济安全运行。因此,开展煤电机组能效状态异常诊断技术研究对我国煤电行业持续发展尤为重要。本文研究了能效状态异常诊断的理论方法,构建了能效状态异常诊断模型,制定切实可行的运行调整方案和维修策略,为能效状态异常诊断提供了切实可行的解决方法。首先,基于领域知识与经验知识,对同类型煤电机组能效状态异常事件的总结梳理,获取影响能效状态的异常事件,分析其原因、影响以及相应的处理措施,构建能效诊断知识库;基于能效诊断知识库中的经验知识构建符号有向图诊断模型,将知识库中承载的系统结构、功能、行为、异常、故障等方面的知识用有向图的形式进行表达,建立能效异常事件发生时可能的传递路径。其次,基于高斯混合模型方法,确定符号有向图中各节点状态,根据建立的诊断模型进行推理诊断,分析并诊断引起能效状态异常的运行调整类和设备维护类原因,在为机组运行优化提供调整策略的同时,定位异常发生的位置、模式及原因,并给出相应的处理决策。最后,依托浙能国华宁海电厂超超临界百万机组,开展能效状态异常诊断系统研究工作,设计开发基于B/S架构模式开发超超临界百万机组能效状态异常诊断系统,推进煤电机组能效状态异常诊断研究工作的技术成果转化和工程应用。
基于云平台的隧道结构健康监测与评价技术研究
这是一篇关于隧道监测,健康评价,智能监测平台,功效系数,高斯混合模型的论文, 主要内容为我国铁路建设规模较大,投入运营的铁路隧道数量众多,如何监测、预防隧道结构变形、坍塌等病害是社会发展进步急需解决的问题。目前,国内已经建立了较为完善的隧道结构健康监测体系,并在隧道健康评价和隧道监测信息管理系统领域取得了一定成果。但是由于在隧道施工灾害防治工程中调查、监测和评价三个方面相互分散,隧道监测信息管理系统也存在着客户端和移动端数据不能共享等问题,现有的隧道结构健康监测体系不能满足我国隧道施工病害防治的需求,研究多源信息采集和健康评价于一体的隧道结构健康监测系统具有重要现实意义。本文主要监测隧道施工结构变形和爆破作业时的振动响应,通过对隧道施工影响及安全风险因素进行分析,构建了以隧道结构变形和振动响应为指标的隧道结构健康评价体系。针对隧道结构健康评价,文中对隧道结构监测硬件系统,隧道健康监测软件平台,监测数据处理及健康评价模型等关键技术进行研究,设计并实现了基于云平台的隧道结构智能监测系统,对我国隧道施工监测和评价方面具有重要价值。首先对隧道安全风险因素进行分析,构建隧道健康评价体系,并对隧道结构健康监测系统的软硬件框架进行了阐述;接着,设计了基于多源传感器采集的隧道结构监测系统,利用STM32单片机实现了数据采集程序,通过RS-485总线和CAN总线完成隧道内部数据传输并通过网络传输单元将数据上传至云服务器;随后,对隧道监测软件平台进行需求分析,以阿里云平台为基础,设计了多源监测数据管理数据库,设计了隧道监测数据对接软件,通过自定义网络传输协议保障数据通信稳定性,开发了隧道结构监测系统的Web软件和小程序,并实现了不同平台间的数据共享;然后,使用小波阈值降噪法对监测数据进行预处理,通过传感器数据耦合分析和数据支持度选择评价指标,使用功效系数法对隧道健康状态进行评价,并将高斯混合模型引入到隧道结构健康评价,利用主成分分析法和K-Means对高斯混合算法的参数初始化过程进行改进,通过两种评价模型的对比验证了其在隧道健康评价方面均具有可行性;最后,以集义隧道工程项目为背景,将隧道结构监测系统硬件设备进行安装部署,并测试隧道结构监测软件的功能,证明了本文的隧道结构健康监测系统能够实现实时监测和健康评价。
声纹识别算法研究与系统设计
这是一篇关于声纹识别,音频处理,说话人聚类,高斯混合模型,说话人分割的论文, 主要内容为声纹是指带有言语信息的音频频谱。声纹识别是生物特征识别和验证技术的一种,传统的生物识别技术(比如面容识别、虹膜识别等)存在对设备要求高,不能异域识别等缺点。声纹识别技术较于传统生物识别技术具有可异域识别、方式简单、对设备要求较低、经济性好、安全性高等优势,正逐渐受到越来越多人的关注。声纹识别也被称为说话人识别,是一种通过声音辨别说话人身份的技术。主要包括特征提取和模式识别两个模块,特征提取阶段从音频数据中提取到表征说话人身份的个性信息,模式识别阶段首先建立对应的声纹识别模型,通过声纹识别算法识别说话人身份。本文针对传统生物识别技术的缺点,验证了主流的声纹识别算法,设计实现了包含多个模块的声纹识别音频处理系统,设计搭建了移动端声纹识别应用-声纹锁,设计实现会议声纹识别聚类系统。本文主要完成了以下几个方面的工作:1.实现了音频预处理算法,并验证其有效性,通过音频实例分析比较多种音频降噪算法。实现声纹特征提取算法,分析比较各自优劣,通过说话人聚类任务验证所提取声纹特征的有效性。2.介绍并实现声纹识别算法,进行比较分析。搭建声纹识别系统框架,设计实现包含音频输入输出,音频降噪,音频分析,声纹识别和显示等多个模块的声纹识别音频处理系统。完成界面设计,通过实验验证系统稳定性。3.设计实现移动端声纹识别应用-声纹锁。进行并完善前后端界面设计,完成后端环境及系统框架搭建,构建Web端可视化界面。优化前后端程序并部署运行,通过实验测试软件性能。4.设计实现会议声纹识别聚类系统。完成系统框架搭建,完成系统模块设计和界面设计,通过音频实例测试系统性能。
知识图谱中多粒度关系链接技术研究
这是一篇关于知识图谱,关系链接,Beta分布,Gauss分布,高斯混合模型的论文, 主要内容为知识图谱作为一种存储大量结构化和半结构化知识的语义网络,当前正广泛应用于自然语言处理的各个领域。为了充分利用知识图谱中的知识来帮助计算机更好地理解自然语言文本,就需要在知识图谱和自然语言文本之间建立“桥梁”。这将有利于知识图谱的补充完善和一系列自然语言处理任务的完成,如知识抽取、自动问答、智能搜索引擎等。知识图谱中的知识主要有实体知识和实体间的关系知识。为了将知识图谱中的关系与文本中相应的自然语言表述关联起来,本文提出了一个基于Wikidata的多粒度关系链接系统(Multi-Granuality Relation Linking System for Wikidata,MGRLSW)。MGRLSW通过把自然语言文本中的表述实体之间属性关系的词语或词语序列映射到知识图谱中对应的属性上,来建立有效的关系链接。为了构建关系链接模型,本文主要完成了如下工作:1.自然文本往往是通过多种表达方式描述一种关系,为了将这种表达多、含义相似的关系“聚起来”,并且把不同的类别分开来,就需要对句子进行聚类,即把相似的表达归为一类。我们使用位置敏感的词语移动距离度量(Location Sensitive Word Mover’s Distance,LSWMD)算法计算句子之间的相似度,并使用DPC算法对其进行聚类,其中一个簇表示一个关系的某种相似表达。2.通过分析表示关系的词语分布,可以观察到它们遵循一定的规律,我们使用Beta分布,Gauss分布和Gaussion Mixtrue Model(GMM)来拟合词语的位置,并分别构建相应的BoD-beta模板,BoD-gauss模板和BoD-GMM模板。其中BoDGMM模板使用多粒度思想,将单个粒度的Gauss分布转化为多个粒度的Gauss分布,并从每个粒度层面上抽取特征,实现了多个粒度层的转化。最后将MGRLSW应用到关系分类任务上,与两种前沿方法进行对比,验证了模型的有效性。3.为了展示模型的主要功能,我们搭建了一个展示系统,提供给用户除实体知识之外更多的信息。实验结果表明MGRLSW是行之有效的。我们还可以将MGRLSW应用到关系预测、自动问答和智能搜索引擎等领域。关系链接的构建将进一步完善知识图谱,从而为人工智能提供更好的支撑作用。
融合地理信息的兴趣点推荐算法研究
这是一篇关于推荐系统,相似用户组,集成学习,活跃区域,高斯混合模型的论文, 主要内容为定位技术高速发展和智能手机的不断普及见证了基于位置的社交网络的出现,同时人们也步入信息过载的时代。科技的高速发展促使生活中的信息量呈指数型增加,这给用户在生活中挑选有用信息带来诸多问题。而推荐系统在一定程度上能缓解这一问题,它旨在从复杂的数据中向用户进行其感兴趣的信息。兴趣点推荐作为推荐系统中的研究热点,基于历史签到记录,它向用户推荐其感兴趣的位置。传统的兴趣点推荐依赖于历史签到记录,忽略了位置类别在地理上的分布以及用户活跃区域外的位置,因此基于这些问题,本文提出一种基于位置地理信息的兴趣点推荐方法。首先,基于位置的聚集效应,本方法计算位置类别的相关性和位置的流行度;其次,构建距离影响以及用户的活跃区域,根据目标位置的地理分布来计算用户对位置的伪得分;最后获取用户的偏好得分。相比于多种不同的兴趣点推荐方法,实验结果显示本文所提出的方法实现了较好的性能。位置地理信息有效提高推荐方法的性能,但忽略了用户之间的关联性。基于用户之间的关联性以及用户在地理上的签到分布,本文提出一种基于Bagging集成学习的兴趣点推荐方法,该方法融合用户偏好和空间特征。首先,该方法构建特定用户的多组相似用户组;进一步,采用朴素贝叶斯算法来获取用户对目标地点的伪得分;然后,利用高斯混合模型对用户的签到行为进行建模;最后,基于Bagging集成学习框架获取用户的偏好向量。实验结果表明本文所提出的方法在推荐性能上优于现有的方法。
知识图谱中多粒度关系链接技术研究
这是一篇关于知识图谱,关系链接,Beta分布,Gauss分布,高斯混合模型的论文, 主要内容为知识图谱作为一种存储大量结构化和半结构化知识的语义网络,当前正广泛应用于自然语言处理的各个领域。为了充分利用知识图谱中的知识来帮助计算机更好地理解自然语言文本,就需要在知识图谱和自然语言文本之间建立“桥梁”。这将有利于知识图谱的补充完善和一系列自然语言处理任务的完成,如知识抽取、自动问答、智能搜索引擎等。知识图谱中的知识主要有实体知识和实体间的关系知识。为了将知识图谱中的关系与文本中相应的自然语言表述关联起来,本文提出了一个基于Wikidata的多粒度关系链接系统(Multi-Granuality Relation Linking System for Wikidata,MGRLSW)。MGRLSW通过把自然语言文本中的表述实体之间属性关系的词语或词语序列映射到知识图谱中对应的属性上,来建立有效的关系链接。为了构建关系链接模型,本文主要完成了如下工作:1.自然文本往往是通过多种表达方式描述一种关系,为了将这种表达多、含义相似的关系“聚起来”,并且把不同的类别分开来,就需要对句子进行聚类,即把相似的表达归为一类。我们使用位置敏感的词语移动距离度量(Location Sensitive Word Mover’s Distance,LSWMD)算法计算句子之间的相似度,并使用DPC算法对其进行聚类,其中一个簇表示一个关系的某种相似表达。2.通过分析表示关系的词语分布,可以观察到它们遵循一定的规律,我们使用Beta分布,Gauss分布和Gaussion Mixtrue Model(GMM)来拟合词语的位置,并分别构建相应的BoD-beta模板,BoD-gauss模板和BoD-GMM模板。其中BoDGMM模板使用多粒度思想,将单个粒度的Gauss分布转化为多个粒度的Gauss分布,并从每个粒度层面上抽取特征,实现了多个粒度层的转化。最后将MGRLSW应用到关系分类任务上,与两种前沿方法进行对比,验证了模型的有效性。3.为了展示模型的主要功能,我们搭建了一个展示系统,提供给用户除实体知识之外更多的信息。实验结果表明MGRLSW是行之有效的。我们还可以将MGRLSW应用到关系预测、自动问答和智能搜索引擎等领域。关系链接的构建将进一步完善知识图谱,从而为人工智能提供更好的支撑作用。
基于隐语义模型的个性化推荐算法的研究
这是一篇关于推荐系统,隐语义模型,矩阵分解,高斯混合模型,协同过滤的论文, 主要内容为在大数据时代,各种信息爆发增长。在数据过载的情境下,用户想要迅速找到自己所需的信息变得困难,而推荐系统则可以很好地解决这一问题。推荐系统根据用户的行为,提供个性化推荐。推荐系统被大量地应用于各大网站中,具有巨大的商业价值;推荐系统与大数据、人工智能等紧密相连,具有学术研究价值。由此可见,对推荐系统的进一步研究很有意义。然而,推荐系统存在着数据稀疏性、系统可拓展性等关键性问题,同时推荐的准确率也有待提高。这些问题都制约着推荐系统的发展,因此为了缓解上述问题,展开了以下的研究工作:(1)针对传统的协同过滤推荐算法存在着数据稀疏性、邻居数据过少导致算法精度剧烈下降的问题,提出了融合潜在分类关联度的隐语义模型推荐算法。改进算法是将隐语义模型和基于物品的协同过滤推荐算法进行融合。改进算法的创新之处在于利用潜在分类关联度计算物品之间的相似性,并将时间上下文信息纳入到预测评分。最后在公开的数据集上进行了实验分析。(2)针对高维评分矩阵占用巨大计算资源、系统可扩展性较差的问题,提出了融合高斯混合聚类的隐语义模型推荐算法。改进算法是将隐语义模型算法和高斯混合模型进行融合。改进算法的创新之处在于,在推荐之前利用高斯混合聚类对评分数据进行预处理,划分为若干个规模更小的子矩阵,从而降低了数据计算的复杂度,并且考虑了隐式反馈对用户决策的影响。最后在公开的数据集上进行了实验分析。(3)在重庆慧居智能电子有限公司的智慧社区数据平台下进行了算法测试分析。测试结果表明,融合潜在分类关联度的隐语义模型推荐算法的最佳准确率、召回率、F1指标分别为43.6%、42.8%、40.2%;融合高斯混合聚类的隐语义模型推荐算法的最佳准确率、召回率、F1指标分别为46.6%、45.8%、41.6%,且算法的内存占用下降了24.97%。两种改进算法均能有效地缓解推荐系统存在的问题,并且提高了推荐的准确率。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:毕业设计驿站 ,原文地址:https://bishedaima.com/lunwen/54160.html