推荐5篇关于蒙特卡洛树搜索的计算机专业论文

今天分享的是关于蒙特卡洛树搜索的5篇计算机毕业论文范文, 如果你的论文涉及到蒙特卡洛树搜索等主题,本文能够帮助到你

基于深度学习的轻量级分组密码研究

这是一篇关于分组密码,深度学习,ResNet,PRESENT,蒙特卡洛树搜索的论文, 主要内容为近年来,基于深度学习的密码算法安全性分析引起了人们的广泛关注。深度学习算法在轻量级分组密码的设计与分析中起着非常重要的作用。经典的密码分析手段包括差分分析和线性分析等。而差分分析的关键在于寻找有效的差分区分器。本文基于深度学习技术来训练差分区分器,并对轻量级分组密码PRESENT展开相关的研究工作,具体工作内容如下:(1)基于深度残差网络构建PRESENT的6轮神经区分器(ND,Neural Distinguisher)。首先,以Res Net模型为基础提出一种新的网络结构。进而,选择单个密文对和多个密文对作为新网络结构的训练样本,并训练出6轮的神经区分器。其次,以密文的4个比特位作为训练样本,选择Δ=(0x0,0,0,9)为输入差分对6轮神经区分器进行了优化。在此基础上,提取SPECK32/64第7轮中对神经区分器影响显著的16个密文比特位,进而训练出SPECK32/64的一个7轮神经区分器。最后,使用训练好的神经区分器进行密钥恢复攻击。实验结果表明,训练PRESENT算法的6轮神经区分器在单密文对、2对密文对、4对密文对作为训练样本下,其精确率分别达到了65.4%,73.7%,82.1%。此外,使用4比特神经区分器攻击PRESENT算法第7轮子密钥的复杂度为223.4。(2)使用启发式搜索算法寻找PRESENT算法7轮的输入差分。首先,生成一个随机的输入差分,并以构建一个6的神经区分器。其次,基于蒙特卡洛树搜索(MCTS,Monte Carlo Tree Search)的变体来优化。算法以作为搜索树的根节点和当前节点。在一次搜索迭代的过程中,选择与当前节点汉明距离为1的差分作为其子节点。用上置信算法评估筛选出最佳的子节点并作为当前节点。迭代结束后,将当前节点作为PRESNET算法7轮的输入差分,进而训练出PRESENT算法7轮的神经区分器,并与Δ=(0x0,0,0,9)为7轮输入差分的神经区分器进行比较。实验结果表明,在经过200轮迭代后,由蒙特卡洛树搜索算法得到的输入差分构建PRESENT算法的7轮区分器其精确率达到了51.6%。

面向数字孪生的交通态势推演系统的设计与实现

这是一篇关于交通态势推演,深度学习,蒙特卡洛树搜索,数字孪生的论文, 主要内容为随着城市化快速发展,交通拥堵成为大城市迫切需要解决的问题之一。通过为车辆规划出合适的路径,使车辆在满足旅行时间约束条件下避免时空聚集,是解决交通拥堵问题的一个重要途径。为此业界提出交通数字孪生,通过认知并收集车辆位置汇聚交通状态,以支撑车辆路径规划。但是由于车辆路线规划决策与交通态势之间的耦合,大量车辆当前的路线规划结果最终涌现出交通状态。为了进行最优化,需要枚举出所有车辆的全部潜在路径。随着交通网络的扩大和参与规划的车辆增加,搜索空间会变得非常庞大而难以计算。针对这一问题,论文提出一种基于数字孪生的交通态势推演算法,将大规模路径协同建模成马尔科夫过程,通过深度学习来评估交通状态。针对车辆规模问题,首先将路网分割成多个区域,通过分层的区域规划器和全局规划器,降低每一个规划器的处理规模。区域规划器负责协调区域内车辆的路径规划,并生成多种不同的区域引导策略。全局优化器用来评估各种策略的组合,以平衡区域均衡与系统最优。在规划过程中,算法使用蒙特卡洛树搜索来动态访问和模拟未来状态,从而减小搜索空间,并通过剪枝降低维度来实现更高效的搜索。仿真分析表明,论文提出的算法能够在有限时间内为路网中所有车辆规划出较优路径,并降低路网拥堵时长。论文基于交通态势推演算法设计并实现了面向数字孪生的交通态势推演系统,用于支撑交通数字孪生系统中的交通态势演化分析。论文对交通态势推演的功能进行了需求分析,并将系统划分为数据接入层、态势推演层、用户服务层。数据接入层负责导入现实世界中的数据,用于创建数字路网和数字车流;态势推演层用于执行交通态势推演算法,为路网中的车辆规划路径;用户服务层用于可视化态势推演结果,并验证推演效果。最后,论文针对系统的功能点设计了详细的测试用例并进行了功能测试,验证了系统的正确性和可用性。

融合时域网络与蒙特卡洛树搜索的知识图谱补全模型研究

这是一篇关于强化学习,知识图谱,蒙特卡洛树搜索,时域卷积网络,知识补全的论文, 主要内容为社交网络,知识图谱等在大数据时代都变得至关重要,然而,与图片和视频等欧几里得式数据不同,交错复杂的非欧几里得式结构数据面始终具有特征提取困难的问题,复杂的数据交互形式和庞大的数据体量,使得对网络结构数据的挖掘和分析变得相对困难。传统的网络结构数据挖掘通常采用表示学习方法,即将网络中的节点和关系获得嵌入向量,向量的方向和模长均具有表示意义。另外,随着强化学习方法的兴起,出现了将强化学习模型应用于网络结构数据处理数据挖掘任务。本文面向知识图谱以强化学习视角对数据分析与挖掘,其中一个主要问题是知识图谱实体补全问题。因此,本文以知识图谱补全任务入手,其任务表述为给定初始实体和该实体相关的关系,补全出关系对应的目标实体,构成完整的(头实体,关系,尾实体)三元组。该任务可应用于知识图谱补全,问答系统,推荐等诸多下游任务。本文将补全任务过程形式化定义为马尔科夫过程,采用强化学习思想学习解决补全问题,其中的网络特征提取与策略学习方法能够适应多种任务。首先,本文详细定义了知识图谱补全任务的马尔科夫过程,明确了过程四要素即状态空间、动作空间、转移函数和回报函数,进而使得该过程能够以强化学习方式对任务目标学习。然后,本文构建深度智能体网络(Graph-Agent,GA)用以学习环境中的不同状态下的动作决策策略,其中针对状态的序列化问题提出基于时域卷积网络的状态特征提取层网络;针对不同状态下动作空间不定问题提出基于共享参数的完全动作空间映射和灵活的策略层网络,共同组成完整的强化学习中的深度智能体网络。深度智能体网络对于环境的探索过程采用智能体决策结合蒙特卡洛树搜索方式以获取训练数据,解决了图结构数据上游走采样的低回报率问题,并采用轨迹存储池和离策略训练智能体对补全模型进行更新。最终,模型的预测阶段采用与探索过程相似的Q值结合蒙特卡洛树搜索方式,对搜索结果以加权评分排序。实验在NELL995的十个关系数据集和WN18RR数据集上进行,并采用平均倒数排名(MRR),HITS@K,平均精度均值(MAP)等信息检索评估算法,对模型效果进行验证,同时与目前在该任务上常用的三类算法中的经典算法进行比较,并对模型的可解释性进行了一定分析。模型中状态编码网络的训练速度相较于循环神经网络模型有着较大的提升。实验结果表明,在NELL995的十个关系数据集上预测的平均MAP达到89.9%,在WN18RR数据集上预测的MRR达到43.5%,模型的评估在部分任务上取得了与其他方法接近的效果,在多个补全任务上取得最优的效果。

欠完备信息的在线货物码垛算法研究

这是一篇关于三维装箱,机器码垛,在线算法,蒙特卡洛树搜索的论文, 主要内容为为了提高货物装卸的效率,托盘作为物流业中最基本的集装单元,在物流行业中得到了广泛的应用。托盘装载问题(Pallet Loading Problem,PLP),即码垛问题,是指如何把货物装入托盘中以最大化托盘的利用率。随着国际贸易的发展和国内电商的迅速崛起,实物商品交易中买卖双方对物流时效性提出了越来越高的要求,对码垛系统的实时性要求提出了新的挑战。传统企业在进行货物的托盘码垛时,仍然依靠人工计算和操作,一些企业即使引进了码垛系统,也难以适应复杂的码垛情况,难以满足物流的实时性要求。因此,研究在线机器人混合码垛算法,实现机器人在线实时码垛,提高托盘的利用率和码垛效率,具有重要的现实意义。在线码垛由于货物顺序未知,在选择摆放位置时,不仅要考虑装箱方案当前的状态,还需要考虑该方案对未来货物的影响,因此如何设置合适的评价策略,在短时间内选出最合适的摆放位置,是在线码垛算法的关键;此外,机器码垛跟传统装箱问题不同,在计算摆放位置时,必须考虑方案的机器可操作性,如何在装箱过程中考虑机器码垛的约束,是在线码垛算法的另一个难点。针对物流企业面临的上述痛点和难点,本文提出了一种可实现托盘快速装载的在线混合码垛算法。该算法主要由三部分组成:第一部分是剩余空间的表示以及货物的放置,这一部分受到了码垛机械手的限制,着重对机械手在托盘码垛中所遇到的干涉情况进行了分析和规避;第二部分是迭代前瞻树搜索算法,先是基于概率对在线货物进行预测和选取,然后对货物的合法放置方式进行模拟试错,如此循环,直到将树结构模拟延伸至指定层数为止;第三部分是针对剩余货物的贪婪放置算法,在树结构的叶结点上,对剩余货物采用贪婪策略进行快速码垛以获得完整的码垛方案。第三部分结束之后,算法会将码垛结果从树结构的叶结点上传到根节点,于是根节点即可根据结果选出最佳的放置方式,另外为了保证贪婪结果的一般性,在每个叶结点都会进行多次贪婪采样并上传。本文选取LKK公司的248个真实订单数据进行测试。所提出的在线算法与离线算法相比,实验结果差距不大,都取得了不错的码垛效率和托盘利用率,成功实现了在线混合码垛,验证了本文算法的可行性和有效性。本文对各个实验组进行了比较,分析不同的评价策略对实验结果的影响程度,为在线码垛中如何选取合适的评价策略提供了思路和参考。最后,本文还对托盘的码垛过程和装载方案进行了三维可视化展示,实现了动态仿真。

基于约束的可解释欺诈评论者检测模型研究

这是一篇关于内在解释,欺诈评论者检测,蒙特卡洛树搜索,原型学习,图神经网络的论文, 主要内容为电商平台上的产品评论在一定程度上影响了消费者的购买决策,在利益的驱使下,一些商家可能会雇佣欺诈评论者发表大量欺诈评论来推广或贬低目标产品,这对电商平台造成了一定的负面影响。为检测这些欺诈评论者,国内外学者进行了大量的研究,并取得了不错的检测效果。但是,这些检测模型无法充分利用原始数据集中的重要信息,对检测精度造成了一定影响。图神经网络虽然在一定程度上提升了模型检测的精度,但这类检测方法多为黑盒模型,缺乏对检测结果的合理解释。目前一部分研究使用了事后解释方法对模型结果进行解释,但是该类方法在解释模型分类原因时不够清晰,从而限制了模型的应用。为解决上述问题,本文提出基于约束的模型内在解释方法和融合解释机制的欺诈评论者检测模型。首先,针对现有检测模型利用事后解释方法时,获得的解释相对不清晰的问题,提出基于约束的模型内在解释方法。该方法引入解释约束的定义,对由电商平台数据集构建的异构信息网络提取关键结构,即元图;以元图为图遍历的线索,并指导以异构信息网络为根节点的蒙特卡洛树搜索;通过将搜索树中各节点向量与模型分类向量比较,得到异构信息网络中节点的重要度得分,得分较高的节点形成的集合就是该异构信息网络的内在解释部分。其次,针对现有检测模型无法充分利用电商平台数据集中信息的问题,提出融合解释机制的欺诈评论者检测模型。该方法将异构信息网络和元图作为输入,通过构建一个具有上下层结构的编码器对两图进行编码,并获得其嵌入向量;设计一种基于原型学习的原型迭代方法,计算两图的嵌入向量和原型向量之间相似度,并对原型进行更新;对分类损失和原型损失进行分析,完成模型训练,并将原型向量与异构信息网络的嵌入向量输入至分类器得到分类结果。最后,将本文所提的两种方法和对比方法在Amazon数据集和Yelp数据集上进行了实验,并对实验结果进行对比分析。

本文内容包括但不限于文字、数据、图表及超链接等）均来源于该信息及资料的相关主题。发布者：源码货栈，原文地址：https://bishedaima.com/lunwen/54716.html