四维弹簧模型高性能计算及超大规模前处理方法研究
这是一篇关于4D-LSM,高性能计算,并行性能,数字精度,超大规模,前处理的论文, 主要内容为岩石力学离散数值方法的应用很大程度受制于其庞大的计算量,随着计算机的发展,借助高性能计算解决该问题成为可能。结合高性能计算,开发、测试、优化、应用和推广岩石力学高性能并行数值计算方法和软件,不仅是岩石力学继续向前发展的需要,也契合我国高性能计算均衡发展的战略规划。本文基于Open MP和CUDA,实现了4D-LSM的多核CPU并行、GPU并行以及CPU-GPU混合并行,从线程数量、求解问题类型、计算规模以及硬件资源等方面对4D-LSM的并行性能做出基础性分析;研究了数字精度对4D-LSM计算结果的影响;找到了4D-LSM计算量的瓶颈因素;提出了基于4D-LSM的偏心四维模型(ECC4D)和一种利用有限元几何模型快速实现4D-LSM超大规模前处理的方法。研究表明,4D-LSM具有很高的并行度,利用高性能计算能够更好岩石工程问题;4DLSM的GPU并行必须使用双精度;极限计算规模受制于物理内存容量,按照阿里云目前的计算资源,4D-LSM的计算规模可以达到10亿颗粒;偏心四维模型(ECC4D)能够表征岩石材料的非线性特征,突破了传统晶格弹簧模型泊松比最大为0.25的限制;提出的前处理方法能够在保证可视化建模前提下很好的构建大规模4D-LSM模型,解决了模型规模受制于显存容量的问题。
基于资源管理与调度的仿真一体化平台的研究与实现
这是一篇关于仿真设计,集群监控,作业调度,高性能计算,一体化平台的论文, 主要内容为随着高性能计算以及云计算的蓬勃发展,高性能集群资源支撑着制造业、航天、教育、石油等科研领域的越来越复杂的产品设计,为各领域的快速发展奠定了坚实的基础,所以高性能计算受到仿真设计科研人员的青睐。在教育领域,高校学生和老师做仿真设计实验时,以传统方式使用集群资源是非常耗时的,运维人员管理集群也很不方便。现今将集群资源的使用和管理统一在一个平台上,方便管理员管理,简化学生和老师使用集群资源的步骤,在用户无需关心集群资源的底层细节以及调度的策略去使用计算资源的情况下,为用户提供一个Web平台去访问计算资源。不仅提高了用户仿真设计效率,而且提高了集群资源的利用率。论文选题来源于企业实际开发,主要完成以下内容。(1)对仿真一体化平台进行功能需求和非功能需求分析。本文通过研究仿真设计用户对集群资源使用以及集群资源管理员对集群资源管理的具体需求,结合某高校现有的高性能计算平台,分析了仿真设计一体化平台的功能需求以及非功能需求,同时通过用例图对用户的功能需求按功能模块进行建模。(2)对仿真一体化平台进行设计与实现。将系统的功能需求按模块划分,包括桌面管理、仿真设计、作业管理、用户数据管理、集群监控和审计管理模块,根据实际需求研究具体实现时所需的技术方案和系统的整体架构。由于是B/S架构的Web系统,采用Spring Boot框架快速构建系统,数据库使用Postgre SQL,针对高校对仿真设计软件的需求,系统内置了几种默认的仿真软件,也支持管理员通过平台动态配置,并为用户提供每一次仿真作业的相关数据存档、管理和共享功能。在作业调度和集群运行数据实时监控方面,由于LSF软件的全局资源共享、多个节点可以并行执行作业、支持多种操作系统、扩展集群能力强等优势,系统选用LSF软件作为集群的调度。为集群中每个节点安装LSF软件,配置集群主节点、从节点、集群管理员等相关信息,调用LSF相关命令将作业信息和集群监控数据返回展示在前端,方便管理员和运维人员查看和管理作业及节点。其次考虑到作业执行相关数据和集群监控数据比较多,作业数据和集群监控数据采用按月分表存储。然后给出系统功能模块图,分别对系统的每个模块通过类图和时序图进行详细设计与实现。(3)对仿真一体化平台进行测试。首先测试桌面管理、仿真设计、用户数据管理、作业管理、集群监控和审计管理模块的功能,其次测试了系统的性能、安全性、可靠性和可扩展性。根据测试结果,系统符合用户预期的需求。
面向HPC领域的知识图谱构建研究与应用
这是一篇关于知识图谱,高性能计算,关系抽取,图团体检测的论文, 主要内容为高性能计算(High Performance Computing,HPC)是国之重器,HPC相关技术是国家发展的战略性制高点技术和核心竞争力,涉及硬件、基础软件、应用软件等多个领域。作为执行复杂计算的基础,HPC通过数据计算推动数据科学和工业社会发展。然而,现有的HPC人才数量难以支撑迅猛增长的应用需求。同时,HPC强调实践性,要求很高的互动性,HPC学习者需要优质的学习途径和方法来完成学习活动,保证所学HPC知识与领域知识融会贯通,提高自身的HPC专业能力。再者,HPC横跨多个学科和领域,不但专业性强而且复杂度高,传统的题库学习方式成本高昂。因此需要一种高效、低成本的方式去梳理HPC知识的学习脉络,评价HPC实践活动的实际效果。本文通过“AI+教育”的方式去构建HPC学科类和领域类知识图谱,通过图谱对HPC领域中的实体、概念、属性以及对象间的关系进行建模,用智能化的方式将散列各处的HPC内容汇集到知识图谱中,为学员提供一种个性化的知识点式学习途径和学习效果评估方法。对于HPC知识图谱构建任务,仍存在三个挑战:1)针对HPC实体抽取任务,大量的实体概念隐藏在非结构化数据中,涉及数据标注的提取方式耗时费力,且HPC涉及的领域和学科较多,需要在短时间内提取各领域和学科的关键知识点;2)针对HPC关系抽取任务,因图谱是面向HPC教育平台所构建,所以知识点间的关系需要精准且有学习关联意义,本文要求快速抽取出实体间的多重内在语义联系;3)针对抽取出的知识数据,知识条目需与学科强相关,对于每个领域和课程的知识图谱构建,抽取出的实体对象和关系存在过溢、低权值、重要度不匹配的问题,图谱数据需要进一步优化。为解决上述挑战,本文的主要工作包括:1)提出一种针对特定领域下,融合迭代频率特征统计提取模型、语义特征提取模型的实体抽取框架。通过将基于“N-gram”的动态实体扩充策略与词向量语义特征相结合进行实体提取,利用这种联合语义特征的统计提取方法,能够快速地提取目标概念和部分关系信息;2)提出了一种多特征联合模板关系提取策略。设计共现频率提取方法,并将频率关系与近义关系结合作为粗粒度关系,然后通过基于Snowball的关系挖掘算法挖掘细粒度三元组关系,并与粗粒度关系整合后作为图谱关系基础,结合两者来共同反映HPC知识的关系特征;3)提出一种HPC知识图谱优化算法,包括HPC实体聚类设计、基于LDA的知识加权策略、基于图团体检测的知识裁剪策略。此外,本文设计了基于知识图谱的学科实践评估和学习资源推荐算法,实现个性化推荐和学习状态评估。最后,构建相关应用系统,将图谱数据进行java可视化控件移植。为了验证应用效果,采取人工抽样评估方式进行综合评测。
深度学习中卷积计算加速技术研究
这是一篇关于高性能计算,深度学习,卷积计算,异构众核架构,加速技术的论文, 主要内容为在高性能计算领域中,卷积计算加速技术旨在加速卷积神经网络模型前向推理阶段,应用于各类卷积神经网络的卷积层中。在前向推理阶段,为了学习到更细节的图像特征,卷积神经网络变得越来越深,越来越复杂,这使得卷积神经网络中计算量、参数量呈指数增长。由于卷积神经网络涉及到大量密集型计算,这种计算在低内存容量、低算力的嵌入式设备中难以部署,因此,人们将这种计算部署于高性能处理器集群上运行。如今,卷积神经网络中卷积层的密集型计算速度远远不能满足人们的需求,因此,卷积计算加速技术受到人们的广泛关注。本文主要研究了深度学习中卷积计算的加速技术,并在异构众核架构芯片上将卷积计算加速技术成功应用于三种卷积算法中,取得的研究成果如下。(1)基于异构众核架构的直接卷积计算加速。提出直接卷积计算的加速方法,首先优化数据访存方案,其次在数据加载阶段融合双缓冲数据的加速技术,利用异步加载使得计算与数据通信相互隐藏,最后在卷积计算阶段使用脉动阵列进行计算,进一步加速直接卷积计算。选取VGG-16、Res Net-50的多层卷积层进行多组实验,实验结果均体现各种加速技术应用在直接卷积计算中的有效性。例如在保证正确性的前提下,在VGG-16中,相比于并行直接卷积计算,最高有效算力达到126.65 GFLOPS,最高加速比达到7.45。(2)基于改进Im2col变换的分组卷积计算加速。Im2col变换存在内存占用量大、重排速度慢等问题,首先针对这两个问题,提出改进的Im2col变换。其次针对数据分配问题设计多核映射方法,最后在密集型计算方面,提出利用SIMD(Single Instruction Multiple Data)向量指令进行数据并行处理的方案,大大提升计算效率。在精度误差允许范围内,在Alex Net的五层卷积层测试样例上进行实验,相比于串行的基于Im2col变换的分组卷积计算,最高有效算力达到186.71 MFLOPS,最高加速比达到79.52。(3)基于异构众核架构的Winograd卷积计算加速。随着Winograd卷积广泛应用于卷积计算,实现Winograd卷积的空间扩展是必经之路。首先利用SIMD向量指令将二维空间的Winograd卷积扩展到三维空间,其次在实现Winograd卷积计算的四个步骤中,利用SIMD向量指令实现数据并行转换,最后对于哈达玛积问题,提出转换为矩阵乘的方法,并利用脉动阵列实现矩阵乘运算。以VGG-16、Fusion Net中的多层卷积层作为测试样例,在保证正确性的前提下,融合了多种加速技术的Winograd卷积计算最高有效算力达到1915.67 GFLOPS,最高加速比达到314.27。
基于资源管理与调度的仿真一体化平台的研究与实现
这是一篇关于仿真设计,集群监控,作业调度,高性能计算,一体化平台的论文, 主要内容为随着高性能计算以及云计算的蓬勃发展,高性能集群资源支撑着制造业、航天、教育、石油等科研领域的越来越复杂的产品设计,为各领域的快速发展奠定了坚实的基础,所以高性能计算受到仿真设计科研人员的青睐。在教育领域,高校学生和老师做仿真设计实验时,以传统方式使用集群资源是非常耗时的,运维人员管理集群也很不方便。现今将集群资源的使用和管理统一在一个平台上,方便管理员管理,简化学生和老师使用集群资源的步骤,在用户无需关心集群资源的底层细节以及调度的策略去使用计算资源的情况下,为用户提供一个Web平台去访问计算资源。不仅提高了用户仿真设计效率,而且提高了集群资源的利用率。论文选题来源于企业实际开发,主要完成以下内容。(1)对仿真一体化平台进行功能需求和非功能需求分析。本文通过研究仿真设计用户对集群资源使用以及集群资源管理员对集群资源管理的具体需求,结合某高校现有的高性能计算平台,分析了仿真设计一体化平台的功能需求以及非功能需求,同时通过用例图对用户的功能需求按功能模块进行建模。(2)对仿真一体化平台进行设计与实现。将系统的功能需求按模块划分,包括桌面管理、仿真设计、作业管理、用户数据管理、集群监控和审计管理模块,根据实际需求研究具体实现时所需的技术方案和系统的整体架构。由于是B/S架构的Web系统,采用Spring Boot框架快速构建系统,数据库使用Postgre SQL,针对高校对仿真设计软件的需求,系统内置了几种默认的仿真软件,也支持管理员通过平台动态配置,并为用户提供每一次仿真作业的相关数据存档、管理和共享功能。在作业调度和集群运行数据实时监控方面,由于LSF软件的全局资源共享、多个节点可以并行执行作业、支持多种操作系统、扩展集群能力强等优势,系统选用LSF软件作为集群的调度。为集群中每个节点安装LSF软件,配置集群主节点、从节点、集群管理员等相关信息,调用LSF相关命令将作业信息和集群监控数据返回展示在前端,方便管理员和运维人员查看和管理作业及节点。其次考虑到作业执行相关数据和集群监控数据比较多,作业数据和集群监控数据采用按月分表存储。然后给出系统功能模块图,分别对系统的每个模块通过类图和时序图进行详细设计与实现。(3)对仿真一体化平台进行测试。首先测试桌面管理、仿真设计、用户数据管理、作业管理、集群监控和审计管理模块的功能,其次测试了系统的性能、安全性、可靠性和可扩展性。根据测试结果,系统符合用户预期的需求。
基于资源管理与调度的仿真一体化平台的研究与实现
这是一篇关于仿真设计,集群监控,作业调度,高性能计算,一体化平台的论文, 主要内容为随着高性能计算以及云计算的蓬勃发展,高性能集群资源支撑着制造业、航天、教育、石油等科研领域的越来越复杂的产品设计,为各领域的快速发展奠定了坚实的基础,所以高性能计算受到仿真设计科研人员的青睐。在教育领域,高校学生和老师做仿真设计实验时,以传统方式使用集群资源是非常耗时的,运维人员管理集群也很不方便。现今将集群资源的使用和管理统一在一个平台上,方便管理员管理,简化学生和老师使用集群资源的步骤,在用户无需关心集群资源的底层细节以及调度的策略去使用计算资源的情况下,为用户提供一个Web平台去访问计算资源。不仅提高了用户仿真设计效率,而且提高了集群资源的利用率。论文选题来源于企业实际开发,主要完成以下内容。(1)对仿真一体化平台进行功能需求和非功能需求分析。本文通过研究仿真设计用户对集群资源使用以及集群资源管理员对集群资源管理的具体需求,结合某高校现有的高性能计算平台,分析了仿真设计一体化平台的功能需求以及非功能需求,同时通过用例图对用户的功能需求按功能模块进行建模。(2)对仿真一体化平台进行设计与实现。将系统的功能需求按模块划分,包括桌面管理、仿真设计、作业管理、用户数据管理、集群监控和审计管理模块,根据实际需求研究具体实现时所需的技术方案和系统的整体架构。由于是B/S架构的Web系统,采用Spring Boot框架快速构建系统,数据库使用Postgre SQL,针对高校对仿真设计软件的需求,系统内置了几种默认的仿真软件,也支持管理员通过平台动态配置,并为用户提供每一次仿真作业的相关数据存档、管理和共享功能。在作业调度和集群运行数据实时监控方面,由于LSF软件的全局资源共享、多个节点可以并行执行作业、支持多种操作系统、扩展集群能力强等优势,系统选用LSF软件作为集群的调度。为集群中每个节点安装LSF软件,配置集群主节点、从节点、集群管理员等相关信息,调用LSF相关命令将作业信息和集群监控数据返回展示在前端,方便管理员和运维人员查看和管理作业及节点。其次考虑到作业执行相关数据和集群监控数据比较多,作业数据和集群监控数据采用按月分表存储。然后给出系统功能模块图,分别对系统的每个模块通过类图和时序图进行详细设计与实现。(3)对仿真一体化平台进行测试。首先测试桌面管理、仿真设计、用户数据管理、作业管理、集群监控和审计管理模块的功能,其次测试了系统的性能、安全性、可靠性和可扩展性。根据测试结果,系统符合用户预期的需求。
面向HPC领域的知识图谱构建研究与应用
这是一篇关于知识图谱,高性能计算,关系抽取,图团体检测的论文, 主要内容为高性能计算(High Performance Computing,HPC)是国之重器,HPC相关技术是国家发展的战略性制高点技术和核心竞争力,涉及硬件、基础软件、应用软件等多个领域。作为执行复杂计算的基础,HPC通过数据计算推动数据科学和工业社会发展。然而,现有的HPC人才数量难以支撑迅猛增长的应用需求。同时,HPC强调实践性,要求很高的互动性,HPC学习者需要优质的学习途径和方法来完成学习活动,保证所学HPC知识与领域知识融会贯通,提高自身的HPC专业能力。再者,HPC横跨多个学科和领域,不但专业性强而且复杂度高,传统的题库学习方式成本高昂。因此需要一种高效、低成本的方式去梳理HPC知识的学习脉络,评价HPC实践活动的实际效果。本文通过“AI+教育”的方式去构建HPC学科类和领域类知识图谱,通过图谱对HPC领域中的实体、概念、属性以及对象间的关系进行建模,用智能化的方式将散列各处的HPC内容汇集到知识图谱中,为学员提供一种个性化的知识点式学习途径和学习效果评估方法。对于HPC知识图谱构建任务,仍存在三个挑战:1)针对HPC实体抽取任务,大量的实体概念隐藏在非结构化数据中,涉及数据标注的提取方式耗时费力,且HPC涉及的领域和学科较多,需要在短时间内提取各领域和学科的关键知识点;2)针对HPC关系抽取任务,因图谱是面向HPC教育平台所构建,所以知识点间的关系需要精准且有学习关联意义,本文要求快速抽取出实体间的多重内在语义联系;3)针对抽取出的知识数据,知识条目需与学科强相关,对于每个领域和课程的知识图谱构建,抽取出的实体对象和关系存在过溢、低权值、重要度不匹配的问题,图谱数据需要进一步优化。为解决上述挑战,本文的主要工作包括:1)提出一种针对特定领域下,融合迭代频率特征统计提取模型、语义特征提取模型的实体抽取框架。通过将基于“N-gram”的动态实体扩充策略与词向量语义特征相结合进行实体提取,利用这种联合语义特征的统计提取方法,能够快速地提取目标概念和部分关系信息;2)提出了一种多特征联合模板关系提取策略。设计共现频率提取方法,并将频率关系与近义关系结合作为粗粒度关系,然后通过基于Snowball的关系挖掘算法挖掘细粒度三元组关系,并与粗粒度关系整合后作为图谱关系基础,结合两者来共同反映HPC知识的关系特征;3)提出一种HPC知识图谱优化算法,包括HPC实体聚类设计、基于LDA的知识加权策略、基于图团体检测的知识裁剪策略。此外,本文设计了基于知识图谱的学科实践评估和学习资源推荐算法,实现个性化推荐和学习状态评估。最后,构建相关应用系统,将图谱数据进行java可视化控件移植。为了验证应用效果,采取人工抽样评估方式进行综合评测。
面向HPC领域的知识图谱构建研究与应用
这是一篇关于知识图谱,高性能计算,关系抽取,图团体检测的论文, 主要内容为高性能计算(High Performance Computing,HPC)是国之重器,HPC相关技术是国家发展的战略性制高点技术和核心竞争力,涉及硬件、基础软件、应用软件等多个领域。作为执行复杂计算的基础,HPC通过数据计算推动数据科学和工业社会发展。然而,现有的HPC人才数量难以支撑迅猛增长的应用需求。同时,HPC强调实践性,要求很高的互动性,HPC学习者需要优质的学习途径和方法来完成学习活动,保证所学HPC知识与领域知识融会贯通,提高自身的HPC专业能力。再者,HPC横跨多个学科和领域,不但专业性强而且复杂度高,传统的题库学习方式成本高昂。因此需要一种高效、低成本的方式去梳理HPC知识的学习脉络,评价HPC实践活动的实际效果。本文通过“AI+教育”的方式去构建HPC学科类和领域类知识图谱,通过图谱对HPC领域中的实体、概念、属性以及对象间的关系进行建模,用智能化的方式将散列各处的HPC内容汇集到知识图谱中,为学员提供一种个性化的知识点式学习途径和学习效果评估方法。对于HPC知识图谱构建任务,仍存在三个挑战:1)针对HPC实体抽取任务,大量的实体概念隐藏在非结构化数据中,涉及数据标注的提取方式耗时费力,且HPC涉及的领域和学科较多,需要在短时间内提取各领域和学科的关键知识点;2)针对HPC关系抽取任务,因图谱是面向HPC教育平台所构建,所以知识点间的关系需要精准且有学习关联意义,本文要求快速抽取出实体间的多重内在语义联系;3)针对抽取出的知识数据,知识条目需与学科强相关,对于每个领域和课程的知识图谱构建,抽取出的实体对象和关系存在过溢、低权值、重要度不匹配的问题,图谱数据需要进一步优化。为解决上述挑战,本文的主要工作包括:1)提出一种针对特定领域下,融合迭代频率特征统计提取模型、语义特征提取模型的实体抽取框架。通过将基于“N-gram”的动态实体扩充策略与词向量语义特征相结合进行实体提取,利用这种联合语义特征的统计提取方法,能够快速地提取目标概念和部分关系信息;2)提出了一种多特征联合模板关系提取策略。设计共现频率提取方法,并将频率关系与近义关系结合作为粗粒度关系,然后通过基于Snowball的关系挖掘算法挖掘细粒度三元组关系,并与粗粒度关系整合后作为图谱关系基础,结合两者来共同反映HPC知识的关系特征;3)提出一种HPC知识图谱优化算法,包括HPC实体聚类设计、基于LDA的知识加权策略、基于图团体检测的知识裁剪策略。此外,本文设计了基于知识图谱的学科实践评估和学习资源推荐算法,实现个性化推荐和学习状态评估。最后,构建相关应用系统,将图谱数据进行java可视化控件移植。为了验证应用效果,采取人工抽样评估方式进行综合评测。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:代码导航 ,原文地址:https://bishedaima.com/lunwen/54530.html