基于产出序列时空特征的图神经网络煤层气产量预测研究
这是一篇关于煤层气,数据挖掘,图数据,产出预测,图神经网络的论文, 主要内容为煤层气井开采过程中,井与井之间具有一定空间关系,开采的产能序列之间不仅受到地质环境和工程技术的影响,也会受到井间干扰等空间因素的影响。因此,综合井间关系特征信息,利用煤层气井周围相关井的时间序列数据,进行多时序预测研究则具有了重要意义。本文主要研究内容和成果如下:(1)本文首先简述了当前煤层气产量预测的研究进展以及煤层气特征参数信息的挖掘分析方法,总结了当前煤层气数据分析方法的特点,阐述了图神经网络方法的在煤层气产量预测中的优势。通过现状分析说明了本论文研究的可行性和必要性。(2)在前人研究成果的基础上,通过综合分析煤层气产量特征,共选取了17个地质参数和工程参数作为煤层气产量动态影响参数。采用主成分分析对上述参数进行了降维处理,得到五个主成分参数,使用K-means方法对新的主成分进行聚类分析,获取了具有相似成分的煤层气井簇。另外,将一定范围(不大于300米)内的煤层气井进行连接,构建井间关系图,该图直观的展示了井与井的关系,并为后续研究提供了图数据基础。(3)基于井间关系图和井日产气量数据,建立邻接矩阵和特征矩阵,调整模型网络参数,预测未来产量。其中模型预测分析主要从三个方面展开:一是GCN(Graph Convolutional Network)与TGCN(Temporal Graph Convolutional Network)对比分析,结果显示融入GRU的TGCN模型能充分挖掘出时间序列隐含信息,预测准确率更高。二是时间序列预测的时间步长选取,结果表明时间步长为14天的预测结果相比于步长为30天的预测结果在针对极端数据方面更加准确。三是井间关系图的构建方式分析,研究显示井间关系图构建与该图转化为邻接矩阵的方式对TGCN模型训练预测结果影响较大。另外研究发现不考虑距离因素将相似类簇中所有煤层气井全部连接关系图,作为TGCN模型的输入矩阵并不适用。综合对比验证了TGCN模型适合进行煤层气井时间序列产量预测研究,同时预测结果具有较高的准确度。(4)基于Node.js、Vue.js等开发框架,实现了煤层气时空特征产出序列研究系统。该系统集煤层气数据管理与可视化展示、GIS空间分析与构图分析、煤层气产出预测功能于一体,可对较为复杂的煤层气数据和地质参数进行特征分析研究,同时可基于时间序列进行产出预测。为煤层气数据和GIS数据实现在线流程化分析,提供了一条高效便捷的途径。
基于神经网络的图表示学习方法研究
这是一篇关于图数据,图卷积网络,零样本学习,推荐系统,知识图谱的论文, 主要内容为随着互联网设备和移动终端的普及,大数据时代已经深刻地改变了人们的生活方式,人们利用互联网便捷地进行教育、医疗、购物、娱乐等活动,与之相伴而生的是海量的数据。其中,图数据广泛存在于各个场景中,例如,金融网络、社交网络、医学图谱等,它们往往具有规模庞大、结构复杂、信息多元等特点,造成对其分析的过程中,无论是算法性能还是时间成本都不尽人意,严重影响着相关任务的整体表现。为有效且高效地处理图数据以克服上述挑战,并且将其应用到不同场景下支撑不同的下游任务,提高图数据地可用性,本文主要完成的工作如下:(1)针对图数据所具有的高维、稀疏等特性,提出一种基于扩散机制的图表示学习方法。该方法受到扩散现象的启发,利用扩散系统描述图上的信息流动,以更好地建模图上的全局、局部特性。为建立图的特征属性与结构属性的关联,提出了一种启发式的图结构自精细化算法,使节点表征结果反馈到图结构上。此外,引入了度惩罚以确保节点表征可以在表征空间保持真实图的无标度特性。大量对比实验、可视化实验分析充分验证了所提出模型的有效性;(2)针对零样本学习中类别模板分布不规则,及类别-属性矩阵所描述的具有节点异构二部图的图表示学习问题,提出了一个两阶段网络――DAGDA(Discriminative Anchor Generation and Distribution Alignment Model)。在第一阶段,该网络扩展了谱域图卷积网络,在同质化异构图上进行节点信息聚合,以输出强判别力的类别表征。在第二阶段,提出了自编码器架构下的投影网络,以实现零样本条件下的分类。与此同时,为第二阶段网络施加了关系正则约束,从更细的粒度上对齐了样本在属性空间和表征空间的分布。为评估模型性能,本文进行了大量对比、消融实验,结果表明DAGDA可以在多个数据集上媲美当前最好算法;(3)针对推荐系统中常面临的稀疏、冷启动问题,通过引入知识图谱作为辅助信息,提出知识兴趣网络――KIN(Knowledge Interest Network)。该网络在一个框架下,端到端地学习知识图谱中的实体表征和推荐系统中的预测任务。为学习实体表征,本文构建了一种空域图卷积网络,以提高图卷积操作在大规模图数据上的效率。此外,为实现更好地图卷积效果,提出一种基于实体翻译的注意力机制,用以在用户和物品两端进行高效的信息聚合。模型在标准数据集上的评估结果显著优于近期推荐算法,从而验证了其有效性。
基于产出序列时空特征的图神经网络煤层气产量预测研究
这是一篇关于煤层气,数据挖掘,图数据,产出预测,图神经网络的论文, 主要内容为煤层气井开采过程中,井与井之间具有一定空间关系,开采的产能序列之间不仅受到地质环境和工程技术的影响,也会受到井间干扰等空间因素的影响。因此,综合井间关系特征信息,利用煤层气井周围相关井的时间序列数据,进行多时序预测研究则具有了重要意义。本文主要研究内容和成果如下:(1)本文首先简述了当前煤层气产量预测的研究进展以及煤层气特征参数信息的挖掘分析方法,总结了当前煤层气数据分析方法的特点,阐述了图神经网络方法的在煤层气产量预测中的优势。通过现状分析说明了本论文研究的可行性和必要性。(2)在前人研究成果的基础上,通过综合分析煤层气产量特征,共选取了17个地质参数和工程参数作为煤层气产量动态影响参数。采用主成分分析对上述参数进行了降维处理,得到五个主成分参数,使用K-means方法对新的主成分进行聚类分析,获取了具有相似成分的煤层气井簇。另外,将一定范围(不大于300米)内的煤层气井进行连接,构建井间关系图,该图直观的展示了井与井的关系,并为后续研究提供了图数据基础。(3)基于井间关系图和井日产气量数据,建立邻接矩阵和特征矩阵,调整模型网络参数,预测未来产量。其中模型预测分析主要从三个方面展开:一是GCN(Graph Convolutional Network)与TGCN(Temporal Graph Convolutional Network)对比分析,结果显示融入GRU的TGCN模型能充分挖掘出时间序列隐含信息,预测准确率更高。二是时间序列预测的时间步长选取,结果表明时间步长为14天的预测结果相比于步长为30天的预测结果在针对极端数据方面更加准确。三是井间关系图的构建方式分析,研究显示井间关系图构建与该图转化为邻接矩阵的方式对TGCN模型训练预测结果影响较大。另外研究发现不考虑距离因素将相似类簇中所有煤层气井全部连接关系图,作为TGCN模型的输入矩阵并不适用。综合对比验证了TGCN模型适合进行煤层气井时间序列产量预测研究,同时预测结果具有较高的准确度。(4)基于Node.js、Vue.js等开发框架,实现了煤层气时空特征产出序列研究系统。该系统集煤层气数据管理与可视化展示、GIS空间分析与构图分析、煤层气产出预测功能于一体,可对较为复杂的煤层气数据和地质参数进行特征分析研究,同时可基于时间序列进行产出预测。为煤层气数据和GIS数据实现在线流程化分析,提供了一条高效便捷的途径。
基于图卷积神经网络的协同过滤推荐模型研究
这是一篇关于图数据,图卷积网络,推荐系统,协同过滤,自监督学习的论文, 主要内容为随着大数据时代的蓬勃发展,“信息过载”是影响用户在互联网中快速有效地获得对自己有价值信息的关键因素。推荐系统的存在成为解决这一问题的有效途径之一,已成为当前学术界和商业界的研究热点并且成功应用在多个领域。但随着数据规模和大数据多样性需求的与日俱增,传统的协同过滤推荐模型性能表现欠佳,为了更细粒度的获取用户和项目的特征,引入了深度学习技术。与此同时,深度学习技术在各领域的成功应用如图像、文本、视频等,给图卷积神经网络(Graph Convolutional Neural,GCN)在诸多方面都获得了许多研究成果并提供了理论和实践支撑。推荐技术任务可以看作一种图上的链路预测问题。相较于传统的推荐算法,图卷积网络具有更强大的数据表征能力,可以更好地挖掘图结构数据中的隐式表征,从而有效提升推荐任务的精准性。推荐系统的核心目标是推测用户偏好从而主动为用户提供有价值有针对性的消息,协同过滤是推荐模型中经典且广泛应用的一种方法。但基于GCN的推荐方法仍存在以下问题:(1)GCN递归地聚合来自不同顺序邻域的消息,却难以区分来自不同节点的混合消息,使提取关键信息和剔除无用信息变得困难;(2)高度节点对表示学习有更大的影响,随着邻域聚合方案进一步扩大了观察边的影响;(3)容易受到噪声交互的影响以及过平滑等问题。这些局限性对推荐模型产生了很大的约束。根据上述阐述,本文基于图卷积网络协同过滤推荐算法,通过对节点邻域分层聚合和自监督学习辅助任务加强节点表征学习对图卷积网络进行改进和优化。本文提出一种基于改进图卷积网络的简易协同过滤推荐模型。与目前基于GCN的方法不同,本文首先使用简单GCN模型通过将消息从不同顺序的邻域中分离出来,分别汇总来自不同阶邻域的邻域消息,然后以分层方式将它们聚合用于协同过滤,抛弃GCN的非线性激活且无需引入其他模型参数。其次,还探索了在用户-项图上的自监督学习,该思想是用一个辅助的自监督任务来补充学习经典的推荐监督任务,然后将Dropout思想迁移至模型中,设计了三个数据增强算子:节点退出(Node Dropout)、边退出(Edge Dropout)和随机游走(Randow Walk)来生成节点子视图,以加强节点表征学习。除此之外还可以减轻过平滑的影响,同时也很好地防止了过拟合并提升了模型性能。最后通过对模型的分析和在三个不同的推荐算法数据集中进行实验,分析证明了本文所提模型的有效性,对推荐精度以及对交互噪声的鲁棒性都有所提高。
基于神经网络的图表示学习方法研究
这是一篇关于图数据,图卷积网络,零样本学习,推荐系统,知识图谱的论文, 主要内容为随着互联网设备和移动终端的普及,大数据时代已经深刻地改变了人们的生活方式,人们利用互联网便捷地进行教育、医疗、购物、娱乐等活动,与之相伴而生的是海量的数据。其中,图数据广泛存在于各个场景中,例如,金融网络、社交网络、医学图谱等,它们往往具有规模庞大、结构复杂、信息多元等特点,造成对其分析的过程中,无论是算法性能还是时间成本都不尽人意,严重影响着相关任务的整体表现。为有效且高效地处理图数据以克服上述挑战,并且将其应用到不同场景下支撑不同的下游任务,提高图数据地可用性,本文主要完成的工作如下:(1)针对图数据所具有的高维、稀疏等特性,提出一种基于扩散机制的图表示学习方法。该方法受到扩散现象的启发,利用扩散系统描述图上的信息流动,以更好地建模图上的全局、局部特性。为建立图的特征属性与结构属性的关联,提出了一种启发式的图结构自精细化算法,使节点表征结果反馈到图结构上。此外,引入了度惩罚以确保节点表征可以在表征空间保持真实图的无标度特性。大量对比实验、可视化实验分析充分验证了所提出模型的有效性;(2)针对零样本学习中类别模板分布不规则,及类别-属性矩阵所描述的具有节点异构二部图的图表示学习问题,提出了一个两阶段网络――DAGDA(Discriminative Anchor Generation and Distribution Alignment Model)。在第一阶段,该网络扩展了谱域图卷积网络,在同质化异构图上进行节点信息聚合,以输出强判别力的类别表征。在第二阶段,提出了自编码器架构下的投影网络,以实现零样本条件下的分类。与此同时,为第二阶段网络施加了关系正则约束,从更细的粒度上对齐了样本在属性空间和表征空间的分布。为评估模型性能,本文进行了大量对比、消融实验,结果表明DAGDA可以在多个数据集上媲美当前最好算法;(3)针对推荐系统中常面临的稀疏、冷启动问题,通过引入知识图谱作为辅助信息,提出知识兴趣网络――KIN(Knowledge Interest Network)。该网络在一个框架下,端到端地学习知识图谱中的实体表征和推荐系统中的预测任务。为学习实体表征,本文构建了一种空域图卷积网络,以提高图卷积操作在大规模图数据上的效率。此外,为实现更好地图卷积效果,提出一种基于实体翻译的注意力机制,用以在用户和物品两端进行高效的信息聚合。模型在标准数据集上的评估结果显著优于近期推荐算法,从而验证了其有效性。
基于自举法的图上随机游走采样算法研究
这是一篇关于随机游走,自举法,图数据,统计估计的论文, 主要内容为属性图可以承载丰富的信息,在社交网络、推荐系统、电子商务等领域应用广泛。对于这类网络平台中产生的大量半结构化数据,使用属性图进行建模分析是最理想的方式。同时,由于网络平台上的图数据规模庞大,常使用随机游走采样对这类图数据进行统计估计。受到“均方误差可以分解成估计值的偏差与方差之和”的启发,开发了一种算法框架以减小图上随机游走采样估计的均方误差。该算法框架可以将各种随机游走采样算法作为基础,对其采样得到的样本序列应用自举法,减少其估计误差。该自举法针对随机游走采样算法进行了特殊设计,即只使用少量有效子样本,解决了随机游走样本中含有无效子样本的问题。不同于以往大多数减少偏差的自举法,该自举法在减小偏差时,允许方差同步增大。为了避免方差增大导致均方误差增大,算法框架中使用多个并行随机游走减小方差,理论上,通过部署足够数量的随机游走,方差可以被减少到任意小。通过严谨的证明,为该算法提供了去偏效果的理论保证,并给出了计算复杂度。此外,该算法框架可以与最新的大规模图分析系统结合,具有较好的可扩展性。该算法框架可以根据用户需求选择并行随机游走的数量和长度,在样本复杂度和均方误差之间做出权衡。为了测试该算法框架的通用性,将其应用于优化Metropolis随机游走采样和简单随机游走采样。在四个公开数据集上的大量对比实验表明,运行不超过1000条随机游走时,该算法框架能有效降低这两种随机游走采样估计的均方误差。此外,通过统计该算法框架的运行时间,验证了它几乎不会增加基础采样算法的计算负担,具有较高的效率。
基于自举法的图上随机游走采样算法研究
这是一篇关于随机游走,自举法,图数据,统计估计的论文, 主要内容为属性图可以承载丰富的信息,在社交网络、推荐系统、电子商务等领域应用广泛。对于这类网络平台中产生的大量半结构化数据,使用属性图进行建模分析是最理想的方式。同时,由于网络平台上的图数据规模庞大,常使用随机游走采样对这类图数据进行统计估计。受到“均方误差可以分解成估计值的偏差与方差之和”的启发,开发了一种算法框架以减小图上随机游走采样估计的均方误差。该算法框架可以将各种随机游走采样算法作为基础,对其采样得到的样本序列应用自举法,减少其估计误差。该自举法针对随机游走采样算法进行了特殊设计,即只使用少量有效子样本,解决了随机游走样本中含有无效子样本的问题。不同于以往大多数减少偏差的自举法,该自举法在减小偏差时,允许方差同步增大。为了避免方差增大导致均方误差增大,算法框架中使用多个并行随机游走减小方差,理论上,通过部署足够数量的随机游走,方差可以被减少到任意小。通过严谨的证明,为该算法提供了去偏效果的理论保证,并给出了计算复杂度。此外,该算法框架可以与最新的大规模图分析系统结合,具有较好的可扩展性。该算法框架可以根据用户需求选择并行随机游走的数量和长度,在样本复杂度和均方误差之间做出权衡。为了测试该算法框架的通用性,将其应用于优化Metropolis随机游走采样和简单随机游走采样。在四个公开数据集上的大量对比实验表明,运行不超过1000条随机游走时,该算法框架能有效降低这两种随机游走采样估计的均方误差。此外,通过统计该算法框架的运行时间,验证了它几乎不会增加基础采样算法的计算负担,具有较高的效率。
基于自举法的图上随机游走采样算法研究
这是一篇关于随机游走,自举法,图数据,统计估计的论文, 主要内容为属性图可以承载丰富的信息,在社交网络、推荐系统、电子商务等领域应用广泛。对于这类网络平台中产生的大量半结构化数据,使用属性图进行建模分析是最理想的方式。同时,由于网络平台上的图数据规模庞大,常使用随机游走采样对这类图数据进行统计估计。受到“均方误差可以分解成估计值的偏差与方差之和”的启发,开发了一种算法框架以减小图上随机游走采样估计的均方误差。该算法框架可以将各种随机游走采样算法作为基础,对其采样得到的样本序列应用自举法,减少其估计误差。该自举法针对随机游走采样算法进行了特殊设计,即只使用少量有效子样本,解决了随机游走样本中含有无效子样本的问题。不同于以往大多数减少偏差的自举法,该自举法在减小偏差时,允许方差同步增大。为了避免方差增大导致均方误差增大,算法框架中使用多个并行随机游走减小方差,理论上,通过部署足够数量的随机游走,方差可以被减少到任意小。通过严谨的证明,为该算法提供了去偏效果的理论保证,并给出了计算复杂度。此外,该算法框架可以与最新的大规模图分析系统结合,具有较好的可扩展性。该算法框架可以根据用户需求选择并行随机游走的数量和长度,在样本复杂度和均方误差之间做出权衡。为了测试该算法框架的通用性,将其应用于优化Metropolis随机游走采样和简单随机游走采样。在四个公开数据集上的大量对比实验表明,运行不超过1000条随机游走时,该算法框架能有效降低这两种随机游走采样估计的均方误差。此外,通过统计该算法框架的运行时间,验证了它几乎不会增加基础采样算法的计算负担,具有较高的效率。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码客栈网 ,原文地址:https://bishedaima.com/lunwen/52620.html