基于Text-GAN的加密流量识别关键技术研究
这是一篇关于Self-Attention,TEXT-GAN,LSTM,加密流量,用户行为识别,流量识别,数据集平衡的论文, 主要内容为随着手机的不断普及,越来越多的手机应用涌入市场。用户在使用应用的同时,会产生大量记录着用户操作信息的流量。通过分析用户产生的应用流量,可以得到用户的操作习惯、使用的应用类别等信息,故有巨大的挖掘价值。然而随着流量加密技术的发展,越来越多的公司对用户产生的流量进行了加密处理,为识别带来困难。传统的应用流量识别方法如:基于端口号和应用层协议标签的网络流量识别技术已无法使用在加密流量领域。越来越多的研究人员开始转向将机器学习、深度学习的技术应用在加密流量领域。这类方法可以很好的解决传统流量识别方法无法应用在加密流量上的问题,但相比传统方法实现简单的特点,使用机器学习或深度学习技术需要大量的数据做支持,以供模型学习到各类流量的特征。不仅如此,用于训练的流量数据需尽可能达到各类别间数据集平衡,以获得较好的训练效果。然而流量数据的抓取与标记是一件非常耗时的工作,同时由于不同应用的用户数量不同,随之生成的应用流量也有多有少,这就导致建立的数据集容易出现数据不平衡问题。据此,本文提出了基于生成对抗网络的流量识别系统。首先针对流量数据集类别不平衡问题,使用基于Self-Attention技术改进的TEXT-GAN,对流量数据进行数据扩充与平衡,然后结合长短期记忆网络LSTM对平衡后的流量数据进行识别。采用“ISCX VPN-non VPN traffic dataset”公开数据集进行模型的训练和验证,精准率可以达到0.9948,召回率可以达到0.9937,F1-score可以达到0.9937,与传统的MLP方法相比,本模型在三项评估指标上都有明显的提升。并进一步将该方法应用到人工抓取的电商APP产生的加密流量数据上,对流量中的用户行为进行识别。本文的主要创新如下:1、设计出基于Self-Attention技术改进的TEXT-GAN的流量生成方法,使用支持并行计算的Self-Attention机制替代原有生成网络中的无法并行计算的LSTM层,提高流量数据生成速度与生成质量。2、结合长短期记忆网络LSTM对平衡后的流量数据进行识别。相较于以往使用的神经网络如MLP,长短期记忆网络LSTM考虑了流量中的语序信息,在应用识别上可以达到0.9937的F1-score,更加适合在加密流量数据分类的场景下应用。3、将流量识别从对应用的识别拓展到对用户行为的识别,以体现整套系统的普适性。本文使用现网采集的实际用户APP行为流量数据进行识别和分析,并在精准率,召回率,F1-score上对识别结果进行评估。
密码应用安全态势感知平台研究与开发
这是一篇关于密码应用安全,国密规范,流量识别,态势感知,深度包检测技术的论文, 主要内容为随着网络信息化的高度发展,万物互联成为趋势,信息孤岛逐渐消弭,网络空间安全的重要性日益凸显,而保证网络空间安全的基础与关键技术就是密码技术。使用合规的密码、安全的密码,既是对公民个人合法权益的有力保障,也是对国家安全的有力保障。但从我国密码的应用情况来看,普遍存在使用密码的自觉性不够,密码应用不广泛、不规范及不正确等问题。因此,开展网络与信息系统中密码应用安全性评估工作具有十分重要的意义。针对以上问题,本文以《信息系统密码应用基本要求》为指导,设计并实现了集采集、分析、传输、存储与可视化为一体的密码应用安全态势感知平台。本平台通过对网络流量进行分析,判断网络中传输的数据是否被加密,使用的加密协议是否符合国家标准,协议中的密码参数是否合规,从而实现对网络与通信安全层面的密码应用的有效性、正确性与合规性的全面分析与评估。本平台由采集端和存储展示端两部分组成。采集端基于校园网完成网络流量数据的采集,通过数据包首部分析和分流处理,完成网络流量从数据包级别到数据流级别的转换。针对加密流量的识别,本文选择信息熵和蒙特卡洛π值作为衡量数据包负载随机性的标准,选用C4.5决策树算法构建分类模型。针对加密协议的识别,本文首先采用基于端口号的方法进行加密协议的快速识别,其次通过对SSL协议和IPSec协议的国际和国密标准进行深入分析和研究,采用基于DPI的方法对各加密协议的特征字进行提取和匹配,并从建立安全连接的过程中提取密码参数。本平台通过Apache Nifi完成采集端和存储展示端的数据流对接。平台存储展示端使用Logstash收集流量分析的结果,使用Elastic Search实现结果的存储与索引,并基于Vue、Echarts等技术结合ES实现交互式可视化展示。平台根据特定应用场景,通过设置密码参数字段值,定义检测策略,生成ES查询表达式对ES中存储的结果数据进行匹配,并给出检测结果,实现对网络中密码应用的合规性检测。最后,本文基于校园网络搭建了平台的测试环境,对平台进行功能测试与展示。测试结果表明,平台能够成功识别出加密流量及其使用的加密协议,在识别过程中能够提取所使用的密码参数以验证合规性,实现了预期的功能。
密码应用安全态势感知平台研究与开发
这是一篇关于密码应用安全,国密规范,流量识别,态势感知,深度包检测技术的论文, 主要内容为随着网络信息化的高度发展,万物互联成为趋势,信息孤岛逐渐消弭,网络空间安全的重要性日益凸显,而保证网络空间安全的基础与关键技术就是密码技术。使用合规的密码、安全的密码,既是对公民个人合法权益的有力保障,也是对国家安全的有力保障。但从我国密码的应用情况来看,普遍存在使用密码的自觉性不够,密码应用不广泛、不规范及不正确等问题。因此,开展网络与信息系统中密码应用安全性评估工作具有十分重要的意义。针对以上问题,本文以《信息系统密码应用基本要求》为指导,设计并实现了集采集、分析、传输、存储与可视化为一体的密码应用安全态势感知平台。本平台通过对网络流量进行分析,判断网络中传输的数据是否被加密,使用的加密协议是否符合国家标准,协议中的密码参数是否合规,从而实现对网络与通信安全层面的密码应用的有效性、正确性与合规性的全面分析与评估。本平台由采集端和存储展示端两部分组成。采集端基于校园网完成网络流量数据的采集,通过数据包首部分析和分流处理,完成网络流量从数据包级别到数据流级别的转换。针对加密流量的识别,本文选择信息熵和蒙特卡洛π值作为衡量数据包负载随机性的标准,选用C4.5决策树算法构建分类模型。针对加密协议的识别,本文首先采用基于端口号的方法进行加密协议的快速识别,其次通过对SSL协议和IPSec协议的国际和国密标准进行深入分析和研究,采用基于DPI的方法对各加密协议的特征字进行提取和匹配,并从建立安全连接的过程中提取密码参数。本平台通过Apache Nifi完成采集端和存储展示端的数据流对接。平台存储展示端使用Logstash收集流量分析的结果,使用Elastic Search实现结果的存储与索引,并基于Vue、Echarts等技术结合ES实现交互式可视化展示。平台根据特定应用场景,通过设置密码参数字段值,定义检测策略,生成ES查询表达式对ES中存储的结果数据进行匹配,并给出检测结果,实现对网络中密码应用的合规性检测。最后,本文基于校园网络搭建了平台的测试环境,对平台进行功能测试与展示。测试结果表明,平台能够成功识别出加密流量及其使用的加密协议,在识别过程中能够提取所使用的密码参数以验证合规性,实现了预期的功能。
基于Text-GAN的加密流量识别关键技术研究
这是一篇关于Self-Attention,TEXT-GAN,LSTM,加密流量,用户行为识别,流量识别,数据集平衡的论文, 主要内容为随着手机的不断普及,越来越多的手机应用涌入市场。用户在使用应用的同时,会产生大量记录着用户操作信息的流量。通过分析用户产生的应用流量,可以得到用户的操作习惯、使用的应用类别等信息,故有巨大的挖掘价值。然而随着流量加密技术的发展,越来越多的公司对用户产生的流量进行了加密处理,为识别带来困难。传统的应用流量识别方法如:基于端口号和应用层协议标签的网络流量识别技术已无法使用在加密流量领域。越来越多的研究人员开始转向将机器学习、深度学习的技术应用在加密流量领域。这类方法可以很好的解决传统流量识别方法无法应用在加密流量上的问题,但相比传统方法实现简单的特点,使用机器学习或深度学习技术需要大量的数据做支持,以供模型学习到各类流量的特征。不仅如此,用于训练的流量数据需尽可能达到各类别间数据集平衡,以获得较好的训练效果。然而流量数据的抓取与标记是一件非常耗时的工作,同时由于不同应用的用户数量不同,随之生成的应用流量也有多有少,这就导致建立的数据集容易出现数据不平衡问题。据此,本文提出了基于生成对抗网络的流量识别系统。首先针对流量数据集类别不平衡问题,使用基于Self-Attention技术改进的TEXT-GAN,对流量数据进行数据扩充与平衡,然后结合长短期记忆网络LSTM对平衡后的流量数据进行识别。采用“ISCX VPN-non VPN traffic dataset”公开数据集进行模型的训练和验证,精准率可以达到0.9948,召回率可以达到0.9937,F1-score可以达到0.9937,与传统的MLP方法相比,本模型在三项评估指标上都有明显的提升。并进一步将该方法应用到人工抓取的电商APP产生的加密流量数据上,对流量中的用户行为进行识别。本文的主要创新如下:1、设计出基于Self-Attention技术改进的TEXT-GAN的流量生成方法,使用支持并行计算的Self-Attention机制替代原有生成网络中的无法并行计算的LSTM层,提高流量数据生成速度与生成质量。2、结合长短期记忆网络LSTM对平衡后的流量数据进行识别。相较于以往使用的神经网络如MLP,长短期记忆网络LSTM考虑了流量中的语序信息,在应用识别上可以达到0.9937的F1-score,更加适合在加密流量数据分类的场景下应用。3、将流量识别从对应用的识别拓展到对用户行为的识别,以体现整套系统的普适性。本文使用现网采集的实际用户APP行为流量数据进行识别和分析,并在精准率,召回率,F1-score上对识别结果进行评估。
基于Text-GAN的加密流量识别关键技术研究
这是一篇关于Self-Attention,TEXT-GAN,LSTM,加密流量,用户行为识别,流量识别,数据集平衡的论文, 主要内容为随着手机的不断普及,越来越多的手机应用涌入市场。用户在使用应用的同时,会产生大量记录着用户操作信息的流量。通过分析用户产生的应用流量,可以得到用户的操作习惯、使用的应用类别等信息,故有巨大的挖掘价值。然而随着流量加密技术的发展,越来越多的公司对用户产生的流量进行了加密处理,为识别带来困难。传统的应用流量识别方法如:基于端口号和应用层协议标签的网络流量识别技术已无法使用在加密流量领域。越来越多的研究人员开始转向将机器学习、深度学习的技术应用在加密流量领域。这类方法可以很好的解决传统流量识别方法无法应用在加密流量上的问题,但相比传统方法实现简单的特点,使用机器学习或深度学习技术需要大量的数据做支持,以供模型学习到各类流量的特征。不仅如此,用于训练的流量数据需尽可能达到各类别间数据集平衡,以获得较好的训练效果。然而流量数据的抓取与标记是一件非常耗时的工作,同时由于不同应用的用户数量不同,随之生成的应用流量也有多有少,这就导致建立的数据集容易出现数据不平衡问题。据此,本文提出了基于生成对抗网络的流量识别系统。首先针对流量数据集类别不平衡问题,使用基于Self-Attention技术改进的TEXT-GAN,对流量数据进行数据扩充与平衡,然后结合长短期记忆网络LSTM对平衡后的流量数据进行识别。采用“ISCX VPN-non VPN traffic dataset”公开数据集进行模型的训练和验证,精准率可以达到0.9948,召回率可以达到0.9937,F1-score可以达到0.9937,与传统的MLP方法相比,本模型在三项评估指标上都有明显的提升。并进一步将该方法应用到人工抓取的电商APP产生的加密流量数据上,对流量中的用户行为进行识别。本文的主要创新如下:1、设计出基于Self-Attention技术改进的TEXT-GAN的流量生成方法,使用支持并行计算的Self-Attention机制替代原有生成网络中的无法并行计算的LSTM层,提高流量数据生成速度与生成质量。2、结合长短期记忆网络LSTM对平衡后的流量数据进行识别。相较于以往使用的神经网络如MLP,长短期记忆网络LSTM考虑了流量中的语序信息,在应用识别上可以达到0.9937的F1-score,更加适合在加密流量数据分类的场景下应用。3、将流量识别从对应用的识别拓展到对用户行为的识别,以体现整套系统的普适性。本文使用现网采集的实际用户APP行为流量数据进行识别和分析,并在精准率,召回率,F1-score上对识别结果进行评估。
基于Text-GAN的加密流量识别关键技术研究
这是一篇关于Self-Attention,TEXT-GAN,LSTM,加密流量,用户行为识别,流量识别,数据集平衡的论文, 主要内容为随着手机的不断普及,越来越多的手机应用涌入市场。用户在使用应用的同时,会产生大量记录着用户操作信息的流量。通过分析用户产生的应用流量,可以得到用户的操作习惯、使用的应用类别等信息,故有巨大的挖掘价值。然而随着流量加密技术的发展,越来越多的公司对用户产生的流量进行了加密处理,为识别带来困难。传统的应用流量识别方法如:基于端口号和应用层协议标签的网络流量识别技术已无法使用在加密流量领域。越来越多的研究人员开始转向将机器学习、深度学习的技术应用在加密流量领域。这类方法可以很好的解决传统流量识别方法无法应用在加密流量上的问题,但相比传统方法实现简单的特点,使用机器学习或深度学习技术需要大量的数据做支持,以供模型学习到各类流量的特征。不仅如此,用于训练的流量数据需尽可能达到各类别间数据集平衡,以获得较好的训练效果。然而流量数据的抓取与标记是一件非常耗时的工作,同时由于不同应用的用户数量不同,随之生成的应用流量也有多有少,这就导致建立的数据集容易出现数据不平衡问题。据此,本文提出了基于生成对抗网络的流量识别系统。首先针对流量数据集类别不平衡问题,使用基于Self-Attention技术改进的TEXT-GAN,对流量数据进行数据扩充与平衡,然后结合长短期记忆网络LSTM对平衡后的流量数据进行识别。采用“ISCX VPN-non VPN traffic dataset”公开数据集进行模型的训练和验证,精准率可以达到0.9948,召回率可以达到0.9937,F1-score可以达到0.9937,与传统的MLP方法相比,本模型在三项评估指标上都有明显的提升。并进一步将该方法应用到人工抓取的电商APP产生的加密流量数据上,对流量中的用户行为进行识别。本文的主要创新如下:1、设计出基于Self-Attention技术改进的TEXT-GAN的流量生成方法,使用支持并行计算的Self-Attention机制替代原有生成网络中的无法并行计算的LSTM层,提高流量数据生成速度与生成质量。2、结合长短期记忆网络LSTM对平衡后的流量数据进行识别。相较于以往使用的神经网络如MLP,长短期记忆网络LSTM考虑了流量中的语序信息,在应用识别上可以达到0.9937的F1-score,更加适合在加密流量数据分类的场景下应用。3、将流量识别从对应用的识别拓展到对用户行为的识别,以体现整套系统的普适性。本文使用现网采集的实际用户APP行为流量数据进行识别和分析,并在精准率,召回率,F1-score上对识别结果进行评估。
本文内容包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主题。发布者:源码码头 ,原文地址:https://bishedaima.com/lunwen/52785.html