当前位置:大学毕业论文> 专科论文>材料浏览

关于子空间论文范文写作 基于子空间聚类网络流量分类方法相关论文写作资料

主题:子空间论文写作 时间:2024-03-25

基于子空间聚类网络流量分类方法,本论文主要论述了子空间论文范文相关的参考文献,对您的论文写作有参考作用。

子空间论文参考文献:

子空间论文参考文献 聚类分析论文医药类期刊国家级教育类期刊交通类期刊

摘 要:应用层网络流量分类技术对流量控制和管理等研究具有重要意义,针对传统的基于有监督机器学习的分类方法对所有应用程序使用相同的特征,使得某些特征对一种或几种应用类型有区分性,而对其他应用类型的网络流分类产生干扰等问题,提出基于子空间聚类方法的网络流分类框架.利用子空间聚类算法,在总特征集中为每一种类型应用进行特征选择,提取和之相对应的关键特征,自动消除不相关的特征,使得每种应用类型都产生对应的特征签名集,并用这些不同的特征签名对未知的网络流进行分类.实验结果表明:本文提出的方法能够有效地提出每种应用类型的特征签名,并且所提出的特征签名具有明显的可区分性,该方法的分类准确率在93%以上,并且能很好的识别新出现的应用,

关键词:子空间聚类;网络流分类;特征签名

DOI: 10.15938/j.jhust.2015.02.012

中图分类号:TM391.1

文献标志码:A

文章编号:1007-2683(2015)02-0063-06

0 引 言

近年来,具有开放性、共享性等特点的互联网迅速普及并发展壮大,随着网络用户数量的飞速增多,传统的互联网业务已经无法满足人们的需求,越来越多的新型网络应用应运而生.对于网络运营商来说,为了有效利用带宽,并提供更好的服务质量(quality of service,QoS),需要网络能够针对不同应用进行分类.另一方面,互联网的开放性特点允许任何符合其技术标准的设备或软件接人互联网,导致了各种网络恶意攻击事件层出不穷,严重危害网络信息安全和服务,保护网络安全迫在眉睫.网络流量分类技术能够增强网络可控性,帮助研究人员掌握网络上的流量分布情况,帮助网络运营商优化服务质量,预防并阻止各种网络犯罪行为.总而言之,构建网络智能,网络流分类是第一步.

在流量分类研究中,目前广泛采用5元组{源IP、源端口、目的IP、目的端口、传输层协议}(SourceIP,Source PORT,Destination IP,Destination PORT,Protocol)定义数据流,迄今为止,网络流量分类方法主要包括基于端口号匹配的分类方法、基于应用层载荷特征的分类方法、基于主机行为和交互行为的分类方法,以及基于机器学习的分类方法.用于分类的特征主要有端口特征、载荷特征、网络流包级和流级统计特征、主机行为和交互行为特征(根据IP地址、端口等衍生出来的关联特征).

其中,传统的基于有监督机器学习的分类方法,主要是利用网络流在网络层和传输层的统计特征来识别流量.这种方法使用的特征和训练得到的分类器对所有应用类型的流都是相同的,没有差异和针对性.某些特征对一种或几种应用类型有区分性,而对其他应用类型的流分类产生干扰,导致整体的分类准确率不高.而且,其对于网络数据中新出现协议的识别效果不能令人满意.

针对以上问题,依据样本在不同的数据簇中常常和某些特定的数据特征子集相对应的思想,本文提出了一种新的网络流分类方法:基于子空间聚类的网络流分类方法(subspace clustering-basedmethod,SCM).它针对每一种应用流独立建立识别模型,然后将这些识别单一应用的模型合在一起,实现多类别分类,而不是同时区分几种应用.换句话说,SCM方法学习独立的识别类A和识别类B,而不是试着同时区分类A和类B.本文使用骨干网络数据集和边界网络数据集对SCM分类方法进行测试,识别精度达到93%,而且对新应用的识别率可以达到90%.由于路由非对称原因导致骨干网中双向流中的某一个方向的流经常丢失,本文中的分类方法使用单向流.

1 子空间聚类算法及网络流分类框架

1.1 子空间聚类算法

子空间聚类问题描述:

设B等于B1×B2×等×Bn,代表一个n维数据空间,其中,n为正整数.F是包含m个位于n维特征空间的数据对象的集合,记为F等于 {Xi|i∈[1,m],xij等于Xi.Bj},其中,点Xi等于(xi1,xi2,等,xij,等,xin.),Xi的第j个属性值xij,为其在哆维上的取值.设k维子空间S^CB其中,k≤n.在SK子空间中的元组集合表示为

在训练期间,SCM分类框架为每种应用类型产生一组签名.产生签名的过程如下:

1)输入:属于同种应用类型的一组流的集合F,每个流feF用n维数值向量表示.

2)输出:流的子集合和特征子空间的对应关系(Fi,Si)即签名,其中F:∈F,S,CB.每一种应用类型可能包含多个签名iE[1,|F|].

本文使用文提出的基于K最相似聚类的子空间聚类算法,在得到所有一维空间聚类的基础上,查找包含相同数据对象的相似聚类,继而决定子空间搜索方向,然后合并不同维度中的相似聚类,最终得到子空间聚类.该方法用不同子空间中采用的不同密度阈值替代传统算法中的全局密度阈值,提高了子空间聚类算法聚类结果的精度.

该算法的相关定义如下:

定义1(基本聚类) 将使用DBSCAN方法产生的所有一维空间的聚类的集合称为基本聚类,记为C".

定义2(基本聚类相似度) 给定c.,c:∈C1,其中,c,在Bi维,c:在B,维,且i≠j,其相似度定义为基本聚类c,,C2所包含的相同数据对象元素的数目,记为.sim( ci,C2)等于|C1∩C2|.

定义3(最相似聚类) 给定聚类c∈Cl,c的最相似聚类MSC(C)∈C1满足条件:

定义4(k最相似聚类)给定聚类C∈Cl和正整

该算法的基本步骤如下:

1)对数据做预处理,产生每一维上的基本聚类;

2)计算所有基本聚类之间的相似度;

3)查找每个基本聚类的κ个最相似聚类,当作该基本聚类的合并候选;

结论:适合不知如何写子空间方面的相关专业大学硕士和本科毕业论文以及关于线性代数子空间的定义论文开题报告范文和相关职称论文写作参考文献资料下载。

基于人工神经网络的聚类算法
摘要:研究连续型Hopfield神经网络的电路机理,推导出网络的权值计算公式,并运用连续型的神经网络模型构造出聚类算法;对20个随机生成数据计算。

基于服装网民用户网络行为方式聚类分析
[摘 要]聚类分析是服装网络调查研究问卷分析的重要组成部分,主要是运用 SPSS 17 0对服装网民用户网络购买心理和支付行为方式量表进行分析,。

群决策中基于判断相似度专家聚类群体意见集结方法
摘要:针对大规模群决策问题,提出了一种基于专家意见相似度的群体判断信息逐步集结规划的方法。首先利用备选方案序关系向量的灰色关联度和夹角余弦构造两。

基于聚类分析农村居民消费结构实证
本文依据我国2014年各地區农村居民人均消费数据,运用多元统计分析中的聚类分析的方法,对2814年我国31个地区农村居民入均消费情况进行实证分析。

论文大全