靳燕
- 作品数:16 被引量:19H指数:3
- 供职机构:山西大学商务学院信息学院更多>>
- 发文基金:山西省自然科学基金山西省高等学校科技开发基金山西省高等学校科技创新项目更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 多子域隔离学习组合决策用于不均衡样本被引量:2
- 2016年
- 为进一步弱化数据不均衡对分类算法的束缚,从数据集区域分布特性着手,提出了不均衡数据集上基于子域学习的复合分类模型。子域划分阶段,扩展支持向量数据描述(SVDD)算法给出类的最小界定域,划分出域内密集区与域外稀疏区。借鉴不同类存在相似样本的类重叠概念,对边界样本进行搜索,组合构成重叠域。子域清理阶段,基于邻近算法(KNN)的邻近性假设,结合不同域的密疏程度,设置样本有效性参数,对域内样本逐个检测以清理噪声。各子域隔离参与分类建模,按序组合产生出用于不均衡数据集的复合分类器CCRD。在相似算法对比以及代价敏感Meta Cost对比中,CCRD对正类的正确分类改善明显,且未加重负类误判;在SMOTE抽样比较中,CCRD改善了负类的误判情形,且未影响正类的正确分类;在五类数据集的逐个比较中,CCRD分类性能均有提升,在Haberman_sur的正类分类性能提升上尤为明显。结果表明,基于子域学习的复合分类模型的分类性能较好,是一种研究不均衡数据集的较有效的方法。
- 靳燕彭新光
- 关键词:支持向量数据描述
- 代价敏感异常分类算法研究
- 网络技术的不断发展、网络知识的不断普及,使得我们的生活发生了根本性的变革,社会生活的各个方面都受到了极大的影响,网络系统已成为现代生活中不可或缺的组成元素。但与此同时病毒、木马、黑客攻击、网上经济犯罪、垃圾电子邮件等各种...
- 靳燕
- 关键词:代价敏感学习异常检测网络安全入侵检测系统
- 文献传递
- 检测未知攻击的数据预处理算法研究被引量:1
- 2013年
- 本文提出数据预处理AnoG算法,对训练数据集进行稀疏拓展,产生出未知攻击实例,并冠以类标anomaly.过滤实验表明AnoG算法拓展出的未知攻击实例与原实例造成数据冲突的可能性非常小.将拓展出的训练实例作为训练数据集,采用RIPPER算法训练分类模型,实验结果表明分类模型对未知攻击具有良好的检测率,数据预处理AnoG算法的使用明显提高了分类模型对未知攻击的检测能力.
- 靳燕
- 关键词:入侵检测数据预处理
- 入侵检测与防火墙的联动平台研究
- 2012年
- 通过分析入侵检测系统和防火墙技术的各自优势,认为实现防火墙的数据过滤与入侵检测的实时监控间的有效互补是非常重要的。提出了网络安全事件的基本分类方法,定义出入侵检测系统提供给防火墙的信息格式,采用向入侵检测系统和防火墙中嵌入相关模块的方法,实现了入侵检测系统对攻击行为的自动响应,从而实现了防火墙与入侵检测系统间的协同工作。这样无论是来自内网还是外网的攻击,都可以被联动平台识别并自动响应。
- 靳燕
- 关键词:防火墙技术
- C4.5算法和BayesNet算法性能分析
- 2015年
- 入侵检测系统发展到现在,它作为一种主动的安全防护技术,提供了对内部攻击、外部攻击和误操作的实时保护,在网络系统受到危害之前拦截和响应入侵。随着网络通信技术安全性的要求越来越高,为其给电子商务等网络应用提供可靠服务,而由于入侵检测系统能够从网络安全的立体度纵深、多层次防御的角度出发提供安全服务,进一步受到了人们的高度重视。本文从入侵检测模型构建的视角,对比不同算法之间的数据差异,从而定义不同的实际操作下,如何提高模型运算速率的安全性。
- 陈佳楠靳燕
- 关键词:入侵检测模型构建C4.5算法
- 短序列频度模式分类异常检测被引量:2
- 2007年
- 正确识别短序列的局部行为性质,是提高系统调用跟踪异常检测精度的关键要素.通过分析特权程序和不同短序列的行为模式空间,认为实际采集的系统调用跟踪不仅包含了具有显著局部行为特征的正常和异常短序列,也包含了大量局部行为归属不明确的短序列.以短序列模式在系统调用跟踪中出现频度为基础,提出了未知短序列概念.根据短序列分别在正常和攻击时段具有聚类效应原理,专门设计了短序列关联算法.采用RIPPER学习算法归纳出简洁的频度模式分类规则集.实验结果表明,创建的频度模式分类异常检测方法明显地提高了对未知和已知攻击的检测能力.
- 彭新光靳燕
- 关键词:系统安全异常检测
- 入侵检测与防火墙的联动平台研究
- 2012年
- 分析了入侵检测系统与防火墙技术的各自优势,认为实现防火墙的数据过滤与入侵检测的实时监控间的有效互补是非常重要的。通过分析联动系统的理论知识,提出防火墙与入侵检测系统间的安全联动模型,实现两者之间的协同工作。这样无论是来自内网还是外网的攻击,都可以识别并自动响应。
- 靳燕
- 关键词:入侵检测技术防火墙技术
- 高泛化能力的权值控制误分类算法研究
- 研究了AdaCost算法,分析了该算法存在的缺点并做了改进。在每轮循环中增加一个过程,用来计算产生出的弱分类器的精确度,以避免AdaCost算法的盲目循环;引入实例权值的上下阈值,控制实例权值更新。两种方法有效结合产生出...
- 靳燕
- 文献传递
- 基于权值控制的误分类算法研究被引量:2
- 2010年
- 研究了误分类代价敏感提升算法AdaCost,认为在该算法的每轮循环中可以增加一个过程,用来计算产生出的弱分类器的精确度,从而避免AdaCost算法的盲目循环.同时引入实例权值的上下阈值,控制实例权值的更新过程.本文提出的权值控制误分类算法WCM isC是对AdaCost算法的优化.通过实验设计,验证了权值控制误分类算法WCM isC能有效提高AdaCost算法的分类精度,具有高泛化能力.
- 靳燕
- 折中规划分类性能的少数类误分代价优化设计被引量:4
- 2016年
- 针对代价敏感思想在类不平衡问题中的传统代价给定方式,提出了分类性能需求引导代价优化的因子量化方法。分类性能需求表示为相关于代价因子c的正负类分类性能指标函数式,为代价择优标准。应用遗传算法基于该标准在指定值域内寻优,得到最优代价因子,并将其代入代价敏感Boosting学习方法,产生基于给定分类性能的分类模型。折中分类性能的算法实现以正负类召回率的几何平均作为择优标准,选用了四类算法(基算法C4.5和Zero R)依次在三组样本集上进行分类建模。与传统代价给定方式代入算法相比,寻优过程确定的代价因子代入Ada Cost算法后,基于C4.5和Zero R的分类器在TP与TN上的变化幅度依次为33.3%~200%、-49%^-15.6%和-44.4%^-16.7%、25%~400%。前者改善了正类误判情形,且未造成负类误判严重化;后者改善了负类严重误判情形,且正类召回率保持在0.5以上,分类性能达到较为均衡的状态。
- 靳燕彭新光
- 关键词:代价敏感学习遗传算法