杨秋洁
- 作品数:5 被引量:8H指数:2
- 供职机构:中国银行更多>>
- 发文基金:安徽省自然科学基金国家自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于Ⅳ属性选择的随机森林模型研究
- 随着信息技术的迅速发展,众多应用领域如银行金融业、电子商务、生物信息、网络安全等产生了爆炸式的信息。不仅在数据规模上具有高维、海量的特征,在信息内容上还具有冗余多、噪音多的特点。这样的数据给挖掘技术带来了巨大的挑战,尤其...
- 杨秋洁
- 关键词:数据挖掘时空性能
- 文献传递
- 基于IV属性选择的随机森林模型研究
- 随着信息技术的迅速发展,众多应用领域如银行金融业、电子商务、生物信息、网络安全等产生了爆炸式的信息。不仅在数据规模上具有高维、海量的特征,在信息内容上还具有冗余多、噪音多的特点。这样的数据给挖掘技术带来了巨大的挑战,尤其...
- 杨秋洁
- 关键词:数据挖掘
- 文献传递
- 一种属性选择方法FS-IV的研究被引量:1
- 2010年
- 数据挖掘所面对的数据常具有属性冗余、包含噪音等特点,使得更注重训练数据质量的分类模型训练周期变长、精度下降。因此,如何选择有效的属性集以约减数据规模,提高分类模型性能具有重要意义。文章将IV模型用于属性选择,提出了基于IV指标的属性选择算法FS-IV,该算法仅需一遍扫描计算出所需的相关统计量,解决了传统属性选择方法处理较大规模数据时空效率不高的问题。实验表明,FS-IV属性选择方法时空性能良好,对冗余、噪音属性均有较好的区分能力,能够有效地约减数据规模。
- 杨秋洁胡学钢
- 基于One-R的改进随机森林入侵检测模型研究被引量:5
- 2015年
- 入侵检测(ID)是保障网络安全的必要手段之一,将数据挖掘引入入侵检测中使其可以适应海量审计数据的处理,同时可以提高检测的均衡性和响应时间。文章提出了一种基于随机森林(random forest,RF)的入侵检测模型(1R-RF),针对RF模型面对高维网络审计数据选择属性时过度随机导致的元分类器效率不高的问题,开展了基于One-R快速属性评价的研究。实验证明,将基于One-R的RF用于入侵检测后有较好的时空性能、较低的误报率和漏报率,对于各种攻击行为有着较为均衡的检测率。
- 王翔胡学钢杨秋洁
- 关键词:入侵检测
- 一种适用于数据流分类的特征选择方法
- 2011年
- 数据流环境下的高维、属性冗余、含噪音等问题是经常且可能同时存在的,在一定程度上影响了数据流的分类效果.为改善这一现状,提出一种快速、有效的数据流特征选择方法.引入统计指标IV(information value)值作为特征重要度的评价标准,在此基础上依据经验阈值来进行特征选择,从而解决了传统特征选择方法时空效率不高、区分度不明显、难以应用数据流的问题.实验结果表明:FS-IV具有较小的时间开销和较好的抗噪性能,该方法与已有的数据流分类模型相结合,在保证分类精度可比的情况下,能显著提高时空性能.
- 张玉红胡学钢杨秋洁
- 关键词:数据流分类