刘珍
- 作品数:7 被引量:37H指数:3
- 供职机构:广东药科大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种移动互联网流量类别标记方法和系统
- 本发明公开了一种移动互联网流量类别标记方法,涉及移动互联网流量测量领域的流量类别标记技术领域,该方法包括:S1、移动端与服务器端建立连接;S2、服务器端采集移动端的网络流量,移动端采集该网络流量对应的Socket信息,服...
- 刘珍王若愚陈伟杨鹏邓应荣
- 基于行为特征学习的互联网流量分类方法被引量:2
- 2016年
- 基于连接图的互联网流量分类方法能反映主机间的通信行为,具有较高的分类稳定性,但是经验式总结的启发式规则有限,难以获得高分类准确率。研究分析了主机间通信行为模式和BOF方法,从具有相同{目的IP地址,目的端口号,传输层协议}网络流量中,提取主机间连接相关的行为统计特征(HCBF),采用C4.5决策树算法学习基于行为特征的分类规则,其无需人工建立启发式规则。在传统互联网和移动互联网流量数据集上,从基本分类性能和分类稳定性方面,与现有的特征集进行比较分析,实验结果表明,HCBF特征集合的类间区分能力和稳定性较高。
- 刘珍王若愚
- 关键词:通信行为网络测量
- 决策树分类算法的可扩展性研究被引量:2
- 2009年
- 决策树是数据挖掘分类问题算法中一种性能较好的算法,本文主要研究自决策树在数据挖掘中应用以来存在问题,主要是可扩展性问题。综述了国内外针对此问题所提出的解决方法,以及分析了改进算法的优缺点,以便有利于对决策树关键问题,即扩展性问题的研究。同时本论文中所研究的算法的思想也有助于数据挖掘中其它领域解决大数据集问题。
- 刘利刘珍
- 关键词:决策树可扩展性
- 基于机器学习的IP流量分类研究被引量:21
- 2010年
- IP流量分类是Internet研究和流量工程的重要基础,近年来网络应用类别和Internet流数量在快速增长。流量分类技术不断面临新的挑战。对基于机器学习的IP流量分类方法进行了系统性研究。给出了这类流量分类方法的数学描述;通过深入研究有监督和无监督机器学习方法在流量分类中的应用,从数据预处理、模型构建和模型评估3个方面评述这类技术的研究现状,并指出存在的问题;总结得出现阶段基于机器学习的IP流量分类技术存在数据偏斜、标识瓶颈、属性变化和实时分类等4个方面的共性问题;最后展望了流量分类技术的未来发展方向并介绍了作者正在进行的工作。
- 刘琼刘珍黄敏
- 关键词:网络流网络测量
- 一种移动互联网流量类别标记方法和系统
- 本发明公开了一种移动互联网流量类别标记方法,涉及移动互联网流量测量领域的流量类别标记技术领域,该方法包括:S1、移动端与服务器端建立连接;S2、服务器端采集移动端的网络流量,移动端采集该网络流量对应的Socket信息,服...
- 刘珍王若愚陈伟杨鹏邓应荣
- 文献传递
- 互联网流量分类中流量特征研究被引量:10
- 2017年
- 为了系统性分析互联网流量特征,根据统计对象或统计角度研究流量特征的归类法,展开评述了每类流量特征;针对流量特征的稳定性问题,分析报文抽样、网络环境和模糊化技术对流量特征的影响;从分类能力、稳定性、时效性和分类粒度等方面评述流量特征的优缺点,为流量特征应用提供指导性建议;最后总结了流量特征的未来研究方向。
- 刘珍王若愚蔡先发唐德玉
- 关键词:网络测量
- 基于Bootstrapping的因特网流量分类方法被引量:3
- 2014年
- 针对因特网流量分类面临的流量类别标记瓶颈和类别样本数分布不平衡,提出基于Bootstrapping的流量分类方法,使用少量有标记样本训练初始分类器,迭代利用无标记样本扩展样本集并更新分类器.在构建扩展样本集过程中,将无标记样本在某后验概率分布下的正确分类行为视为一个概率事件,建立新的置信度计算方法,以减少扩展样本集中的噪声样本;基于概率近似正确学习理论建立启发式规则,注重选择小类样本加入扩展样本集,缓解类别样本数分布的不平衡.实验结果表明,与初始分类器相比,基于Bootstrapping的流量分类器总体分类准确率可提高9.46%;与现有半监督学习方法相比,小类分类准确率提高2.22%.
- 刘珍王若愚刘琼
- 关键词:半监督学习BOOTSTRAPPING