闫付亮
- 作品数:4 被引量:2H指数:1
- 供职机构:河南工业大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种改进的基于混沌理论的木马检测器生成算法
- 2012年
- 在分析现有应用于入侵检测系统中的检测器生成算法的基础上,提出了一种基于混沌理论的木马检测器生成算法,通过混沌的初值敏感性实现了广泛的搜索空间.结合加权欧式距离,并利用混沌的遍历特性产生了均匀的检测器集合.采用Microsoft visual 2008和Matlab进行仿真实验,结果表明,改进的算法能有效保持抗体的多样性,并具有较快的收敛速度.
- 秦杰司群颜会娟闫付亮
- 关键词:混沌木马检测器
- 基于链接信息的网页分类算法被引量:1
- 2012年
- 为了提高网页文本分类的准确性.克服传统的文本分类算法易受网页中虚假、错误信息的影响.提出一种基于链接信息的网页分类算法.通过对K近邻方法的改进.利用当前网页与其父网页的链接信息对网页实沲分类,用空间向量表示待分类网页的父链接信息。在训练集合中找到K篇与该网页链接信息向量最相似的网页,计算该网页所属的类别,通过实验与传统文本分类算法进行了对比,验证了该方法的有效性.
- 秦杰闫付亮朱海丰司群谢蕙
- 关键词:网页分类
- 搜索引擎中重复网页检测算法研究
- 随着因特网的普及和快速发展,网络信息以指数级速度快速增长,搜索引擎成为用户在海量网络资源中查找需求信息的有效工具。但是由于网络信息发布没有明确统一的规范,而且发布信息比较容易,造成因特网上存在有大量内容重复和近似重复的网...
- 闫付亮
- 关键词:搜索引擎LUCENE
- 文献传递
- 一种基于特征向量的改进DSC网页去重算法被引量:1
- 2013年
- 网页去重具有很重要的实际意义,也是信息检索领域近几年研究的热点。分析现有的网页去重算法,并对经典的DSC(digital syntactic clustering)网页去重算法进行改进。为每篇文档生成一个特征向量集合,用该特征向量集合筛选shin-gles;然后进行相似性比较。实验表明,该算法对重复网页判定具有很好的准确率和召回率。
- 徐朝辉赵淑梅闫付亮秦杰
- 关键词:搜索引擎网页去重