何发镁 作品数:12 被引量:57 H指数:4 供职机构: 北京理工大学图书馆 更多>> 发文基金: 国家自然科学基金 北京市属高等学校人才强教计划资助项目 北京市科技新星计划 更多>> 相关领域: 自动化与计算机技术 文化科学 更多>>
基于粗糙集理论的网络安全评估研究 本文提出了一种基于粗糙集理论(Rough Set Theory,RST)的网络安全评估模型,用于监控网络的安全态势。该方法使用粗糙集理论对网络连接数据提取检测规则模型。使用粗粗糙集理论提取规则模型,能有效地处理数据挖掘方... 王旭仁 何发镁 王彦丽 袁晓红关键词:粗糙集理论 网络安全评估 网络安全分析 文献传递 推荐系统安全问题研究综述 在最近几年来,为有效地解决人们面临的信息过量问题,推荐系统出现了。作为一个有效的方法,它通过从以前用户的交互动作提取信息以形成个性化的产品建议。然而,推荐系统也存在严重的安全问题:恶意用户能够影响或破坏提供给其他用户的推... 何发镁 冯勇 许榕生 王旭仁关键词:协同过滤 推荐系统 攻击检测 文献传递 基于K-means和naive Bayes的数据库用户行为异常检测研究 被引量:8 2020年 针对数据库用户行为异常导致数据库泄露问题,提出了一种基于K-means和naive Bayes算法的数据库用户异常检测方法。首先,利用数据库历史审计日志中用户的查询语句与查询结果,采用K-means聚类方法得到用户的分组;然后,使用naive Bayes分类算法构造用户异常检测模型。与单独使用naive Bayes分类法构造的模型相比,在数据预处理时其精简了用户行为轮廓的表示方法,降低了计算冗余,减少了81%的训练时间;利用K-means聚类方法得到用户组别,使检测的精确率提高了7.06%,F 1值提高了3.33%。实验证明,所提方法大幅降低了训练时间,取得了良好的检测效果。 王旭仁 冯安然 何发镁 马慧珍 何发镁关键词:数据库 用户行为 K-MEANS聚类 NAIVE 个性化推荐系统描述文件攻击检测方法 被引量:3 2011年 个性化推荐系统能产生针对性的、个性化的信息来满足不同用户需求,但也很容易受到用户描述文件注入恶意攻击,影响正常的推荐结果。针对该问题,分析和研究了描述文件的形式化模型、描述文件的属性及分类方法,应用粗糙集理论,设计了数据预处理离散化、决策表约简和个性化推荐处理相应算法,提出了一种用户描述文件分类学习和攻击检测的方法;为降低攻击对推荐结果的影响,完善了推荐系统的安全,设计出一种动态交互的个性化推荐模型框架。实例证明,用户描述文件的属性分类及检测方法是有效的,准确率高,能够有效地改善个性化推荐系统模型的安全。 张靖 何发镁 邱云关键词:推荐系统 粗糙集理论 基于粗糙集理论的网络安全评估研究 本文提出了一种基于粗糙集理论(Rough Set Theory,RST)的网络安全评估模型,用于监控网络的安全态势。该方法使用粗糙集理论对网络连接数据提取检测规则模型。使用粗粗糙集理论提取规则模型,能有效地处理数据挖掘方... 王旭仁 何发镁 王彦丽 袁晓红关键词:粗糙集理论 网络安全评估 网络安全分析 文献传递 基于Tika和Lucene的桌面搜索引擎研究与实现 被引量:3 2014年 在桌面搜索引擎中,对于二进制文件格式的处理,通常需要针对每一种具体的文件格式编写独立的解析器,复杂度较高且不易维护。从分析开源搜索引擎Lucene出发,提出一种基于Tika和Lucene的桌面搜索引擎框架,能够使用统一的应用编程接口来处理不同二进制格式的文档。整个框架均为开放源代码形式,各模块间耦合度低,易于扩展。在实现方面,基于最新的Lucene4.1,实现了对桌面系统内文档的全文搜索;并在索引性能优化方面,相比于传统的参数配置优化和内存缓冲优化两方面,使用最新的DWPT(documents writer per thread)技术,使索引性能提升了35%。 王旭仁 郑秋辉 何发镁 李娜 王彦丽关键词:桌面搜索引擎 索引优化 一种并行LDA主题模型建立方法研究 被引量:12 2013年 针对潜在狄利克雷分析(LDA)模型分析大规模文档集或语料库中潜藏的主题信息计算时间较长问题,提出基于MapReduce架构的并行LDA主题模型建立方法.利用分布式编程模型研究了LDA主题模型建立方法的并行化实现.通过Hadoop并行计算平台进行实验的结果表明,该方法在处理大规模文本时,能获得接近线性的加速比,对主题模型的建立效果也有提高. 王旭仁 姚叶鹏 冉春风 何发镁关键词:并行计算 主题建模 Web页面细粒度数据抽取方法研究 2014年 尽管有很多方法用于Web页面信息抽取,对细粒度信息如数据项等的抽取需求仍然很迫切。提出了一个用于结构化数据抽取的解决方案,将Web页面上的信息以更细的粒度抽取出来。对包装器(wrapper)生成时所依据的信息进行了基于稳定性的分类,实现了模板和种子之间多对多的自动关联(automatically correlating),并按照信息稳定性的高低为每个字段生成多个抽取规则,在抽取信息时根据多个抽取规则进行抽取,只有在所有规则失效时才会导致抽取失败,提高了抽取系统的鲁棒性。实验结果表明,该方法具有良好的抽取功率和准确率。 王旭仁 杨硕 何发镁 王彦丽 张为群关键词:信息抽取 WEB挖掘 包装器 基于检测响应的安全协同推荐系统研究 被引量:3 2010年 协同推荐系统广泛地应用于电子商务和信息访问系统,为新用户提供个性化的产品建议。然而,协同推荐系统存在着严重的安全隐患,使得恶意用户能够注入伪造的描述文件,影响或破坏提供给其他用户的推荐建议。本文探讨了检测响应描述文件注入攻击的方法,改进了协同过滤推荐算法,设计了基于检测响应方法的安全协同推荐系统框架。 何发镁 王旭仁关键词:协同过滤 推荐系统 攻击检测 基于特征分组聚类的异常入侵检测系统研究 被引量:14 2020年 利用网络连接数据可以按照连接的基本特征、内容特征、网络流量特征和主机流量特征进行分组的特点,基于K-means算法,提出一种按照特征分组进行聚类的方法,以高效实现特征约简和数据降维.通过调整聚类参数保留特征分组内的差异信息,使用决策树C4.5算法对降维后的数据进行入侵分类处理.实验结果表明,该方法能够使kddcup99数据集的聚类特征数由41个降为4个,且对网络连接数据的总检测率为99.73%,误检率为0,其中正常网络连接和刺探攻击Probe的检测率均为100%. 何发镁 马慧珍 王旭仁 冯安然关键词:入侵检测 网络数据 K-MEANS算法 决策树 数据降维