周俊临
- 作品数:31 被引量:64H指数:4
- 供职机构:电子科技大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划中央高校基本科研业务费专项资金更多>>
- 相关领域:自动化与计算机技术电子电信理学文化科学更多>>
- 快速神经网络无损压缩方法研究被引量:3
- 2007年
- 传统的人工神经网络数据编码算法需要离线训练且编码速度慢,因此通常多用于专用有损编码领域如声音、图像编码等,在无损数据编码领域应用较少。针对这种现状,该文详细地研究了最大熵统计模型和神经网络算法各自的特点,提出了一种基于最大熵原理的神经网络概率预测模型并结合自适应算术编码来进行数据压缩,具有精简的网络结构的自适应在线学习算法。试验表明,该算法在压缩率上可以优于目前流行的压缩算法Limpel-Zip(zip,gzip),并且在运行时间和所需空间性能上同PPM和Burrows Wheeler算法相比也是颇具竞争力的。该算法实现为多输入和单输出的两层神经网络,用已编码比特的学习结果作为待编码比特的工作参数,符合数据上下文相关约束的特点,提高了预测精度,并节约了编码时间。
- 傅彦周俊临吴跃
- 关键词:最大熵神经网络
- 基于主题网络爬虫的不良网页的发现与识别被引量:2
- 2010年
- 针对互联网中出现的大量不良内容,分析出其主要特征,首次提出将不良网页的文本特征与搜索引擎中网络爬虫相结合的技术来主动寻找互联网中的不良网页及不良网站,并将结果分级别反馈到用户层以便对不良网页和网站进行处理,以达到净化网络环境的目的.实验结果表明,所提出的算法能够有效检测不良网页,并且能够很好地应对不良网站的反关键字过滤策略.
- 方育柯傅彦周俊临夏虎
- 关键词:主题网络爬虫不良网页文本特征
- 基于模型共享的分布式无监督异常检测被引量:3
- 2010年
- 提出一种具有通用性的分布式异常检测框架.首先,利用本地的无监督异常检测算法,建立多个本地检测模型;然后,将各个本地无监督检测模型转换成统一的共享模型;最后,采用集成学习的方法,综合考虑各模型差异性和准确性,实现全局异常检测.实验结果表明,基于模型共享的分布式异常检测不仅能有效地保护数据隐私,减少通信开销,同时能获得和集中式检测相当甚至在某些情况下更好的效果.
- 周俊临傅彦吴跃方育柯夏虎
- 关键词:异常检测分布式数据挖掘模型共享无监督学习
- 基于孤立点检测的自适应入侵检测技术研究被引量:1
- 2009年
- 传统的入侵检测技术主要是从已知攻击数据中提取出每种具体攻击的特征规则模式,然后使用这些规则模式来进行匹配。然而基于规则的入侵检测的主要问题是现有的规则模式并不能有效应对持续变化的新型入侵攻击。针对这一问题,基于数据挖掘的入侵检测方法成为了入侵检测技术新的研究热点。本文提出了一种基于孤立点挖掘的自适应入侵检测框架,首先,基于相似系数寻找孤立点,然后对孤立点集合进行聚类,并使用改进的关联规则算法来从孤立点聚类结果中提取出各类入侵活动的潜在特征模式,然后生成可使用的匹配规则模式来添加到现有的规则模式中去,进而达到自适应的目的。本文使用KDD99的UCI数据集进行孤立点挖掘,然后使用IDS Snort的作为实验平台,使用IDS Informer模拟攻击工具进行测试,这两个实验结果表明了本文所提出算法的有效性。
- 方育柯傅彦周俊临曾金全
- 关键词:人工智能入侵检测孤立点挖掘异常检测自适应
- 基于选择性集成的最大化软间隔算法被引量:7
- 2012年
- 当前,boosting集成学习算法研究主要集中于最大化弱学习器凸组合的间隔或软间隔,该凸组合几乎使用了生成的所有弱学习器,然而这些弱学习器间存在大量的相关性和冗余,增加了训练和分类过程的时空复杂度.针对这一问题,在LPBoost基础上提出了一种选择性boosting集成学习算法,称为SelectedBoost.在每次迭代生成新的弱学习器以后,通过计算新生成的弱学习器与已有弱学习器的相关度和差异度,并结合当前集成的强学习器的准确率来判断是否选择该弱学习器.另外,当前的一系列boosting算法(如AdaBoost,LPBoost,ERLPBoost等),本质上是基于已生成的1个或者多个弱学习器来更新样本权重,但与弱学习器相比,强学习器更能代表当前的决策面.因此,SelectedBoost通过在带约束的间隔最大化问题中引入更加严格的强学习器边界约束条件,使得该算法不仅参考弱学习器边界,同时还参考已生成的强学习器来更新样本权重,进而提高算法的收敛速度.最后,与其他有代表性的集成学习算法进行实验比较,结果表明,该方法在收敛率、分类准确性以及泛化能力等方面均具有比较明显的优势.
- 方育柯傅彦周俊临佘莉孙崇敬
- 关键词:相关度线性规划
- 基于隐私保护的分布式异常检测方法被引量:1
- 2010年
- 为获得鲁棒性的全局异常检测模型,需要多个组织之间的知识共享.存在的分布式异常检测技术常基于原始数据的交换或共享,侵犯了各自的隐私权,令人难以接受.基于隐私保护的分布式异常检测方法,采用本地模型共享技术,在保证数据隐私性的同时完成全局异常检测任务.通过7种异常检测模型在仿真和真实数据集上的实验说明,所提出的方法在保护数据隐私的同时,其全局异常检测效果能接近甚至超过将所有数据集中后建立的全局模型.
- 周俊临傅彦吴跃高辉
- 关键词:异常检测隐私保护分布式数据挖掘
- 离散数学精品课程建设与改革实践被引量:16
- 2005年
- 根据目前计算机专业人才培养和社会需求,结合离散数学课程的特点,提出了课堂教学模块化的新型教学模式,以理论教学为主线,辅以实践教学,让学生充分领略离散数学课程的重要意义。
- 傅彦周俊临
- 关键词:模块化课程建设教学改革
- 基于前景提取的复杂背景图像检索算法被引量:1
- 2013年
- 基于内容的图像检索提供给使用者一种更直观、更精准的检索方式。用户在进行此类检索时,往往更关注图像的主体部分。为了消除背景信息对检索效果的影响,提出一种基于前景提取的复杂背景图像检索算法。实验证明,在H-S颜色直方图、LBP纹理特征以及颜色纹理混合特征上,该算法可以得到较优化的性能。
- 冯喆夏虎傅彦周俊临
- 关键词:图像检索颜色直方图纹理特征
- 一种动态的汉字笔段提取方法被引量:6
- 2008年
- 提出了一种笔段提取新方法,充分利用了撇笔段和捺笔段的轮廓规律,在提取笔段过程中动态改变寻找方向,使提取正确率进一步提高。实验证明了算法的有效性,与传统笔段提取算法相比,正确率由99.3%提高到99.8%以上,为汉字识别创造了更有利的条件。
- 史伟傅彦陈安龙周俊临
- 关键词:汉字识别笔段提取
- 一种变异关键词的提取方法
- 本发明公开了一种变异关键词的提取方法,通过字符区位将噪音字符去除,提取出噪音字符的变异关键词;通过拼音文件将分词后文本和关键词转换为文本整数串,然后提取拼音替换、谐音替换的变异关键词;通过建立形近字库,比较分词后文本的每...
- 傅彦陈安龙周俊临尚明生史伟王全礼关娜
- 文献传递