河北省自然科学基金(603137) 作品数:10 被引量:261 H指数:8 相关作者: 王熙照 田盛丰 李昆仑 黄厚宽 孟增辉 更多>> 相关机构: 河北大学 北京交通大学 东北大学 更多>> 发文基金: 河北省自然科学基金 国家科技重大专项 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 理学 更多>>
决策树简化(剪切)方法综述 被引量:31 2004年 树的简化是决策树归纳学习中关键的部分。论文是决策树简化方法的一个综述,包括预剪枝、后剪枝和其它方法。文中叙述了多种著名的剪枝方法,各种方法的优缺点及对其的改进和变型。 王熙照 游自英关键词:剪枝 具有3条吸收壁的随机游动的吸收概率 被引量:1 2006年 研究了一种带有3条吸收壁的有限步随机游动模型,得到了随机点到达3个吸收壁的概率的一般结果.不同于一般教科书中基于大数定律的随机游动研究,本文仅研究了游动的小样本行为,从而有着更为实际的应用价值. 张玉芬 王熙照关键词:吸收壁 基于模糊扩张矩阵的启发式算法 被引量:2 2005年 扩张矩阵是一种规则归纳的方法。在模糊环境下,模糊扩张矩阵算法根据路径的最小模糊信息熵标准,从示例中归纳产生一组模糊规则。本文引入评价矩阵的概念,并使用近似集合覆盖算法的思想,对上述模糊规则归纳方法做了改进。实验结果表明,与原算法相比,改进后的版本增添了许多优点,比如,得到的规则较少,运算速度较快等。 王熙照 闫磊凡关键词:扩张矩阵 模糊熵 评价矩阵 启发式算法 基于属性权重的Fuzzy C Mean算法 被引量:50 2006年 提出CF-WFCM算法,该算法分为属性权重学习算法和聚类算法两部分.属性权重学习算法,从数据自身的相似性出发,通过梯度递减算法极小化属性评价函数CFuzziness(w),为每个属性赋予一个权重.将属性权重应用于Fuzzy C Mean聚类算法,得到CF-WFCM算法的聚类算法.CF-WFCM算法强化重要属性在聚类过程中的作用,消减冗余属性的作用,从而改善聚类的效果.我们选取了部分UCI数据库进行实验,实验结果证明:CF-WFCM算法的聚类结果优于FCM算法的聚类结果.函数CFuzziness(w)不仅可以评价属性的重要性,而且可以评价属性评价函数的优劣.实验说明了这一问题.最后我们对CF-WFCM算法进行了讨论. 王丽娟 关守义 王晓龙 王熙照关键词:FUZZY 聚类有效性函数 可能性空间中学习过程一致收敛速度的界 被引量:17 2004年 在概率空间上统计学习理论是机器学习的重要组成部分.在概率空间上统计学习理论中一致收敛速度的界有重要的意义,利用经验风险最小化原则,这些界决定了学习机器的推广能力.本文在可能性空间中讨论了学习过程一致收敛速度的界,给出了一致收敛速度的界的估计并讨论了这些界和函数集容量之间的关系. 哈明虎 王鹏对k-means聚类算法的改进 被引量:67 2004年 提出了一种k-means聚类算法中寻找初始聚类中心的新方法。算法首先计算样本间的距离,然后根据样本点之间的距离寻找有可能是一类的数据,依据这些样本点形成初始聚类中心,从而得到较好的聚类结果。实验表明,改进后的方法相对于随机选取初始聚类中心具有较高的准确率。 袁方 孟增辉 于戈关键词:K-MEANS聚类算法 聚类 模式识别 基于SVM技术的入侵检测 被引量:15 2003年 针对日益严重的网络入侵事件 ,提出了一种新的入侵检测方法 .在对网络数据进行深刻的分析和研究的基础上 ,提出了基于支持向量机的入侵检测方法 .首先 ,对 1类SVM进行了必要的改进 ,使异常点聚集为一类 (即环绕原点的一类 ) .然后 ,使用抽象化的网络数据对SVM进行训练 ,生成入侵事件的SVM分类器 .实验表明 。 李昆仑 赵俊忠 黄厚宽 田盛丰关键词:入侵检测 网络安全体系 SVM技术 支持向量机 计算机网络 网络数据 基于Rough集理论的模糊值属性信息表简化方法 被引量:14 2004年 为了有效地在信息表中处理取值为模糊术语的属性 ,解决Rough集对模糊值属性处理能力较弱的问题 ,提出了模糊不可分辨关系的概念 ,用于处理属性值为模糊术语的信息表 将约简、核、相对约简与相对核以及规则的约简与核等Rough集理论中一系列知识约简的概念推广到模糊环境下 ,提出了一种有效的模糊值信息表简化的启发式算法 王熙照 赵素云 王静红关键词:知识发现 ROUGH集 不可分辨关系 模糊核 模糊多类SVM模型 被引量:49 2004年 利用SVM处理多类分类问题 ,是当前的研究热点之一 .本文提出了一种模糊多类支持向量机模型 ,即FMSVM .该方法是在Weston等人提出的多类SVM模型中引入模糊成员函数 ,针对每个输入数据对分类结果的不同影响 ,该模糊成员函数得到相应的值 ,由此得到不同的惩罚值 .从而在构造分类超平面时 ,可以忽略那些对分类结果影响很小的数据 .理论分析与数值实验都表明 ,该算法具有良好的鲁棒性 . 李昆仑 黄厚宽 田盛丰关键词:多类分类 基于属性间交互信息的ID3算法 被引量:15 2004年 启发式算法是决策树研究的核心。文中分析了最常见的一种决策树归纳启发式算法即ID3算法的不足,给出了一个改进版本,它在选择测试属性时不仅要求该属性带来的信息增益尽可能大,而且要求其与同一分支上已经使用过的各属性之间的交互信息尽可能小,从而避免了对冗余属性的选择,实现信息熵的真正减少。分析及实验结果表明,与ID3算法相比,该算法能构造出更优的决策树。 谢竞博 王熙照关键词:决策树 ID3 启发式算法 交互信息