周霆
- 作品数:6 被引量:18H指数:2
- 供职机构:江南大学信息工程学院更多>>
- 相关领域:自动化与计算机技术更多>>
- 动态的模糊K-Modes初始化算法被引量:2
- 2006年
- 模糊K-Modes聚类算法针对分类属性的数据进行聚类,使用爬山法来寻找最优解,因此该算法对初始值较为敏感。为了克服该缺点,提出一种动态的模糊K-Modes初始化算法,该方法能够自动确定聚类数目,以及对应的聚类中心;而且能够应用于数值属性和分类属性相混合的数据集。该初始化算法可以有效地克服模糊K-Modes算法对初值的敏感性。实验的结果表明了该初始化算法的可行性和有效性。
- 张伟周霆陈芸邹汉斌
- 关键词:聚类中心
- 基因表达数据聚类中模糊核算法的改进被引量:1
- 2006年
- FCM算法在基因表达数据分析中存在噪声点,影响聚类结果,为此提出了一种改进的模糊核聚类算法,通过使用Mercer核把原始数据映射到高维特征空间,并为特征空间的每个向量分配一个动态权值,分析权值的大小来识别噪声点,得到一个较为理想的聚类结果.实验结果表明,该方法比FCM聚类算法具有更好的聚类效果.
- 周霆张伟邹汉斌
- 关键词:模糊聚类核函数生物信息学
- 基于倒排文件的布尔规则隐藏算法被引量:1
- 2005年
- 介绍了关联规则方法的研究概况,提出了利用基于倒排文件的比特向量操作实现布尔规则隐藏算法,以及对实验结果的评估分析,并对未来数据挖掘领域中涉及的信息隐藏研究进行了展望。
- 张伟陈芸邹汉斌周霆
- 关键词:倒排文件
- 基于多参数随机扰动的布尔规则挖掘被引量:3
- 2006年
- 在MASK算法基础上提出了基于多参数随机扰动后布尔规则的挖掘过程,通过对实验结果的评估分析,表明该算法能够提供较高的隐私保护,并讨论了隐私保护及挖掘精度之间的关系。最后对未来多参数随机扰动数据挖掘研究进行了展望。
- 陈芸张伟周霆邹汉斌
- 关键词:频集
- 基于正例的多类文本分类方法
- 2006年
- 文本分类属于有指导的机器学习,而构造一个按照兴趣分类的分类器,需要做大量的预处理工作,来收集正负的训练样例,但负例的收集是非常困难的。提出了一个只有正例的基于支持向量机的学习模型。实验表明,该学习模型对多类文本分类的分类精度和速度都是非常理想。
- 邹汉斌雷红艳张伟陈芸周霆
- 关键词:多类分类文本分类支持向量机
- 基于关联规则的映射聚类算法被引量:11
- 2006年
- 针对很多算法对高维数据比较敏感的问题,提出了一种基于关联规则的映射聚类算法。该方法将映射聚类算法和关联规则方法相结合,利用关联规则发现每个类在子空间的最大相关维,可以提高算法的准确性,从而可以有效的在子空间进行聚类。文章后面的实验结果说明了该方法的有效性。
- 周霆张伟张泽洪
- 关键词:高维关联规则子空间