山西省青年科技研究基金(2008021028) 作品数:5 被引量:17 H指数:2 相关作者: 张继福 蔡江辉 赵旭俊 乔衎 张贺 更多>> 相关机构: 太原科技大学 北京航空航天大学 中国科学院国家天文台 更多>> 发文基金: 山西省青年科技研究基金 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 更多>>
基于PSO的二阶段光谱模糊聚类研究 被引量:4 2009年 在海量的天体光谱数据中利用无监督聚类学习方法将天体自动分类具有更加诱人的前景。针对当前聚类方法存在的缺点,提出一种高效的高维数据硬划分算法,在此基础上提出了一种分阶段模糊聚类方法。第一阶段,利用硬划分算法对数据聚类,克服了模糊聚类算法对初始值敏感的缺点。第二阶段,以第一阶段运算结果作为初始值,进行模糊聚类的,并将微粒群算法引入模糊聚类,从而保证了聚类结果的全局最优性。实验结果表明,该方法用于天体光谱聚类是可行的、有价值的。 蔡江辉 张继福 赵旭俊关键词:模糊聚类 微粒群 恒星光谱数据 全局最优 一种新的分类规则提取算法 被引量:2 2012年 约束概念格是概念格的特化结构,构造时具有较低的时空复杂度,能从中快速提取比较丰富的信息和知识.为了提取分类规则,在充分分析约束概念格结点外延与数据集等价划分之间关系的前提下,引入了分类支持度和记录支持度的概念,提出了一种面向约束概念格的分类规则提取算法(Classification Rule Acquisition Algorithm based on Constrained Concept Lattice,CRACCL),并采用UCI数据集作为实验集,验证了本算法能够提取更加实用和准确的分类规则. 赵旭俊 张继福 马洋 蔡江辉关键词:约束概念格 基于信息熵的变星光谱快速识别方法 被引量:2 2012年 变星对人类研究宇宙的起源与发展具有重要意义,对于变星研究的困难首先源于对变星的筛选和识别,即如何从海量恒星光谱数据中有效识别变星光谱。传统的异常数据定义试图通过不同的方式寻找异常数据与一般模式之间的偏差,进而予以定量分析和筛选。然而,这种方法的时间复杂度过大,且结果存在不可理解和无法解释的问题。文章利用熵可以反映系统有序程度与稳定程度的特性,引入信息熵作为衡量数据集一般模式的标准,提出了基于信息熵的变星光谱快速识别方法。该方法显著降低了算法的时间复杂度,有效地消除了人为主观因素对识别结果的影响。采用国家天文台提供的Sloan数字巡天数据实验验证了该方法的可行性和有效性。 蔡江辉 孟文俊 孙士卫 赵旭俊 张继福关键词:信息熵 异常数据 一种基于谓词逻辑的分类规则约简方法 被引量:2 2010年 利用各种分类规则挖掘方法,提取出的分类规则集中,存在许多的冗余规则,从而降低了分类效率。采用谓词公式描述分类规则,给出了一种分类规则集约简方法。该方法利用谓词公式中的逻辑推理,对分类规则集进行约简,消除了冗余规则。采用恒星光谱数据,实验验证该方法在保证分类规则集的分类能力不变的前提下,有效地提高了分类的效率。 冀英伟 杨海峰 张继福关键词:数据挖掘 谓词逻辑 冗余规则 恒星光谱数据 信息熵度量的离群数据挖掘算法 被引量:7 2010年 离群数据挖掘是为了找出隐含在海量数据中相对稀疏而孤立的异常数据模式,但传统的离群数据挖掘方法受人为因素影响较大.通过引入基于信息熵的离群度量因子,给出一种离群数据挖掘新算法.该算法先利用信息熵计算每个数据对象的离群度量因子,然后通过离群度量因子来衡量每个对象的离群程度,进而检测离群数据,有效地消除了人为主观因素对离群检测的影响,并能很好地解释离群点的含义.最后,采用UCI和恒星光谱数据作为实验数据,通过对实验的分析,验证了该算法的可行性和有效性. 张贺 蔡江辉 张继福 乔衎关键词:离群数据 信息熵 数据挖掘