黑龙江省自然科学基金(F200603)
- 作品数:12 被引量:49H指数:5
- 相关作者:顾洪博张继怀赵万平马瑞民苏冬娜更多>>
- 相关机构:东北石油大学大庆市让胡路区政府中国石油天然气集团公司更多>>
- 发文基金:黑龙江省自然科学基金黑龙江省教育厅科学技术研究项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 孤立点检测及在煤矿安全预警系统中的应用被引量:3
- 2011年
- 针对孤立点检测算法的一些弊端和煤矿安全预警系统的实际情况,选择一个基于距离和孤立点检测算法对瓦斯浓度的异常数据进行处理,分析出设备异常数据、噪声数据和瓦斯突出孤立点数据,通过挖掘孤立点来发现真实的潜在的信息,保证安全预警的准确性。
- 朱秀莉顾洪博杨冬黎
- 关键词:孤立点检测瓦斯浓度
- 一种挖掘数值型数据流上的分类的方法被引量:2
- 2006年
- 提出了一种挖掘数值型数据流上的分类的方法,将精确抽样方法与贝叶斯方法合理配合使用,在构建数据流概要数据结构的过程获得了挖掘算法的关键统计量的值,同时,将连续类型的属性值进行了离散化处理,使得可以使用单一的方法来挖掘既包含离散类型数值又包含连续类型数值的数据流。在判断数据流元组的类别时,使用了多阈值方法以增加挖掘结果的可选择性。挖掘结果采用了实时直方图的方法来描述。实验表明,该挖掘方法是有效的。
- 王小龙马瑞民
- 关键词:数据流挖掘概要数据结构多阈值
- 改进的k-均值算法在聚类分析中的应用被引量:4
- 2010年
- 介绍了在聚类中广泛应用的经典k-均值算法,并针对其易受随机选择初始聚类中心和孤立点的影响的不足,给出了改进的k-均值算法。首先使用距离法移除孤立点,然后采用邻近吸收法对初始聚类中心的选择进行了改进。并做了改进前后的对比实验和应用。结果表明,改进后的算法比较稳定、准确,受孤立点和随机选择初始聚类中心的影响也有所降低。
- 顾洪博张继怀
- 关键词:K-均值算法初始聚类中心孤立点
- 基于k-means算法的k值优化的研究与应用被引量:6
- 2009年
- k-means算法是经常使用的一种聚类算法,但是易受聚类个数k的影响,其性能主要取决于k值优化,因此对近年来k-means算法的研究现状与进展进行总结。对较有代表性的k值优化的k-means算法,从思想、关键技术等方面进行分析概括,并选用著名数据集对一些典型算法进行了测试,主要从同一个数据集、不同的k值优化情况进行对比分析.上述工作将为聚类分析和数据挖掘的研究提供有益的参考.
- 顾洪博
- 关键词:K-MEANS算法
- 基于MMD聚类算法及在高校成绩分析中的应用被引量:7
- 2010年
- 介绍了在聚类算法中广泛使用的k均值算法。针对其受选择初始质心和聚类个数影响的缺点,给出了改进的k均值算法。使用最大最小距离法选择初始聚类中心,并确定聚类个数。进行了改进前后的对比实验。实验结果表明,改进后的算法比较稳定、准确。将改进后的算法应用到高校成绩分析中,达到较好的分类效果。
- 顾洪博赵万平
- 关键词:聚类分析
- 基于孤立点和初始质心选择的k均值算法的改进与应用被引量:4
- 2009年
- 针对聚类中广泛应用的经典k均值算法随机选择初始质心和易受孤立点影响的不足,给出了二次改进的k均值算法。首先使用距离法移除孤立点,然后采用邻近吸收法对初始聚类中心的选择进行改进,并做了改进前后的对比实验。结果表明,改进后的算法比较稳定、准确,受孤立点和随机选择质心的影响也有所降低。
- 顾洪博苏冬娜
- 关键词:K均值算法孤立点
- 聚类算法初始聚类中心的优化被引量:7
- 2010年
- 对近年来k-means算法的研究现状与进展进行总结.首先对较有代表性的初始聚类中心改进的算法,从思想、关键技术和优缺点等方面进行分析.其次选用知名数据集对典型算法进行测试,主要从就同一个数据集不同改进算法的聚类情况进行对比分析,为聚类分析和数据挖掘等研究提供有益的参考.
- 顾洪博张继怀
- 关键词:聚类
- 数据挖掘算法性能优化的研究与应用被引量:10
- 2010年
- 数据挖掘中经常使用k-means算法,它是经常使用的一种聚类分析算法,但易受初始聚类中心和聚类个数k的影响。因此对近年从算法原理、关键技术和优缺点等方面提出的较有代表性的关于初始聚类中心和k值确定的改进的k-means算法进行了分析。并选用知名数据集对一些典型算法进行测试和应用。上述工作将为数据挖掘的研究提供有益的参考。
- 顾洪博赵万平
- 关键词:聚类算法K-MEANS
- 不确定性数据的聚类分析研究及应用被引量:1
- 2012年
- 对近年来不确定性数据聚类算法的研究现状与进展进行总结。首先对较有代表性的聚类算法,从思想、关键技术和优缺点等方面进行分析。其次选用数据集对基于密度的算法进行测试和对比分析。并给出基于不确定性数据的聚类算法,上述工作将为不确定数据管理提供有益的参考。
- 顾洪博张继怀
- 关键词:聚类分析不确定性数据基于密度
- 基于DS的孤立点检测在瓦斯浓度判定中的应用被引量:3
- 2011年
- 对几种孤立点检测算法进行介绍,总结它们的特点.针对孤立点检测算法的一些弊端和瓦斯浓度的实际情况,选择一个基于DS(距离和)的孤立点检测算法实现对瓦斯浓度的异常数据进行分析处理,找到真正的异常数据,保证煤矿安全预警的准确性.
- 顾洪博张星
- 关键词:孤立点检测瓦斯浓度