河北省自然科学基金(F2008000888)
- 作品数:2 被引量:5H指数:1
- 相关作者:任家东王倩王蒙李可更多>>
- 相关机构:燕山大学泰山学院更多>>
- 发文基金:河北省自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于频繁模式有向无环图的数据流频繁模式挖掘算法被引量:4
- 2011年
- 频繁模式挖掘中基于FP-growth的算法需要扫描两次事务数据库,预先给定支持度,且不支持时间敏感型数据。本文提出了一种基于频繁模式有向无环图的数据流频繁模式挖掘算法,它根据事务到来的时间给每个事务一个序号,每个事务中的数据项在存储前按数据项的顺序进行调整,频繁模式有向无环图的构建遵循这个顺序并用序号来记录事务与数据项的包含关系,模式增长过程只需要增加有向边上的序号。通过逆向遍历带有相同序号的有向边,产生条件模式基,根据动态定义的阈值抽取条件模式基信息,一次扫描数据库得到频繁模式。实验结果表明,本文算法的执行效率优于FP-growth算法,且存储节点的数目明显减少。
- 任家东王倩王蒙
- 关键词:数据流
- 一种基于滑动窗口的数据流频繁闭项集挖掘算法
- 频繁项集挖掘是数据流挖掘中的一个热点问题.提出了一种新的数据流频繁闭项集挖掘算法MFCI-SW.首先设计了两个新的数据结构:频繁闭项集表FCIL和频繁闭合模式树MFCI-SW-Tree,在此基础上以滑动窗口中的基本窗口为...
- 黄国言王立波任家东
- 关键词:数据流频繁闭项集
- 一种基于网格的改进的K-Means聚类算法
- K-Means算法对数据集中的每个数据点进行多次处理,因此对于大数据集时间效率不高.为提高K-Means算法的时间性能并使聚类结果更优,利用网格方法定义了单元密度聚合度概念,提出了一种基于网格的改进的K-Means聚类算...
- 任家东孟丽丽张冬梅
- 关键词:K-MEANS聚类网格
- 文献传递
- 数据流中基于PB-tree的当前最大频繁项集挖掘算法
- 数据流中最大频繁项集挖掘是许多数据挖掘应用中的关键问题.提出了一种基于滑动窗口快速挖掘最大频繁项集的算法SW-MFI,创建了PB-tree数据结构来维护当前滑动窗口内所有事务,它采用了数据的垂直表示和指向当前最大频繁项集...
- 任家东霍聪
- 关键词:最大频繁项集数据流
- 文献传递
- 窗口模式下在线数据流中频繁项集的挖掘被引量:1
- 2010年
- 拟采用一种基于滑动窗模式的单遍挖掘算法,专注于处理近期数据;为了减少处理时间和占用的内存,设计了一种新的事务表示方法。通过处理这个事务的表达式,频繁项集可以被高效输出,并解决了使用基于Apriori理论的算法时,由候选频繁1-项集生成频繁2-项集时数据项顺序判断不准确问题。该算法称为MRFI-SW算法。
- 李可任家东
- 关键词:频繁项集滑动窗