刘骞
- 作品数:7 被引量:5H指数:1
- 供职机构:中国石油大学(北京)地球物理与信息工程学院计算机科学与技术系更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于Map/Reduce集群上的模式空间划分的序列模式挖掘
- 通过模式空间划分将基于Map/Reduce处理数据集与候选序列模式集的多对多的对应关系的问题转化为处理数据集与以频繁1—序列为基的各子模式空间的多对多的对应关系问题,大大缩小了中间结果键值对集合的规模,避免了由于组合爆炸...
- LIU Qian刘骞CHEN Ming陈明
- 关键词:数据挖掘云计算
- 基于Map/Reduce集群上的模式空间划分的序列模式挖掘
- 通过模式空间划分将基于Map/Reduce处理数据集与候选序列模式集的多对多的对应关系的问题转化为处理数据集与以频繁1-序列为基的各子模式空间的多对多的对应关系问题,大大缩小了中间结果键值对集合的规模,避免了由于组合爆炸...
- LIU Qian刘骞CHEN Ming陈明
- 关键词:数据处理集群系统
- 基于Map/Reduce集群上的模式空间划分的数据挖掘
- 通过模式空间划分将基于Map/Reduce处理数据集与候选目标模式集的多对多的对应关系的问题转化为处理数据集与各子模式空间的多对多的对应关系问题。大大缩小了中间结果键值对集合的规模,避免了由于组合爆炸导致的单一Map节点...
- LIU Qian刘骞CHEN Ming陈明
- 关键词:数据挖掘网格划分
- 基于改进的Map/Reduce及模式空间划分的数据挖掘
- 为通过Map/Reduce基于键/值对以处理数据集与模式集的多对多的对应关系的方式实现数据挖掘,解决在较复杂的类型的模式的挖掘中存在的由组合爆炸导致的模式集过大的问题,提出了通过模式空间划分实现将处理数据集与模式集的对应...
- 刘骞陈明
- 关键词:数据集数据挖掘
- 基于改进的Map/Reduce及模式空间划分的数据挖掘被引量:4
- 2011年
- 为通过Map/Reduce基于键/值对以处理数据集与模式集的多对多的对应关系的方式实现数据挖掘,解决在较复杂的类型的模式的挖掘中存在的由组合爆炸导致的模式集过大的问题,提出了通过模式空间划分实现将处理数据集与模式集的对应关系的问题转化为处理数据集与子模式集的集合的对应关系的问题的方法,并对Map/Reduce集群的调度机制及组织、处理键/值对的方式进行了改进,增强了Map/Reduce执行模式挖掘任务的能力.在Map/Reduce集群上采用该思路实现某些较复杂类型的模式的挖掘算法时的并行度高于Map/Reduce化的传统算法.
- 刘骞陈明
- 关键词:集群数据挖掘
- 基于Map/Reduce集群上的模式空间划分的序列模式挖掘被引量:1
- 2012年
- 通过模式空间划分将基于Map/Reduce处理数据集与候选序列模式集的多对多的对应关系的问题转化为处理数据集与以频繁1-序列为基的各子模式空间的多对多的对应关系问题,大大缩小了中间结果键值对集合的规模,避免了由于组合爆炸导致的单一Map节点的瓶颈问题.通过三轮的Map/Reduce任务,实现了模式空间和过滤规则的建立,并在此基础上实现了各子模式空间上独立地进行序列模式的挖掘.通过充分利用整个模式空间的全局特征及各子模式空间的个性特征,设计了优化的非递归挖掘算法,减少了前缀投影库构造次数及对构造的投影库的扫描次数,从而提高了挖掘阶段的效率.
- 刘骞陈明
- 关键词:序列模式挖掘云计算