您的位置: 专家智库 > >

王金明

作品数:3 被引量:4H指数:1
供职机构:东南大学计算机科学与工程学院更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇中文期刊文章

领域

  • 3篇自动化与计算...

主题

  • 1篇倒排表
  • 1篇视图
  • 1篇排序
  • 1篇模式挖掘算法
  • 1篇TWITTE...
  • 1篇DM
  • 1篇DSF
  • 1篇MAPRED...
  • 1篇标签
  • 1篇查询
  • 1篇STORM

机构

  • 3篇东南大学
  • 2篇江苏方天电力...

作者

  • 3篇王金明
  • 2篇崇志宏
  • 2篇郑海雁
  • 2篇熊政
  • 2篇徐立臻
  • 2篇李昆明
  • 1篇王远方

传媒

  • 1篇计算机应用与...
  • 1篇计算机工程与...
  • 1篇计算机科学

年份

  • 1篇2016
  • 1篇2015
  • 1篇2014
3 条 记 录,以下是 1-3
排序方式:
一种基于可排序视图的RDF模式匹配算法被引量:2
2016年
随着语义网络中数据量的激增,在RDF数据集中高效查询数据已成为一个亟待解决的问题。传统的基于物化视图的RDF模式匹配方法虽然能降低表的自连接操作次数,加快查询模式重写过程,但在视图集中检索模式匹配的视图等价于子图同构这一NP-hard问题。为了减小查询模式重写代价,提高RDF模式匹配过程效率,引入可排序视图概念,设计包含映射发现算法contain及其扩展算法contain+,简化等长度模式间包含映射发现过程,同时保证模式间的匹配代价与输入数据的规模线性相关。此外,提出基于倒排表/Map Reduce检索候选可排序视图的方法,实现RDF模式重写算法rewrite,用以处理不同规模数据集上的模式匹配问题。理论分析及实验证明,基于可排序视图的RDF模式匹配算法能有效地兼顾算法效率及算法可扩展性。
熊政王金明郑海雁李昆明徐立臻崇志宏
关键词:倒排表MAPREDUCE
基于Twitter Storm平台并行挖掘最稠密子图被引量:1
2014年
在大规模图结构数据中发现最稠密子图具有极其广泛的应用,如社区发现、垃圾邮件检测和论文引用关系抽取等。基于带标签的无向图,提出了查询标签集的概念,设计了一个可以快速发现最稠密子图的近似算法DSFLC(Densest Subgraph Finding based on Labelset Constraint):用户提交自定义的查询标签集,算法便可保证在用户可以接受的时间内返回满足查询标签集约束的最稠密子图。对于任何参数ε(ε>0),DSFLC算法只需扫描大规模数据集O(log1+εn)次,同时可保证算法的近似因子是2(1+ε)。对DSFLC算法进行分析后,发现该算法在预处理阶段易于并行化,因此选择Twitter Storm平台,并行化地实现了DSFLC算法。最后对从DBLP数据库中抽取的合作关系图进行测试,一方面研究Storm平台对算法的加速程度;另一方面分析挖掘出的子图的稠密度与参数ε之间的关系,最终验证了DSFLC算法的实用性和可扩展性。
王金明王远方
关键词:TWITTER
一种基于加权规则的显著模式挖掘算法被引量:1
2015年
在频繁项集挖掘过程中会发现事务或关系数据集中项目具有不同的重要性,而一些经典的频繁模式挖掘算法仅考虑项目频数这一属性来进行挖掘操作。针对该问题为不同的项目添加不同权重,提出一个新的加权规则模型,定义一种特殊的模式即显著模式。构造一棵类似于FPTree树的、具有高度压缩存储特性的数据结构树——SPTree(Significant Pattern Tree),之后基于SPTree树提出一个新颖的挖掘显著模式的算法DMSP(Data Mining Significant Pattern)。实验结果验证DMSP算法能够高效地挖掘显著模式。该算法可以有效解决由于项目重要性各不相同而导致的问题,有利于发现更多有研究价值的信息。
熊政王金明郑海雁李昆明徐立臻崇志宏
共1页<1>
聚类工具0