董义明
- 作品数:4 被引量:10H指数:2
- 供职机构:哈尔滨理工大学计算机科学与技术学院更多>>
- 发文基金:黑龙江省教育厅科学技术研究项目黑龙江省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 子图估算PageRank网页排序算法研究被引量:3
- 2017年
- 针对传统PageRank算法难以高效处理Web图数据网页排序问题,文章在不牺牲准确度的前提下,提出一种在MapReduce平台上基于改进PageRank的加速算法:top K-Rank.为识别出排名为前k的网页,通过在迭代过程中裁剪掉不必要的节点及边的形式,动态构建子图,由子图迭代计算出PageRank值的上下限。理论分析和实验结果表明:该算法不仅可以保证结果的准确性,还可以更快地找到用户所需网页数。
- 李兰英周秋丽孔银董义明
- 关键词:网页排序PAGERANK算法MAPREDUCE子图
- IRT树索引结构的研究
- 2013年
- 论文针对R树在处理一些特定空间数据对象集时的不足,研究了基于最小外接直角等腰三角形(MIRT)的新的索引结构—IRT树。探讨了IRT树的空间平面划分和空间数据结构特征,给出了IRT树的节点分裂算法和搜索算法。进一步对IRT树和R树进行了比较分析。由分析可知,对于一些特定数据集,IRT树在查询准确率、数据存储和空白空间冗余方面均有一定的优势。
- 朱德龙李松董义明籍祥李海屾
- 关键词:空间索引
- 改进聚类算法的MapReduce并行化研究
- 随着互联网经济的高速发展,带来了数据规模的不断增大,数据的多样性的增多,使得数据拥有了海量、异构、动态变化以及多样性的特征,给数据的挖掘工作带来了极大地困难。传统的数据挖掘方式已经不能适应现代化的需求,数据的高速发展并不...
- 董义明
- 关键词:数据挖掘
- 文献传递
- 改进K-means算法的MapReduce并行化研究被引量:7
- 2016年
- 针对K-means在处理海量数据时,因初始聚类中心的选取不确定,从而导致收敛速度过慢的问题,本文提出了改进的K-means算法,首先用模糊聚类的思想对数据集进行模糊分类,其次采用动态计算聚类中心的方式对数据集进行二次分类,最后将算法在MapReduce模型上进行了实现.实验结果表明,改进后的算法不仅提高了加速比,而且算法的收敛速度更快.
- 李兰英董义明孔银周秋丽
- 关键词:聚类MAPREDUCE加速比