韩楠
- 作品数:3 被引量:3H指数:1
- 供职机构:重庆大学更多>>
- 发文基金:重庆市高等教育教学改革研究项目中央高校基本科研业务费专项资金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 云计算环境下基于代表点增量层次密度聚类的微博事件检测及跟踪被引量:3
- 2013年
- 为从微博服务平台产生的大量实时信息中抽取新闻事件,提出了一套完整的云计算环境下的微博事件检测跟踪算法。首先采用新的基于微博转发数和评论数的权值计算方法,将微博文本表示成向量空间模型;再利用基于代表点的增量层次密度聚类(RIHDBSCAN)算法抽取关键词,最终实现新闻事件的检测和跟踪。针对单一节点无法快速高效地处理海量微博数据的问题,将算法部署在云计算平台Hadoop上。通过在新浪微博平台上获取的真实数据进行实验,结果表明,所提出的权值计算方法比TF-IDF和UF-ITUF有更高的性能,并且云框架的使用较好地提高了处理速度,适合用于海量数据的分析和挖掘。
- 冯永韩楠贾东风
- 关键词:密度聚类算法云计算HADOOP平台代表点
- 云计算环境下基于代表点增量层次密度聚类的微博事件检测及跟踪
- 为从微博服务平台产生的大量实时信息中抽取新闻事件,提出了一套完整的云计算环境下的微博事件检测跟踪算法.首先采用新的基于微博转发数和评论数的权值计算方法,将微博文本表示成向量空间模型;再利用基于代表点的增量层次密度聚类(R...
- 冯永韩楠贾东风
- 关键词:云计算向量空间模型数据挖掘
- 文献传递
- 云环境下基于RIHDBSCAN的微博事件检测及跟踪
- 微博近几年有着飞速的发展和广泛的影响。用户通过网页、手机、SMS等多种途径,随时随地记录见闻时事、参与话题讨论等。对实时产生的大量微博文本进行分析和挖掘具有风险预警、舆论监控等重要实际意义,也给文本挖掘领域带来了新的挑战...
- 韩楠
- 关键词:密度聚类云计算技术数据挖掘
- 文献传递