刘海池
- 作品数:4 被引量:5H指数:2
- 供职机构:国防科学技术大学计算机学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 关系数据库模式到本体映射的研究
- 随着生物工程领域各种技术的飞速发展,生物数据呈指数级增长。如何对这些分布、异构、自治的生物数据库进行快速有效的整合,提供数据查询服务成为生物信息研究的一个热点问题。为了解决目前生物数据集成查询中遇到的问题,作者所在课题组...
- 刘海池
- 关键词:数据集成本体元数据
- 文献传递
- Linked Data数据集的主题模型建立方法被引量:1
- 2017年
- 提出了建立Linked Data数据集主题模型的方法.首先,将数据集中的RDF陈述三元组转换成主谓宾结构的语句,从而将Linked Data数据集转化为文本文档;然后,使用LDA算法对所有数据集的文本文档进行主题建模,即可得到每个数据集的主题向量,该向量就是描述数据集内容主题的特征.在Linked Data数据集链接目标推荐问题上,引入数据集的主题特征进行实验.使用数据集主题向量的余弦相似度替换基于记忆的协同过滤推荐算法中的相似度计算模块.结果表明,推荐效果比原始的协同过滤算法有很大提升.
- 刘海池王挺唐晋韬宁洪魏登萍刘培磊
- 关键词:DATA数据集主题模型LDA推荐系统协同过滤
- 基于词向量语义聚类的微博热点挖掘方法被引量:2
- 2018年
- 随着社交媒体的迅速发展,信息过载问题越发严重,因此如何从海量、短小而充满噪声的社交媒体数据中发现和挖掘出热点话题或者热点事件成为一个重要的问题。结合社交媒体数据实时性、地理性、包含较多元数据等特点,提出了用户行为分析与文本内容分析相结合的热点挖掘方法。在内容分析过程中,提出了从更细的词语粒度进行聚类,以代替传统的在消息粒度进行聚类的经典方法。为了提高话题关键词提取的效果,引入了基于词向量技术,并通过语义聚类的方法进行热点挖掘。在真实数据集上的实验结果表明,该方法提取的关键词语义关联性强、话题划分效果好,在主要指标上优于传统的热点挖掘方法。
- 刘培磊唐晋韬王挺谢松县岳大鹏刘海池
- 关键词:社交媒体语义聚类