高铖
- 作品数:4 被引量:121H指数:3
- 供职机构:长春理工大学更多>>
- 发文基金:吉林省科技发展计划基金国家自然科学基金更多>>
- 相关领域:文化科学自动化与计算机技术更多>>
- 网络舆情观点提取的LDA主题模型方法被引量:51
- 2015年
- [目的/意义]无处不在的网络舆情信息深深影响甚至误导网络受众,探讨揭示网络舆情观点的方法,旨在拓展用户的认知深度和广度,提高大众对舆论的辨识能力。[方法/过程]从技术上对比分析观点提取方法间的差异,从认知上阐释网络舆论平台的群体智慧和受众个体的认知过程,进而明确LDA主题模型提取舆情观点的优势及路径。[结果/结论]结合舆论主题和情感因素,基于LDA的网络舆情观点提取,可从海量评论中判定深度评论,摘取主要观点,借助群众智慧,有效拓展个体思想和认知,为从大规模舆情中有序呈现受众观点提供新路径,也为舆情监测与疏导提供切实的依据。
- 陈晓美高铖关心惠
- 关键词:网络舆情LDA主题模型语义
- 基于Hadoop的大规模社交网络分析方法及其分析平台
- 本发明提供了一种基于Hadoop的大规模社交网络分析方法及其分析平台,包括以下步骤:1)、获取社交网络中的原始数据,并将原始数据进行存储;2)、对所述原始数据进行统一化处理,使得原始数据生成固定格式的数据文件;3)、对数...
- 王鹏杨迪李松江杨华民邱宁佳高铖
- 文献传递
- 基于LDA模型的文本聚类研究被引量:68
- 2015年
- 在Web2.0时代,网络文本数据呈现爆炸式增长,传统的文本聚类模型存在数据维数过高,数据稀疏,缺乏语义理解等问题。针对以上问题,本文提出了一种基于LDA模型,通过Gibbs算法估计文本的主题概率分布,利用JS(Jensen-Shannon)距离作为文本的相似性度量,然后采用层次聚类法进行聚类。实验得到较高的聚类纯度(Purity)和Fscore值,表明该方法是有效的。
- 王鹏高铖陈晓美
- 关键词:文本聚类LDA模型文本相似度层次聚类
- 基于边分类的SVM模型在社区发现中的研究被引量:3
- 2015年
- 社区发现是复杂网络研究的重要内容,也是分析网络结构的重要途径。分析了社区发现研究中存在的问题,提出了一种基于边分类的SVM模型。通过边顶点相似度和边介数来表示边的特征,从而构造分类函数。利用LFR生成社区结构已知的人工网络,通过人工网络数据训练基于边分类的SVM模型,对分类函数的参数进行估计,利用训练模型对真实网络进行社区分类并通过标准化互信息(NMI)和整体准确度来评价分类效果。实验得到了较高的整体准确度和NMI值。实验表明基于边分类的SVM训练模型对真实网络数据的社区划分有较高的准确度,表明该方法是可行的。
- 王鹏高铖杨华民
- 关键词:SVM模型