国家自然科学基金(61272367)
- 作品数:27 被引量:169H指数:9
- 相关作者:叶施仁杨长春王晖朱明峰周猛更多>>
- 相关机构:常州大学江苏医药职业学院更多>>
- 发文基金:国家自然科学基金江苏省科技厅基金江苏省研究生培养创新工程项目更多>>
- 相关领域:自动化与计算机技术文化科学电子电信自然科学总论更多>>
- 基于weight-pooling词向量的上下文广告推荐算法被引量:1
- 2016年
- 提出一种基于weight-pooling词向量的上下文广告推荐算法,利用用户访问记录的互信息权重,计算weight-pooling词向量的余弦相似度。该算法改进了传统基于关键词匹配的推荐算法,避免了数据稀疏性和冷启动问题。通过实验分析,基于weightpooling词向量的上下文广告推荐算法在推荐效果上明显优于传统算法。
- 杨长春王俊袁敏雷晨阳
- 关键词:相似度
- 基于PSO-SVM算法的长微博贴图识别方法被引量:1
- 2013年
- 微博由于字数的限制,当用户需要发较多内容时通常以附图的形式给出,识别包含文本内容贴图的长微博能够为微博研究提供更多有用的数据。在支持向量机(SVM)的基础上结合粒子群算法(PSO)提出了一种识别长微博贴图的PSO-SVM算法。该方法提取长微博贴图的颜色矩和灰度共生矩阵特征,然后利用PSO算法对SVM模型中的误差惩罚参数和核函数进行优化得到最佳分类模型,其最优参数将被用作长微博贴图和非长微博贴图进行分类。实验表明,与传统的基于网格搜索法优化的SVM算法相比,PSO-SVM算法对长微博贴图识别具有更高的准确率和召回率。
- 刘平叶施仁杨长春侯振杰肖飞
- 关键词:支持向量机粒子群优化算法
- 基于fcmpCNN模型的网络文本情感多分类标注被引量:2
- 2018年
- 针对网络文本情感分析,提出了一种基于全卷积—多池化单元的卷积神经网络模型,实现情感多分类标注。无须手动指定多种上下文窗口大小和尽量保留文本的多层次语义,模型通过堆叠多级全卷积—多池化单元,提取出文本特征向量。该文本特征向量包含多个抽象级别、多种上下文窗口大小和不同层次语义的文本特征。模型最后基于此向量计算情感多分类标注。实验表明,模型的网络文本情感多分类标注正确率达到56. 3%,与同类模型比较,提高了情感多分类标注的正确率。
- 周锦峰叶施仁王晖
- 关键词:情感分析卷积神经网络
- 基于R-C模型的多分区权值约简微博社区检测算法被引量:1
- 2016年
- 传统社区检测算法直接引入第三方算法会降低计算效率。为此,基于R-C模型,设计多分区权值约简有限区间限定算法进行微博社区检测。研究微博社区发现R-C模型,分析参数加权约简曲线性质,借鉴凸优化问题解决方案,提出一种适用于多数参数值的最优分区求解算法。通过分区断点顺序搜索将参数范围限定在一组有限区间内,其中每个参数对应唯一的最优加权约简值,并且实现分区参数的同步优化,从而解决单一分区不利于更多信息均衡的问题。从新浪微博中获取数据集进行实验,结果表明,与基于主题与链接关系或基于标签传播的微博社区检测算法相比,该算法可更准确地检测用户微博社区。
- 杨长春王巍巍叶施仁沈永梅
- 关键词:凸优化
- 基于SVM的新浪微博营销类水帖识别研究被引量:5
- 2015年
- 研究一种发现水帖的分类算法.该方法利用SimHash方法将发帖重复当成类似网页去重的问题处理,发帖内容的重复度和其他特征,如发帖的密集型、帐号名称的相似性,所使用的客户端等特征将用于水帖与正常发帖的分类.该文利用新浪微博API下载多个汽车营销账号下的交互数据作为实验数据,并使用SVM作为分类器.实验结果表明,该方法能够较好地发现那些伪装性非常好的水军所发布的水帖.
- 叶施仁孙宁
- 关键词:支持向量机
- 基于Lex-PageRank的微博摘要优化方法被引量:1
- 2016年
- 当前,由于全民自媒体兴起而引发了巨大的舆情危机,如何高效快速地从海量的碎片化信息中发现热点并抽取实用信息成为一项重大的挑战。在此背景下,提出一种基于Lex-PageRank的微博摘要优化方法,在该方案中,以聚类结果作为实验数据,从微博影响力周期的时间特性和权重属性考虑,提出改进的Lex-PageRank算法,从聚类结果中抽取若干文本组织生成摘要。在新浪微博数据基础上进行的对比实验表明,本方案可以有效地从大量文本中提取出关键信息。
- 朱明峰叶施仁叶仁明
- 基于改进完全子图模型的关注对象多社区发现研究
- 2016年
- 为实现用户和关注对象的多社区划分,针对完全子图模型不能进行多类分类的缺陷,该文引入了阈值划分方法,提出基于改进完全子图模型的社区发现算法。实验表明:与经典数据挖掘算法K-medoids相比,该文算法具有更高的准确性。
- 封红旗雷晨阳沈田予杨长春
- 关键词:数据挖掘算法
- 一种新的微博社区发现算法
- 2017年
- 在舆情分析、微博营销和个性化推荐等方面,微博社区发现的研究都具有重要的应用价值。为了准确而有效地发现微博社交网络中的社区,提出一种基于信任关联度的微博社区发现算法(TRKM算法)。该算法通过微博用户的评论、转发、原创微博等属性来构造节点间信任关联度,再利用微博社区的模块度对网络社区划分效果进行评价。在新浪微博明星和普通用户数据集上进行实验,并将TRKM算法与传统K-means算法作比较。实验表明,该算法能够更有效地发现微博用户关系网络中的社区结构。
- 杨长春刘玲李雪佳吕晨顾寰
- 一种新的新浪微博好友推荐算法被引量:5
- 2014年
- 鉴于新浪微博现有好友推荐机制的不足,提出一种新的新浪微博好友推荐算法。研究微博社区结构和权威用户对好友推荐的影响。在同一微博社区中,通过查找权威用户,并结合用户之间的兴趣相似度和信任度进行好友推荐。推荐过程中两次计算了用户的兴趣相似度并引入用户间信任度传播模型。通过跟踪多组新浪微博目标用户,将新浪微博提供的好友推荐列表和该算法推荐的好友列表作对比,实验表明该算法具有更好的推荐效果。
- 杨长春杨晶丁虹
- 关键词:兴趣相似度信任度
- 关于微博平台特征信息优化检测仿真研究
- 2017年
- 对微博平台特征信息优化检测的研究,可对海量微博信息中所需信息进行高效检索。对特征信息优化检测的过程,需要对信息重排,并进行主成分特征提取,完成对特征信息的检测。传统方法结合相关性检验,对样本信息流进行处理和分析,但忽略了对信息的主成分进行特征提取,导致检测精度偏低。提出基于萤火虫优化神经网络的微博平台特征信息优化检测仿真。采用自回归移动平均模型对统计得到的微博平台特征信息进行信息重排,对重排的微博特征信息信息流采用神经网络训练方法进行主成分特征提取,对提取的主成分特征采用优化的萤火虫算法进行特征筛选和自组织监督学习,实现微博平台信息的优化检测。仿真结果表明,采用上述方法进行微博信息准确检测准确度较高,需要的先验样本知识相对较小,检测的可靠度得到保证。
- 陆含波杨长春
- 关键词:特征信息