殷风景
- 作品数:29 被引量:29H指数:3
- 供职机构:国防科学技术大学更多>>
- 发文基金:国家自然科学基金湖南省自然科学基金国防科学技术大学优秀研究生创新基金更多>>
- 相关领域:自动化与计算机技术文化科学理学社会学更多>>
- 一种面向多文本集的部分比较性LDA模型被引量:5
- 2013年
- 跨时空、跨文化文本挖掘等比较性文本挖掘(comparative text mining,CTM)旨在从多个可比的文本集中发现各文本集隐含语义结构的异同.针对当前主要的CTM模型只能分析公共话题的缺陷,提出一种部分比较性跨文本集LDA模型(partial comparative cross collections LDA model,PCCLDA)来实现跨文本集的话题分析,该模型通过层次狄利克雷过程(hierarchical Dirichlet processes,HDP)把话题划分为公共话题和文本集特有话题,使模型能更加精确地对文本进行建模.模型采用Gibbs抽样方法进行参数推导,一系列包括Held-Out数据对数似然和模型困惑度指标在内的定量与定性的实验表明,模型不仅能够发现公共话题在不同文本集中的差异,而且能分析各文本集特有的话题;在Held-Out对数似然测度和模型困惑度指标上,PCCLDA相对当前两个主要的CTM模型具有较大的优势.
- 谭文堂王桢文殷风景葛斌肖卫东
- 关键词:GIBBS抽样
- 多中心多维度教学方法框架构建及其应用研究
- 2021年
- 高校教育教学实践当中广泛采用的教学方法主要有“以教师为中心”和“以学生为中心”两种。前者更能保证教学过程的高度组织性和知识体系的完整性;后者形式新颖、手段多样,更容易受到年轻学生和老师的欢迎,对学生积极性的调度也更高。近年来,伴随着对传统以教师为中心的教学模式的反思,以学生为中心的教学模式在不同教育层次和范围内得到了很多应用。然而,因为受众层次、学科方向特点、教学内容难易、课堂规模等因素的不同,很难在两种教学模式中进行简单的扬弃抉择。一种更理性、更高效的方法是根据实际情况,对课程内容在知识点层次上基于微课,以学生为中心进行学习交流,在知识体系层面上进行教师主导的体验式串联教学,既注重学生积极性调动和多维度的学习方式,又重视课程内容体系保证和课堂过程完整,打造学生与老师多中心、线上线下多维度的半翻转课堂模式。结合教学实践提出的多中心多维度的教学方法框架以及其具体应用示例,收获了良好的教学效果和学生反馈。
- 殷风景李硕豪张鑫
- 关键词:教师中心多中心多维度
- 一种面向涌现的比较性话题模型被引量:2
- 2013年
- 提出一种CDCMLDA生成模型来实现跨文本集的话题分析,采用狄利克雷组合多项式模型(Dirichlet Compound Multinomial,DCM)对文本集中词的涌现现象进行建模,把DCM模型和LDA结合起来分析文本集之间话题的差异,采用蒙特卡罗期望最大化方法进行参数推导。在多个实际数据集中通过定性和定量的方法对模型进行评价,实验表明,模型不仅能够发现不同文本集间的异同,而且在模型困惑度指标上相对当前两种主要跨文本集的话题模型具有明显的优势。
- 谭文堂王桢文殷风景葛斌肖卫东
- 一种用于含噪稀疏文本的语义关系抽取方法
- 本发明公开了一种用于含噪稀疏文本的语义关系抽取方法,包括以下步骤:建立训练样本集;构建语义关系抽取模型;训练语义关系抽取模型;建立待抽取语义的数据集;利用训练好的语义关系抽取模型从待抽取语义的数据集中提取语义关系。本发明...
- 赵翔庞宁谭真郭爱博殷风景唐九阳葛斌肖卫东
- 一种多变量扭曲时间序列预测方法
- 本发明公开了一种多变量扭曲时间序列预测方法,所述预测方法包括如下步骤:1建立训练样本集;2构建多变量时间序列卷积神经网络模型;所述多变量卷积神经网络模型至少包括依次连接的输入层、特征提取层、卷积层模块、各变量全连接层、所...
- 庞宁李旻浩赵翔肖卫东殷风景葛斌张啸宇
- 文献传递
- 一种基于改进特征融合的语义关系抽取方法
- 本发明公开了一种基于改进特征融合的语义关系抽取方法,包括以下步骤:建立训练样本集;构建语义关系抽取模型;训练语义关系抽取模型;建立待抽取语义的数据集;利用训练好的语义关系抽取模型从待抽取语义的数据集中提取语义关系。本发明...
- 庞宁谭真赵翔张啸宇殷风景唐九阳葛斌肖卫东
- 文献传递
- 一种面向网络话题发现的增量文本聚类算法被引量:16
- 2011年
- 为满足网络舆情监控系统中话题发现的需要,并克服经典single-pass算法处理网络文本聚类中受输入顺序影响和精度较低的主要不足,提出了ICIT算法,继承了single-pass算法的简单原理,保证了网络文本聚类的实时性;通过正文分词时标注词性选择名词动词进行正文向量化、建立文本标题向量来与文本正文向量共同表征文本、采用average-link策略、引入"代"的概念分批进行文本的聚类,以及在每批次聚类后添加报道重新选择调整所属的步骤来提高聚类的质量。实验证明了ICIT算法在提高话题发现准确度上的有效性和实用性。
- 殷风景肖卫东葛斌李芳芳
- 关键词:文本聚类增量聚类
- 一种面向网络敏感信息的截图取证与锁定回访的方法
- 本发明公开了一种面向网络敏感信息的截图取证与锁定回访方法,该方法包括:对所监测网站的网页数据进行采集;对网页数据进行规范化处理、基于正则表达式抽取网页标题和链接、基于网页标题和链接进行敏感信息的匹配;对敏感信息进行外页和...
- 李芳芳葛斌汤大权肖卫东殷风景贺明科封孝生谭文堂
- 文献传递
- 一种基于嵌入式特征选择的冷启动项目推荐方法
- 本发明公开了一种基于嵌入式特征选择的冷启动项目推荐方法,包括获取用户集、项目集和特征集;生成用户项目交互矩阵和项目特征矩阵;建立基于嵌入式特征选择的用户项目预测的优化模型;利用监督学习的方法,对所述的优化模型进行参数优化...
- 赵翔陈一帆谭真殷风景葛斌唐九阳肖卫东
- 文献传递
- 一种基于改进特征融合的语义关系抽取方法
- 本发明公开了一种基于改进特征融合的语义关系抽取方法,包括以下步骤:建立训练样本集;构建语义关系抽取模型;训练语义关系抽取模型;建立待抽取语义的数据集;利用训练好的语义关系抽取模型从待抽取语义的数据集中提取语义关系。本发明...
- 庞宁谭真赵翔张啸宇殷风景唐九阳葛斌肖卫东