教育部“新世纪优秀人才支持计划”(NCET-09-0685)
- 作品数:2 被引量:10H指数:1
- 相关作者:仇光卜佳俊郑淼陈纯张晖更多>>
- 相关机构:浙江大学浙江工业大学更多>>
- 发文基金:教育部“新世纪优秀人才支持计划”国家科技支撑计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于传播的产品属性抽取
- 2010年
- 针对意见挖掘中产品意见对象的获取问题,提出一种基于传播(propagation)思想的产品属性抽取方法.该方法利用产品属性与意见词(opinionword)之间,以及产品属性本身和意见词本身的关系,通过定义的规则,抽取产品属性.对属性与意见词之间的关系采用依存语法进行描述.产品属性和意见词的抽取过程不断迭代,直至无新的属性可抽取.同时,为消除传播过程中引入的噪音,提出3种相应的噪音消除策略.实验结果表明,该方法比传统的产品属性抽取方法有更高的准确率和召回率.
- 仇光郑淼卜佳俊史源陈纯
- 关键词:属性抽取依存语法
- 基于正则化主题建模的隐式产品属性抽取被引量:10
- 2011年
- 为实现产品意见挖掘中的隐式产品属性抽取,在传统主题建模思想的基础上,通过分析评论信息中不同产品属性对应的意见词分布以及意见词的主题依赖性假设,提出一种基于正则化思想的新主题建模框架.在该框架下,评论信息中的意见词特征,通过定义在不同评论中意见词的使用相似度上的正则化因子,纳入到传统的主题建模框架中.正则化的基本思想为:若2条评论在意见词的使用模式上相似,则它们评论相同的产品属性的概率越高.定性和定量2种实验结果均表明,本文的正则化主题模型较传统的主题模型算法有更高的准确率,说明本文的正则化思想是有效的.
- 仇光郑淼张晖朱建科卜佳俊陈纯杭航
- 关键词:主题建模正则化