您的位置: 专家智库 > >

杜思奇

作品数:4 被引量:8H指数:2
供职机构:北京信息科技大学更多>>
发文基金:北京市教委科技发展计划国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇期刊文章
  • 1篇会议论文

领域

  • 4篇自动化与计算...

主题

  • 2篇情感
  • 2篇标签
  • 1篇短语识别
  • 1篇语篇
  • 1篇语篇分析
  • 1篇情感分类
  • 1篇最大熵
  • 1篇最大熵模型
  • 1篇名词
  • 1篇名词性
  • 1篇关联规则
  • 1篇汉语
  • 1篇分析器
  • 1篇本体
  • 1篇词性

机构

  • 4篇北京信息科技...
  • 1篇清华大学

作者

  • 4篇吕学强
  • 4篇杜思奇
  • 3篇李红莲

传媒

  • 1篇计算机应用与...
  • 1篇现代图书情报...
  • 1篇情报理论与实...
  • 1篇第十三届全国...

年份

  • 2篇2016
  • 2篇2015
4 条 记 录,以下是 1-4
排序方式:
汉语组块分析在产品特征提取中的应用研究被引量:4
2015年
【目的】解决用户评论文本中的产品特征提取问题,尤其是名词性短语的识别问题。【方法】利用汉语组块分析进行产品特征提取,根据Apriori产生频繁项集以及TF-IDF阈值对候选产品特征进行过滤,得到产品特征集合,从而实现对用户评论中产品特征的自动提取。【结果】为验证该方法的有效性,以汽车评论文本为例,从中提取汽车类产品的特征,平均召回率达到76.89%,平均准确率达到84.03%。【局限】该方法的召回率较低,存在名词块识别错误的问题。【结论】实验结果表明引入汉语组块分析可以准确识别名词性短语,提高产品特征提取的准确率。
杜思奇李红莲吕学强
关键词:关联规则
基于语篇分析难度的汉语树库构建方法研究
汉语树库是一种特殊的语言数据库,它的构建目的是使计算机学习人类语言的表达方式,最终达到使计算机理解人类语言。因此语言数据库的设计、标注和收集是一项重要的工作。基于汉语树库的建设,提出了一种利用语篇分析难度来选取篇章的方法...
杜思奇李红莲周强吕学强刘殷
文献传递
基于汉语组块分析的情感标签抽取被引量:4
2016年
[目的/意义]面向电子商务领域的在线评论,通过识别产品特征和评价词之间是否存在修饰关系,抽取出在线评论中的情感标签,从而帮助网购用户迅速了解某一产品的性能。[方法/过程]引入汉语组块分析对评论文本进行初始化处理,对名词性信息以及形容词性信息进行抽取。通过最大熵对初始化集合进行过滤,从而获得最终的情感标签集合。[结果/结论]该方法对评论文本的适应性较好,可以有效抽取出情感标签。[局限]需要对语料进行初始化抽取,经过过滤后才能获得最终的情感标签集合。
杜思奇李红莲吕学强
关键词:最大熵模型
汉语组块分析在情感分类中的应用研究
2016年
网络产品评论的情感分析对网络用户的日常购买行为有着重要的决策作用,因此,如何利用细粒化的处理方法提高情感分析的准确率,成为了一个热门的研究话题。针对该问题提出一种基于汉语组块分析的情感识别方法,首先依靠汉语组块分析对汽车评论语料进行细粒化的处理并提取情感标签,再结合情感词本体和支持向量机模型对情感标签进行分类,从而实现情感倾向性的判别。实验表明,采用汉语组块分析的情感分类方法相比其他的分类算法平均准确率提高了4%。因此,基于汉语组块分析的情感分类可以降低分类器的输入特征维数,并有效提高分类器的分类性能。
杜思奇李红莲吕学强
关键词:情感分类
共1页<1>
聚类工具0