您的位置: 专家智库 > >

福建省科技计划项目(20041014)

作品数:1 被引量:4H指数:1
相关作者:吴扬扬黄臻臻更多>>
相关机构:华侨大学更多>>
发文基金:福建省科技计划项目福建省自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇特征选取
  • 1篇体裁
  • 1篇中文
  • 1篇中文网页
  • 1篇中文网页分类
  • 1篇网页
  • 1篇网页分类

机构

  • 1篇华侨大学

作者

  • 1篇黄臻臻
  • 1篇吴扬扬

传媒

  • 1篇计算机工程与...

年份

  • 1篇2007
1 条 记 录,以下是 1-1
排序方式:
基于体裁的中文网页分类的特征选取被引量:4
2007年
探讨基于体裁的中文网页分类的特征项选取问题。词汇特征方面,结合自动抽取和人工归纳的方式来获得.通过改进PAT树存储结构,进行序列挖掘来获得频繁字符串特征,使得文本分类系统摆脱对切词处理和词典的依赖,并提出了模糊字符串模式的特征表达方式。此外,特征集中融入了文本的形式特征,并根据网页的特点,引入链接信息特征。实现了基于体裁的中文网页分类系统,结果表明分类效果得到了有效的改善。
黄臻臻吴扬扬
关键词:网页分类体裁特征选取
共1页<1>
聚类工具0