您的位置: 专家智库 > >

沈志斌

作品数:4 被引量:14H指数:1
供职机构:福州大学数学与计算机科学学院更多>>
发文基金:教育部留学回国人员科研启动基金福建省教育厅资助项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇会议论文
  • 1篇期刊文章

领域

  • 4篇自动化与计算...

主题

  • 4篇文本分类
  • 2篇迭代
  • 2篇文本分类算法
  • 2篇TFIDF
  • 2篇KNN
  • 1篇特征词
  • 1篇分布密度
  • 1篇KNN算法

机构

  • 4篇福州大学

作者

  • 4篇白清源
  • 4篇沈志斌

传媒

  • 1篇南京师范大学...
  • 1篇第二十五届中...
  • 1篇第三届江苏计...

年份

  • 4篇2008
4 条 记 录,以下是 1-4
排序方式:
文本分类中特征权重算法的改进
TFIDF是文档特征权重表示常用方法.该方法简单易行,但忽略了特征词在各个类别中的分布情况,不能真正地反映特征词对区分每个类的贡献.针对这个不足,本文提出了BOR-TFIDF,来重新调整每个特征词对各个类别的区分度,即修...
沈志斌白清源
关键词:文本分类TFIDF特征词
文献传递
文本分类中特征权重算法的改进被引量:14
2008年
TFIDF是文档特征权重表示常用方法.该方法简单易行,但忽略了特征词在各个类别中的分布情况,不能真正地反映特征词对区分每个类的贡献.针对这个不足,本文提出了BOR-TFIDF,来重新调整每个特征词对各个类别的区分度,即修正各个特征词的权重,并用分类器来验证其有效性.该方法优于原来的TFIDF算法,实验表明了改进的策略是可行的.
沈志斌白清源
关键词:文本分类TFIDF
基于加权修正的KNN文本分类算法
随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.KNN方法作为一种简单、有效、非参数的分类方法。本文分析了KNN算法在文本分类中存在的不足——分布密度和训练样本数对KNN分类效果的影响,并针时这些不足...
沈志斌白清源
关键词:文本分类KNN算法分布密度迭代
文献传递
基于加权修正的KNN文本分类算法
随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术。KNN方法作为一种简单、有效、非参数的分类方法。本文分析了KNN算法在文本分类中存在的不足——分布密度和训练样本数对KNN分类效果的影响,并针对这些不足...
沈志斌白清源
关键词:文本分类KNN迭代
文献传递
共1页<1>
聚类工具0