沈志斌
- 作品数:4 被引量:14H指数:1
- 供职机构:福州大学数学与计算机科学学院更多>>
- 发文基金:教育部留学回国人员科研启动基金福建省教育厅资助项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 文本分类中特征权重算法的改进
- TFIDF是文档特征权重表示常用方法.该方法简单易行,但忽略了特征词在各个类别中的分布情况,不能真正地反映特征词对区分每个类的贡献.针对这个不足,本文提出了BOR-TFIDF,来重新调整每个特征词对各个类别的区分度,即修...
- 沈志斌白清源
- 关键词:文本分类TFIDF特征词
- 文献传递
- 文本分类中特征权重算法的改进被引量:14
- 2008年
- TFIDF是文档特征权重表示常用方法.该方法简单易行,但忽略了特征词在各个类别中的分布情况,不能真正地反映特征词对区分每个类的贡献.针对这个不足,本文提出了BOR-TFIDF,来重新调整每个特征词对各个类别的区分度,即修正各个特征词的权重,并用分类器来验证其有效性.该方法优于原来的TFIDF算法,实验表明了改进的策略是可行的.
- 沈志斌白清源
- 关键词:文本分类TFIDF
- 基于加权修正的KNN文本分类算法
- 随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.KNN方法作为一种简单、有效、非参数的分类方法。本文分析了KNN算法在文本分类中存在的不足——分布密度和训练样本数对KNN分类效果的影响,并针时这些不足...
- 沈志斌白清源
- 关键词:文本分类KNN算法分布密度迭代
- 文献传递
- 基于加权修正的KNN文本分类算法
- 随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术。KNN方法作为一种简单、有效、非参数的分类方法。本文分析了KNN算法在文本分类中存在的不足——分布密度和训练样本数对KNN分类效果的影响,并针对这些不足...
- 沈志斌白清源
- 关键词:文本分类KNN迭代
- 文献传递