张世荣
- 作品数:3 被引量:21H指数:2
- 供职机构:大连理工大学国家示范性软件学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于潜在语义索引的SVM文本分类模型被引量:4
- 2009年
- 本文将潜在语义索引理论与支持向量机方法相结合,对文本向量各维与文本的语义联系进行特征抽取,建立了完整的基于潜在语义索引的支持向量机文本分类模型,分析了该方法与分词的维数以及SVM惩罚因子选择之间的关系。并在NN-SVM分类算法的基础上,通过计算样本点与其最近邻点类别的异同以及该点与其k个同类近邻点在核空间的平均距离来修剪混淆点,提出了一种改进的NN-SVM算法:KCNN-SVM算法。利用该算法对降维后的训练集进行修剪。实验表明,用新的模型进行文本分类,与单纯支持向量机相比,受到文本分词维数以及支持向量机惩罚因子的影响更小,其分类正确率更高。
- 郭武斌周宽久张世荣
- 关键词:支持向量机核空间潜在语义索引文本分类
- 支持向量机分类算法研究被引量:15
- 2009年
- 支持向量机在处理两类分类问题时,当两类样本混杂严重时会降低分类精度。在NN-SVM分类算法的基础上,通过计算样本点与其最近邻点类别的异同以及该点与其k个同类近邻点在核空间的平均距离修剪混淆点,进而提出了一种改进的NN-SVM算法——KCNN-SVM。实验数据表明,KCNN-SVM算法与SVM以及NN-SVM相比,有着更高的分类精度和更快的训练、分类时间。
- 周宽久张世荣
- 关键词:支持向量机核空间文本分类
- 支持向量机文本分类算法研究
- 支持向量机(SVM)作为一种基于统计学习理论的新型机器学习方法,不仅较好地解决了非线性、高维数、小样本集合、局部极小点等问题,同时相对于神经网络有更高的泛化能力,是机器学习领域新的研究热点。文本分类是一种基于内容的自动信...
- 张世荣
- 关键词:支持向量机核空间语义索引文本分类
- 文献传递