您的位置: 专家智库 > >

柯丽

作品数:3 被引量:3H指数:1
供职机构:江西师范大学计算机信息工程学院更多>>
发文基金:江西省自然科学基金国家自然科学基金江西省教育厅青年科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇期刊文章
  • 1篇学位论文

领域

  • 3篇自动化与计算...

主题

  • 2篇语言
  • 2篇网页
  • 2篇网页自动分类
  • 2篇跨语言
  • 2篇共现
  • 2篇贝叶斯
  • 2篇贝叶斯分类
  • 1篇多语
  • 1篇多语言
  • 1篇特征加权
  • 1篇网页分类
  • 1篇聚类
  • 1篇加权
  • 1篇半监督聚类

机构

  • 3篇江西师范大学
  • 1篇江西财经大学

作者

  • 3篇柯丽
  • 2篇黎佳
  • 2篇何世柱
  • 2篇王明文
  • 1篇罗远胜

传媒

  • 1篇江西师范大学...
  • 1篇广西师范大学...

年份

  • 3篇2011
3 条 记 录,以下是 1-3
排序方式:
基于特征加权的半监督聚类研究
2011年
目前在半监督聚类的研究中,尤其是当有类标信息的类的数量少于整个数据集的类的数量时,其聚类效果并不好。本文在现有半监督聚类技术的基础上,通过特征加权来提高同一类文档的相似性,从而得到更好的聚类效果。为了验证这一思想的有效性,实验不仅在单语言数据集上进行,还在中、英双语数据集上进行了只包含中文或英文类标时的聚类实验。实验结果表明,该方法体现出良好的性能。
黎佳王明文何世柱柯丽
关键词:特征加权多语言半监督聚类
基于频率共现熵的跨语言网页自动分类研究被引量:3
2011年
研究了基于频率共现熵的跨语言网页自动分类问题,使用翻译软件将所有中文网页翻译为英文,计算中文和英文网页的共现特征频率共现熵值,确定中文和英文网页的共现知识,并与英文网页相结合训练中文分类模型.实验结果表明,该方法与贝叶斯分类模型、向量空间分类模型和信息瓶颈模型相比体现出良好的性能.
柯丽王明文何世柱黎佳罗远胜
关键词:跨语言网页分类贝叶斯分类
基于频繁共现熵的跨语言网页自动分类研究
网页自动分类可有效的提高互联网信息的组织与应用,在建立网页自动分类模型时,需要大量的可信的已标注数据集。相对中文网页来说网页数量增长迅速,已标注数据集缺乏,然而数据集标注又是项费时费力的工作,相对英文网页而言,有较多的已...
柯丽
关键词:跨语言网页自动分类贝叶斯分类
共1页<1>
聚类工具0