您的位置: 专家智库 > >

江西省教育厅科技计划项目([2006]178)

作品数:2 被引量:22H指数:2
相关作者:钟茂生刘磊刘慧胡熠更多>>
相关机构:上海交通大学华东交通大学更多>>
发文基金:江西省教育厅科技计划项目国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇会议论文
  • 2篇期刊文章

领域

  • 4篇自动化与计算...
  • 1篇语言文字

主题

  • 2篇语义
  • 2篇语义相关
  • 2篇中文
  • 2篇文本分割
  • 2篇互信息
  • 2篇二分图
  • 2篇词汇
  • 1篇信息处理
  • 1篇语言模型
  • 1篇中文文本
  • 1篇中文信息
  • 1篇中文信息处理
  • 1篇主题
  • 1篇自然语言
  • 1篇文本
  • 1篇文本主题
  • 1篇计算方法
  • 1篇计算机
  • 1篇计算机应用
  • 1篇本主

机构

  • 4篇华东交通大学
  • 3篇上海交通大学

作者

  • 5篇钟茂生
  • 2篇刘磊
  • 1篇刘慧
  • 1篇胡熠

传媒

  • 1篇计算机工程与...
  • 1篇中文信息学报

年份

  • 1篇2009
  • 2篇2008
  • 2篇2007
2 条 记 录,以下是 1-5
排序方式:
词汇间语义相关关系量化计算方法被引量:20
2009年
词汇间语义关系的定量化研究是自然语言处理任务中一个重要的基础性工作。词汇间语义关系总体上分为等同关系、上下位关系、相关关系,现有的语义关系定量化工作主要集中于词汇间语义的等同关系(相似性)量化研究。该文研究和提出了量化词汇间语义相关关系的基本思路和新方法,即构造词汇相关关系二分图来求解和量化词汇间间接相关关系,该方法能够解决在统计语料中没有出现的词汇对的相关关系量化求解问题。实验结果表明,该文提出的方法比单纯用互信息来计算和量化词汇间语义相关关系更为可行。同时,对于一个特定词汇而言,该文的方法能够得到一个相关关系量化的相对合理的趋势性结果。
钟茂生刘慧刘磊
关键词:计算机应用中文信息处理互信息二分图
词汇间语义相关关系量化计算方法
词汇间语义关系的定量化研究是文本分类、信息检索和基于统计的语言模型等自然语言处理任务中一个重要的基础性工作。词汇间语义关系总体上分为等同关系、上下位关系、相关关系,现有的语义关系定量化工作主要集中于词汇间语义的等同关系(...
钟茂生刘慧刘磊
关键词:互信息二分图
文献传递
文本主题分割技术的研究进展
文本主题分割是提高信息检索效果和实现文本自动摘要的一个重要预处理步骤,如何建立分割模型、设计分割算法和提高分割算法的性能成为很多研究人员的研究焦点。文章对当前主要的文本分割技术和评价方法进行了综述,然后分析了中文文本主题...
钟茂生
关键词:文本分割
文献传递
自然语言中的对象及其处理
自然语言处理(Natural Language Processing,简称 NLP)研究的核心问题就是为机器构造自然语言的语言模型,由于自然语言的非结构化和开放性的特点,传统的规则型语言模型和基于统计的语言模型很难单独解...
钟茂生
关键词:语言模型
文献传递
基于词典词语量化关系的中文文本分割方法被引量:2
2008年
随着Internet网络资源的快速膨胀,海量的非结构化文本处理任务成为巨大的挑战。文本分割作为文本处理的一个重要的预处理步骤,其性能的优劣直接影响信息检索、文本摘要和问答系统等其他任务处理的效果。针对文本分割中需要解决的主题相关性度量和边界划分策略两个根本问题,提出了一种基于词典词语量化关系的句子间相关性度量方法,并建立了一个计算句子之间的间隔点分隔值的数学模型,以实现基于句子层次的中文文本分割。通过三组选自国家汉语语料库的测试语料的实验表明,该方法识别分割边界的平均错误概率■和最低值均好于现有的其他中文文本分割方法。
钟茂生胡熠刘磊
关键词:文本分割
共1页<1>
聚类工具0