王芳
- 作品数:4 被引量:5H指数:1
- 供职机构:江西财经大学信息管理学院更多>>
- 发文基金:江西省自然科学基金国家自然科学基金江西省教育厅科学技术研究项目更多>>
- 相关领域:自动化与计算机技术文化科学语言文字更多>>
- 基于互信息的中文完整词自动识别模型
- 1引言随着信息时代的到来,信息检索在人们的生产生活各个方面已经起着越来越大的作用。经过几十年的研究,中文自动分词技术已取得了令人瞩目的成果。例如,文[4]利用句内相邻字之间的互信息及t-测试差这两个统计量计算其成词
- 王芳万常选
- 文献传递
- 基于XML检索解析的分词方法研究被引量:1
- 2008年
- 分词技术是影响信息检索查准率和查全率的一个重要方面,也是信息检索技术的关键问题和难点之一。针对信息检索中,某些单词整体组合更有意义、更能体现用户查询意图的情况,给出完整词概念,提出了完整词查询识别的基本方法及其改进方法,最后还给出了三种进行预识别完整词的方法,并讨论了它们各自的优缺点。
- 王芳万常选
- 关键词:分词XML查询关联规则
- 基于可信度的中文完整词自动识别被引量:4
- 2009年
- 中文自动分词是中文信息检索中预处理工作的一部分,也是中文信息检索技术中的重要问题之一。针对在信息检索中完整词整体表达更有意义、更能体现用户查询目的的问题,结合完整词的成词特点,将互信息和完整词前后缀的计算,与组成完整词的可信度相关联,提出基于可信度的三种中文完整词自动识别方法,分别构成基于全信度、偏信度,以及前两者加权平均的混信度的完整词识别方法,设计及实现了基于可信度的三种完整词自动识别中文分词原型系统。最后给出了对第二届SIGHAN(2005)北京大学测试集语料的各项实验测试结果和分析,结果表明该原型系统的识别性能良好,且能同时满足多种性能的需求。
- 王芳王芳
- 关键词:计算机应用中文信息处理中文分词互信息自动识别
- 基于可信度的中文完整词自动识别
- 中文自动分词是中文信息检索中预处理工作的一部分,也是中文信息检索技术中的重要问题之一。针对在信息检索中完整词整体表达更有意义、更能体现用户查询目的的问题,结合完整词的成词特点,将互信息和完整词前后缀的计算,与组成完整词的...
- 王芳万常选
- 关键词:中文分词互信息自动识别
- 文献传递