您的位置: 专家智库 > >

周强

作品数:6 被引量:196H指数:5
供职机构:北京大学信息科学技术学院计算语言学研究所更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 5篇期刊文章
  • 1篇会议论文

领域

  • 5篇自动化与计算...

主题

  • 5篇语料
  • 5篇语料库
  • 4篇汉语
  • 2篇语言学
  • 2篇汉语语料库
  • 1篇短语标记
  • 1篇语词
  • 1篇语料库加工
  • 1篇语料库语言学
  • 1篇语言
  • 1篇语言处理
  • 1篇树库
  • 1篇数据库
  • 1篇数据库建设
  • 1篇数据库系统
  • 1篇统计学
  • 1篇自然语言
  • 1篇自然语言处理
  • 1篇自然语言处理...
  • 1篇基于语料

机构

  • 6篇北京大学

作者

  • 6篇周强
  • 2篇俞士汶
  • 1篇张伟

传媒

  • 4篇中文信息学报
  • 1篇计算机科学
  • 1篇全国第二届计...

年份

  • 2篇1997
  • 1篇1996
  • 2篇1995
  • 1篇1993
6 条 记 录,以下是 1-6
排序方式:
汉语短语的自动划分和标注被引量:29
1997年
考虑到传统的基于规则的汉语分析器对大规模真实文本的分析所遇到的困难,本文在使用统计方法进行汉语自动句法分析方面作了一些探索,提出了一套基于统计的汉语短语自动划分和标注算法。它分为预测划分点、括号匹配和分析树生成等三个处理阶段,其间利用了从人工标注的树库中统计得到的各种数据进行自动句法排歧,最终得到一棵最佳句法分析树,从而可以自顶向下地完成对一句句子的短语自动划分和标注,对一千多句句子的封闭测试结果表明,短语划分的正确率约为86%,短语标注的正确率约为92%,处理效果还是比较令人满意的。
周强
关键词:语料库加工汉语短语
汉语短语标注标记集的确定被引量:46
1996年
本文提出了一个汉语短语标注的基本标记集,并从句法功能和结构组成方面对不同短语的性质进行了深入的分析和探讨,以期为汉语短语划分和标注的自动处理和人工校对提供一个统一的处理标准。
周强俞士汶
关键词:汉语汉语语料库
一种切词和词性标注相融合的汉语语料库多级加工方法
周强俞士汉
关键词:语料库数据库建设汉语计算语言学
汉语树库的构建被引量:45
1997年
本文讨论了汉语树库构建的若干基础问题,包括一个适合于自动分析和人工标注的汉语句法标记集、汉语树库加工处理规范和人机互助的树库加工模型,介绍了一个已经实现的汉语自动句法标注系统,和在此基础上进行的一些树库构建实验,最后提出了构建大规模汉语树库的设想。
周强张伟俞士汶
关键词:树库语料库语言学数据库系统
基于语料库和面向统计学的自然语言处理技术被引量:45
1995年
1引言 语料库语言学(Corpus Linguistics)是八十年代才崭露头角的一门新的计算语言学分支学科.它研究机器可读的自然语言文本的采集、存储、检索、统计、语法标注、句法语义分,以及具有上述功能的语料库在语言定量分析、词典编纂。
周强
关键词:自然语言处理语料库统计学
规则和统计相结合的汉语词类标注方法被引量:61
1995年
本文分析了汉语的多类词现象与汉语词类标注的困难,介绍了汉语词类标注中的规则排歧和统计排歧的处理策略以及规则和统计相结合的处理思路。按此思路设计的软件系统,对封闭语料和开放语料的标注正确率分别达到了96.06%和95.82%。
周强
关键词:汉语语料库词类标注
共1页<1>
聚类工具0