国家社会科学基金(07BYY035)
- 作品数:6 被引量:44H指数:4
- 相关作者:才让加才让卓玛才智杰才藏太更多>>
- 相关机构:青海师范大学更多>>
- 发文基金:国家社会科学基金国家重点基础研究发展计划国家语委科研项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 藏语语料库词语分类体系及标记集研究被引量:18
- 2009年
- 青海师范大学藏文信息处理与机器翻译省级重点实验室已完成1 000万字的藏语语料库的加工实验,加工的主要目的是使计算机能够对藏语语料库中的藏语词语进行自动切分和自动标注。该文在对大规模藏语语料库进行自动切分和人工分析的基础上提出了一个藏语词语分类体系和标记集。根据藏语语料库和计算机自动切分和标注的实际需要,在藏语词语分类体系的构建上,采用先分虚实,再确定大类,在大类的基础上分出小类,再分出不同深度的子类。在藏语语料库加工实验中的应用表明,该分类方法和标记集是一个比较合理和实用的。
- 才让加
- 关键词:计算机应用中文信息处理语料库
- 班智达藏文语料切分词典的建立与算法研究被引量:4
- 2009年
- 随着自然语言信息处理的不断发展和完善,大规模语料文本处理已经成为计算语言学界的一个热门话题。一个重要的原因是从大规模的语料库中能够提取出所需要的知识。而语料文本的处理与加工以语法信息词典作基础。结合藏文语料库切分标注规范,论述了对藏文语料库切分与标注用的藏文语法信息词典的建立和设计,重点讨论了该词典的内容建设、语法信息的标注、索引结构及查找算法。
- 才藏太
- 关键词:切分索引
- 藏汉句子局部对齐策略的研究
- 介绍了藏汉句子自动对齐系统及其对齐方法,详细地分析了基于平行语料的藏汉句子自动对齐问题,提出了利用大规模高效藏汉双语词典进行句子局部对齐的策略,并做了验证。
- 华却才让
- 关键词:句子对齐评价函数
- 文献传递
- 基于班智达藏文查询接口及信息抽取研究被引量:1
- 2010年
- 本文依据班智达藏语料自动分词技术,设计出班智达藏文查询接口及信息抽取总体功能结构,较详细地讨论了班智达藏文藏词性标记规范、词典库的数据结构和信息抽取的文法规则,并给出了班智达藏文查询接口的信息抽取算法。
- 华却才让才让加
- 关键词:信息抽取查询接口词类标注
- 藏文文本自动校对系统开发研究被引量:10
- 2009年
- 文本自动校对在自然语言处理领域中有着广阔的应用前景.文章通过比较分析国内外文本自动校对系统的发展现状,提出了设计现代藏文文本自动校对系统的两种方案,并就第二种方案研究了现代藏文文本自动校对系统的结构和功能设计.
- 才让卓玛才智杰
- 关键词:藏文信息处理机器翻译
- 藏语语料库加工方法研究
- 为了使藏语语料库具有规范性、统一性和实用性,提高加工的整体水平,在藏语语料库的加工过程中首先要对五花八门的藏语语料库进行整理和统一,得到高质量的原始语料库,其次确定藏语原料库加工的切分单位,然后针对藏语的语法特征提出藏语...
- 才让加头旦才让周毛先
- 关键词:藏语语料库词类词典
- 文献传递
- 藏语语料库加工方法研究被引量:13
- 2011年
- 为了使藏语语料库具有规范性、统一性和实用性,提高加工的整体水平,在藏语语料库的加工过程中首先要对五花八门的藏语语料库进行整理和统一,得到高质量的原始语料库,其次确定藏语原料库加工的切分单位,针对藏语的语法特征提出藏语语料库藏语词语类别和词类标记集,同时在对藏语词语进行归类和统计的基础上建立分词标注词典库,设计并实现藏文自动分词标注软件,利用分词标注软件对大规模藏语语料库进行切分和标注,最终实现藏语语料库的多级加工。
- 才让加
- 关键词:藏语语料库词类词典
- 基于规则的汉藏机器翻译系统中二分法的句法分析方法研究
- 本文结合973项目《支持舆情服务的汉藏机器翻译关键技术研究》的研制实践,论述了词项信息同语法规则相结合的原则,提出了以动词为中心的句法分析二分法,从而在受限语言的范围内,为建立有较大适应性的机器翻译规则系统,有效地提高机...
- 才藏太
- 关键词:机器翻译语句结构句法分析
- 文献传递
- 藏语语料库词类描述方法研究被引量:7
- 2011年
- 藏语词类的基本属性描述是藏语语料库多级加工的基础,根据藏语语料库多级加工的实际需要,通过对藏语词类的语法、语义信息的描述和藏语词语后添加方式的分析,可以为计算机对藏文的词语搭配结构、语法信息、语义信息和词类标记进行自动处理提供一个切实可行的方法。
- 才让加
- 关键词:自然语言藏文语法信息