才让叁智
- 作品数:6 被引量:14H指数:3
- 供职机构:西藏大学更多>>
- 发文基金:国家自然科学基金西藏自治区自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 藏汉英混合文档的字数统计研究被引量:2
- 2011年
- 本文针对藏文本体字符与梵源字符的结构特征,提出一种支持藏、汉、英多语言字数统计模型的新设想。
- 才让叁智安见才让
- 关键词:多文种字数统计
- 基于DIV标签分段的藏文网页正文提取研究被引量:4
- 2016年
- 文章针对藏文电子文献资源匮乏、文本资源不规整、收集困难等问题,提出了基于DIV标签分段的藏文网页正文提取算法,该算法将原始网页信息分割为页面信息中与DIV元素等量的信息段,再对段中标签等非正文信息进行删除,最终形成该页正文。实验表明,正文提取结果准确、通用性强,适用于互联网上不同模型的藏文网页。
- 才让叁智赵栋材
- 关键词:藏文网页标签
- 藏文自动排序研究综述
- 2024年
- 藏文自动排序是藏语自然语言处理领域一项重要的基础研究工作,在词典编纂、信息检索和日常办公等方面具有重要的应用价值。藏文特殊的二维非线性组合方式、词法规则和词典排序规则使得藏文自动排序比其他语种的排序更加复杂。文章对已有研究提出的藏文自动排序方法、规则、算法和模型等进行了较为全面的分析与总结,为研究人员了解藏文自动排序中的构件识别、排序规则和方法以及优化藏文自动排序相关工作提供参考。
- 才让叁智才让叁智多拉洛桑嘎登仁增多杰
- 藏文搜索引擎中的分词算法研究被引量:4
- 2013年
- 随着藏文信息技术的不断普及和发展,搜索引擎技术成为藏文信息处理一项新的研究课题。对搜集到的藏文网页文本或用户查询关键词进行理解、提取和组织等处理是搜索引擎的一项基础性工作,其中藏文分词的准确与否,直接影响到搜索引擎查询效果及查询结果列表的排序问题,因此分词成为藏文搜索引擎技术中需要解决的关键问题。文章针对藏文搜索引擎中基于字符串匹配的藏文分词技术进行研究并提出相应的解决算法。
- 才让叁智
- 关键词:藏文文本藏文分词
- 基于规则的现代藏文音节字检错研究被引量:5
- 2017年
- 藏文音节字检错是藏文文本校对的重要环节。文章通过分析现代藏文音节字,将藏文音节字分为规则音节字(遵循组件组合规则的藏文音节字)和不规则音节字(不遵循组件组合规则的音节字)两种。对规则音节字采用了音节字组件组合规则进行检错,对非规则音节字采用建立梵源藏文词典、音译藏文词典和本体非规则音节字词典进行检错。实验表明,文章提出的藏文音节字检错方法对报纸类藏文的检错率为100%。
- 才让叁智关白
- 关键词:检错