长江学者和创新团队发展计划(IRT1068) 作品数:23 被引量:81 H指数:6 相关作者: 才智杰 才让卓玛 孙茂松 王之仓 才让加 更多>> 相关机构: 青海师范大学 清华大学 教育部 更多>> 发文基金: 长江学者和创新团队发展计划 国家自然科学基金 国家社会科学基金 更多>> 相关领域: 自动化与计算机技术 语言文字 电子电信 更多>>
面向工程的实践与创新的教学研究与应用 被引量:1 2013年 机器人技术是先进制造技术发展的重要组成.开展面向工程的实践和创新教学研究,设计并实现了垃圾分拣机器人,将理论教学和实践应用有机的结合在一起,取得了良好的效果. 王之仓 周剑昇关键词:垃圾分拣 机器人 基于PCFG的藏文疑问句句法分析 被引量:5 2019年 藏文疑问句的句法分析在藏文问答系统、搜索引擎、信息的抽取和检索等领域有着广泛的应用前景。该文通过分析藏文疑问句的构成特点,对藏文疑问句进行了分类,归纳了各类藏文疑问句的结构特征,进而利用PCFG对藏文疑问句进行了句法分析。经测试,在封闭测试集上的准确率、召回率和F1值分别达97.6%、97.3%和97.4%,在开放测试集上的准确率、召回率和F1值分别达96.0%、95.4%和95.7%。 班玛宝 才智杰 拉玛扎西关键词:疑问代词 句法分析 PCFG 基于神经网络的藏语语音合成 被引量:10 2019年 语音合成是人机交互的核心技术之一,也是中文信息处理领域的一项前沿技术。随着神经网络理论的不断深入,基于神经网络的语音合成技术越来越引起人们的关注。该文通过分析藏文字结构与藏语拼读规则,融合Sequence to Sequence模型和注意力机制,研究了基于神经网络的藏语语音合成技术。实验数据表明,该文方法在藏语语音合成上具有良好的性能表现。 都格草 才让卓玛 南措吉 算太本关键词:神经网络 SEQUENCE 一种基于向量模型的藏文字拼写检查方法 被引量:11 2018年 自动拼写检查是自然语言处理领域一项极具挑战性的研究课题,在语料库建设、文本编辑、语音和文字识别等诸多方面具有广阔的应用前景。藏文字是一种表音拼音文字,由1~7个基本构件横向和纵向拼接而成。藏文文本中非真字出现的频率很高,是藏文字拼写检查的基础和重点。该文通过分析藏文文法中的构字规则,利用藏文字向量模型将藏文字用计算机易于操作的数字(向量)表示,建立基于规则约束的藏文字向量模型,进而设计该模型下的藏文字拼写检查模型及算法。算法简单易实现,经测试算法拼写检查的平均准确率达99.995%,平均每秒检查1 060个字。 才智杰 孙茂松 才让卓玛关键词:自然语言处理 向量模型 拼写检查 藏文紧缩格识别方法 被引量:6 2019年 分词是自然语言处理的一项基础性工作,对自然语言处理的后继工作有较大的影响。紧缩格的识别是藏文分词中最难、最重要的技术之一。通过剖析已有藏文紧缩词识别方法,分析藏文字词的特征,针对性地提出了识别藏文紧缩格的规则算法、添加—还原算法和最大熵模型的特征模板,从而得到基于规则、添加还原法与最大熵模型相结合的藏文紧缩格识别方法。实验数据表明,该方法识别藏文紧缩格的准确率、召回率和F1值分别达99. 26%、96. 47%、97. 85%,比现有最高的准确率有了较明显的提高。 拉玛扎西 才智杰 扎西吉关键词:藏文 自然语言处理 分词 一种基于TC_LSTM的藏文词拼写检查方法 被引量:5 2020年 拼写检查能够快速检测文本错误,提高文本校对效率,在语料库建设、文本编辑、语音和文字识别等诸多方面具有广阔的应用前景。该文在分析藏文拼写检查技术和语言模型的基础上,以藏文词拼写检查为目标,选用具有长远距离记忆功能的LSTM建立TC_LSTM语言模型,设计基于TC_LSTM的藏文词拼写检查算法。经测试,基于TC_LSTM语言模型的藏文词拼写检查取得了较好的效果。 华旦扎西 才智杰 班玛宝关键词:自然语言处理 拼写检查 藏文字符的向量模型及构件特征分析 被引量:6 2016年 藏文字属性分析是藏文信息处理的一项基础性工作,对藏文信息处理的研究和藏语文教学具有重要的参考价值及指导意义。藏文字是一种特殊的拼音文字,由1~7个基本构件横向和纵向拼接而成。因而藏文字符的属性包括其组成的构件及其构件的位置特征,以及藏文字的使用频度、结构、字长等属性特征。该文通过分析藏文字的结构,分别建立了藏文字及藏文字符串的向量模型VMTT、VMTS和藏文字符串的稀疏域模型SLM,并在向量模型和稀疏域模型上研究了藏文字符的构件特征。 才智杰 才让卓玛关键词:中文信息处理 向量模型 藏语语音合成单元选择 被引量:5 2015年 基于语料库的语音合成是国内外应用广泛的语音合成方法.在这种合成方法中,单元选择是语音合成的关键.通过分析藏语言文字的属性特征,设计了藏语语音合成系统模型,提出以构件、组合构件、字、词及句单元相融合的藏语语音合成方法,有效地保留了语音合成中大单元的完整性和小单元的灵活性与鲁棒性.同时,给出语音合成的单元选择策略与算法.实验数据表明:该策略与算法是有效和合理的,所选择的单元在封闭语料和开放语料上的覆盖率均达到预期目标. 才让卓玛 李永明 才智杰关键词:音素 基于混合策略的藏文虚词识别方法 2019年 藏文虚词在歧义消解、句法、句型和语义处理等方面起着重要的语法作用。该文在分析传统藏文虚词研究成果的基础上,统计了面向自然语言处理的藏文虚词及特征,提出了基于规则和最大熵模型相结合的藏文虚词识别策略。实验表明,该方法识别藏文虚词的准确率、召回率和F1值分别达98.39%、98.75%、98.57%。 拉玛扎西 才智杰 班玛宝关键词:自然语言处理 最大熵模型 藏文词向量相似度和相关性评测集构建 被引量:5 2019年 词向量评测是词向量研究的基础,包括内部评测(intrinsic evaluation)和外部评测(extrinsic evaluations)。外部评测是将得到的词向量应用到具体某个任务中进行评测,是词向量研究的目标。内部评测是通过建立词之间的语义相似度或相关性能力的评测集,评价词向量模型的性能,是一种常用的词向量评测方式。该文通过分析英文、汉文词向量评测集构建方法,结合藏文的特点,研究藏文词向量评测集构建方法,构建了用于评价藏文词向量相似度和相关性的评测集TWordSim215和TWordRel215,并分析其有效性。 才智杰 孙茂松 孙茂松关键词:自然语言处理 藏文