搜索到15317篇“ 藏文“的相关文章
藏文被引量:7
1979年
藏文是藏语的书面形式。用它著录而流传下来的文献典籍汪洋浩瀚,成为藏族文化的一大特色。依照藏族传统的说法,认为藏文是公元七世纪时吐蕃赞普松赞干布(?—649)的文臣通米桑布扎参照梵文的某种字体创制的①。近若干年来,虽然有人对此提出怀疑。
王尧
关键词:古藏文松赞干布吐蕃时期藏语安多方言藏族文化
基于规则的藏文音节纠正算法
2025年
藏文语料库的质量是影响藏文信息处理的重要因素。通过分析藏文音节拼写规则,该文构建了针对藏文规则音节和非规则音节拼写检查的音节规则库和非规则音节字典(包括未登录词音译、本体藏文和梵音转写),并基于此提出基于规则的藏文音节纠正算法。该算法利用音节规则库和非规则音节字典对识别后的藏文音节进行拼写检查,通过规则音节构件组合规则来实现藏文音节纠正。实验结果表明,该文提出的藏文规则音节和非规则音节拼写检查算法的F_(1)值达到100%,而规则音节纠正算法的宏平均准确率达到80.43%。
普尺吕慧李妍多拉周庆国
关键词:语料库藏文音节拼写检查
基于藏文音节特征的WM多模式匹配算法
2025年
近年来,随着互联网特别是移动互联网在西藏的普及和发展,对涉藏网络舆情的治理也变得越发重要,其中最基本的方式便是敏感词检测。而多模式(字符串)匹配算法正是进行敏感词检测的核心技术手段。作为一种高效的多模式匹配算法,WM(Wu-Manber)算法以其良好的实际表现,在许多场景都得到广泛应用,该算法使用字符块跳转技术来加速匹配过程。然而藏文作为一种音节文字,其文本特性与中英文等文字存在显著差异,若直接将WM算法用于藏文多模式匹配,效果并不理想。针对这一问题,该文充分利用藏文的音节结构特性,对WM算法进行改进和优化,提出适用于藏文的多模式匹配算法——TWM(Tibetan Wu-Manber)。实验结果表明,TWM算法在藏文多模式匹配任务中,相比原始WM算法在效率和准确性上都有显著提高。
杨媛婷彭展
关键词:多模式匹配WM算法藏文处理藏文音节
基于区域特征的Transformer混合结构图像藏文描述模型
2025年
端到端的Transformer模型在中、英文图像描述数据集上取得了良好的效果,但其巨大的训练数据需求使其在规模较小的藏文数据集上效果并不理想。针对此问题,该文基于编码器—解码器架构的基线模型,引入目标检测网络和自注意力机制以替换CNN和LSTM,提出基于区域特征的Transformer混合结构模型ReT。首先,该模型将Faster-RCNN提取的图像区域特征作为Transformer编码器的输入,将经过向量化后的文本序列特征作为Transformer解码器的输入;其次,Transformer编码器和解码器各自利用自注意力机制对输入向量进行加权;最后,Transformer解码器中的交叉自注意力机制根据文本特征对图像特征进行加权,并以此生成描述。实验表明,在Flickr8k-Ti数据集上以藏文音节为基本单元进行模型的训练和验证时,相比基线模型和端到端的Transformer模型,模型ReT在CIDEr指标上分别提升10.4%和5.3%,取得了更好的效果。
周子琦黄鹤鸣才让当知夏吾吉达飞鹏
关键词:藏文音节TRANSFORMER
基于跳跃式匹配的藏文多模式匹配算法
2025年
在计算机科学的研究领域中,字符串匹配算法是基础性问题的关键一环,依据查找过程中所涉及模式串的数量差异,可细分为单模式匹配算法与多模式匹配算法这两大类别。其中,AC算法作为多模式匹配算法范畴内极具代表性且应用极为广泛的经典算法。文章通过分析AC算法及其相关改进算法,并结合藏文结构的特点,提出了一种基于跳跃式匹配的藏文多模式匹配算法—AC_BM2T算法。该算法基于当前匹配窗口末尾的2个字符,设计了一种新的模式树移动规则,使得模式树可以实现跳跃式匹配并且跳跃距离相对较大,以此提高算法执行效率。实验结果表明,在处理藏文时,AC_BM2T算法的执行时间是其他改进算法的50%~60%;在模式串数量较少时,AC_BM2T算法的执行时间是AC算法的25%~90%。
周磊超彭展
关键词:多模式匹配算法模式树
基于双向软模板方式提示学习的藏文文本分类
2025年
藏文文本分类是藏语自然语言处理中的一项基础任务,在舆情监测、新闻推送、邮件分类等领域具有重要价值。预训练语言模型加微调的方式是目前主流的文本分类方法。然而,受限于有限的藏文标注数据和计算资源,使用该方法微调更大模型进行文本分类研究变得非常困难。针对上述问题,该文提出了一种基于双向软模板方式提示学习的藏文文本分类方法。具体来说,传统的软模板方式提示学习只在输入文本嵌入向量前面添加可优化的软模板向量,但为了适应藏文语法结构,该文方法在输入文本嵌入向量首尾都进行软模板向量拼接。通过当前藏文两个主流藏文文本分类任务(情感分类、新闻主题分类)进行验证,结果表明,该文方法对于预训练语言模型(Pre-trained Language Model,PLM)的分类效果有显著提升。尤其在少样本实验中表现出色,其中,新闻主题分类的Macro-F_(1)值最高提升了5.7%,情感分类的Macro-F_(1)值最高提升了8.3%。
周明军李秉林群诺群诺
关键词:藏文
基于位置和词性特征的藏文情感三元组抽取模型
2025年
藏文情感三元组(方面词、情感词、情感极性)是细粒度情感分析的核心任务,对于深入理解藏族情感表达和趋势至关重要。但藏文的独特语言结构和文化背景导致其情感表达方式与其他语言不同,从而增加了细粒度情感分析的复杂性。为了提高藏文情感三元组的提取能力,该文提出了OpinionNet-OTE-MTL模型,该模型融合了词性信息、Word2Vec词向量和绝对位置向量,并通过双向长短时记忆网络(BILSTM)进行特征提取。其中,由于藏文词性种类较多,该文分析了大量的情感数据集并从中提取出11种词性辅助模型识别。最后,为了验证OpinionNet-OTE-MTL模型的有效性,在自构建的2000句藏文细粒度情感分析数据上进行了对比实验和消融实验。消融实验表明,词性较位置信息对模型的影响更大,其三元组抽取F1值提高了3.06百分点;对比实验结果表明将词性和位置特征融入进模型后,在情感三元组提取(Triple)任务上的精确率、召回率和F1值较基线实验提高了4.73百分点、6百分点、6.14百分点,融入词性和绝对位置信息使模型能更精确地理解藏文的语法结构和语义规则,从而提升了情感三元组分类任务的准确度。
斯曲卓嘎拥措赛鸣宇
关键词:藏文词性
中学生藏文写作教学现状与改进路径探讨
2025年
随着社会的发展与多元文化的交融,藏文作为中国少数民族语言之一,其教育地位日益受到重视。文章旨在探讨中学生藏文写作教学的现状与改进路径。通过分析当前教学过程中传统与创新教学方法的交织,揭示学生在写作兴趣与能力上的分化现象。同时,考察教学资源与技术应用所带来的机遇与限制,评估现行评价体系与反馈机制的有效性。研究发现,教学方法需在强化基础知识的同时融合创新元素,以适应学生多样化的学习需求;差异化指导能够有效激发学生的写作兴趣;技术辅助学习资源的丰富能够提升教学效果;多元化的评价与反馈体系则有助于全面提升学生的写作能力。文章最后提出了具体的改进路径,以期为优化中学生藏文写作教学提供参考依据,从而促进藏文化的传承与发展。
白玛德吉
关键词:中学生教学现状
一种高质量藏文自动问答数据集的构建方法
本发明涉及藏文自动问答技术领域,提供一种高质量藏文自动问答数据集的构建方法,包括以下步骤:1)语料收集整理;2)句法描述处理;2.1)预处理;2.2)词法分析;2.3)句法分析;3)句子模板构建;4)问句模板构建;5)数...
才智杰张洪溪
一种基于马尔科夫理论的自然场景藏文图像数据增强方法
本发明提供了一种基于马尔科夫理论的自然场景藏文图像数据增强方法,包括:识别输入信息语义;定义马尔科夫过程,该过程将训练数据逐步加入噪声扰动,形成一个马尔科夫链;定义逆马尔科夫过程,该过程使用一个神经网络模型,根据当前的扰...
于永斌王向向冯箫丁佳恒王颢梁头旦才让仁青东主尼玛扎西

相关作者

谈藏文
作品数:58被引量:692H指数:16
供职机构:首都儿科研究所
研究主题:儿童 维生素A缺乏 维生素A 影响因素 腹泻
种藏文
作品数:52被引量:237H指数:9
供职机构:福建省农业科学院
研究主题:水稻 甘薯 白叶枯病 粗毒素 条斑病
淡藏文
作品数:2被引量:1H指数:1
供职机构:首都儿科研究所
研究主题:癌症 食物防治 食疗 含钙量 健脑食物
藏文栓
作品数:2被引量:295H指数:1
供职机构:中国地质科学院矿产资源研究所
研究主题:成矿作用 钼 金矿 铜矿 铜金
曹藏文
作品数:2被引量:5H指数:1
供职机构:河北师范大学物理科学与信息工程学院
研究主题:恒星 银河系 天体物理学 矮星 星族