您的位置: 专家智库
>
资助详情>
国家自然科学基金(60575032)
国家自然科学基金(60575032)
- 作品数:6 被引量:42H指数:4
- 相关作者:陶建华黄力行康永国辛乐赵礼悦更多>>
- 相关机构:中国科学院自动化研究所中国科学院更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术电子电信理学更多>>
- 汉语对话语气韵律建模方法的研究
- 本文构建了一个普通话对话语气韵律模型。在构建该对话语气韵律模型的过程中,本文借鉴了现有陈述语气韵律模型的研究成果,同时针对对话语气所独有的特点对其进行了扩展。与陈述语气相比,对话语气最明显的特点在于其具有较快的语速和较窄...
- 于剑黄力行陶建华
- 关键词:语音合成
- 文献传递
- 基于最大熵模型的多音字消歧
- 字音转换是语音合成系统必不可少的模块,而多音字消歧则是字音转换的核心问题。本文选择了33个常见常错的多音字作为研究对象,使用最大熵模型来辨析多音字的读音。在特征选择方面,本文比较了不同领域的多种关键词选择的方法,采用似然...
- 刘方舟施勤陶建华
- 关键词:字音转换多音字最大熵模型决策树
- 文献传递
- 一种混合使用连续HMM和离散HMM的HTS合成系统
- 传统的基于隐马尔可夫模型(HMM)的语音合成系统(HTS)存在两个问题,分别是时域的过平滑问题和频域的过平滑问题。为了解决这两个问题,本文提出了一种同时利用连续隐马尔可夫模型和离散隐马尔可夫模型的合成系统框架。传统的HT...
- 于剑张蒙陶建华王霞
- 关键词:语音合成隐马尔可夫模型语音处理
- 文献传递
- 基于混合映射模型的语音转换算法研究被引量:16
- 2006年
- 分析了语音转换研究中使用高斯混合模型映射算法时转换特征出现过平滑的问题,认为协方差矩阵估计不准确导致的转换特征细节信息的丢失是产生过平滑问题的主要原因,提出了使用码本映射和高斯混合模型共同转换声学特征细节的混合映射算法。此外提出了利用音素信息进行快速高斯混合模型训练的训练方法。客观评价表明使用音素信息的训练方法比常规方法性能指标平均提高了12.87%,而混合映射算法在使用音素信息的训练方法基础上比传统高斯混合模型转换算法性能指标提高了27.13%
- 康永国双志伟陶建华张维
- 关键词:高斯混合模型映射模型语音转换映射算法性能指标
- 基于约束模型的韵律短语预测被引量:7
- 2007年
- 本文提出了基于语法约束和长度约束的韵律短语预测模型。在语法约束模型中,我们引入了组块作为基本的节律分析单元。韵律短语的长度约束模型是利用隐马尔科夫模型对语句中韵律短语的长度规划进行建模,这个模型对短语的长度分布及韵律词与韵律短语的关系进行了描述。最后,利用一个称为k-候选的方法来融合这两个约束模型。整个方法充分利用了韵律短语的语法约束和长度约束,并将之有机地结合起来。试验表明,该预测模型达到了很好的效果,韵律短语边界识别的调和平均值达到82.9%。
- 董宏辉陶建华徐波
- 关键词:计算机应用中文信息处理韵律短语
- 自适应权重的双模态情感识别被引量:10
- 2008年
- 情感识别是人机交互领域的重要问题之一。语音和脸部肌肉动作信息是用于情感识别的2个最重要的模态。该文认为,在双模态情感识别中,给不同的特征赋予不同的权值有利于充分利用双模态信息,提出了一种基于Boosting算法的双模态信息融合方法,它能够自适应地调整语音和人脸动作特征参数的权重,从而达到更好的识别效果。实验表明,该方法能够更好地区分易混淆的情感状态,情感识别率达84%以上。
- 黄力行辛乐赵礼悦陶建华
- 关键词:BOOSTING算法自适应权重
- 汉语对话语气韵律建模方法被引量:3
- 2008年
- 为使得合成系统所生成的语音更加自然,构建了一个普通话对话语气韵律模型。借鉴现有陈述语气韵律模型的研究成果,针对对话语气的特点进行扩展,生成具有对话语气韵律特征的基频曲线。与陈述语气相比,对话语气具有较快的语速和较窄的调域,然而仅通过变换语速和调域却无法模拟出对话语气的特征。对话语气中音节内部基频曲线无法完成其原先固有的调形,这种现象称为"未完成现象"。为了模拟这种现象,利用分类树预测一个音节是正常音节还是未完成音节,并在基频曲线生成模型中对未完成音节进行特殊处理,使之生成具有对话语气韵律特征的基频曲线。听辨实验证明,基于本文所提出韵律模型合成的语音表现更加自然和口语化。
- 于剑黄力行陶建华
- 关键词:语音合成
- 基于共振峰增强训练算法的HTS研究与改进
- 传统的基于隐马尔可夫模型的语音合成系统(HTS)存在着合成参数过平滑问题,导致合成结果音质下降。过平滑问题可以分为时域过平滑和频域过平滑。本文对这两个问题进行分析,并通过实验研究它们对合成结果音质下降影响的程度。实验表明...
- 张蒙陶建华
- 关键词:语音合成隐马尔可夫模型
- 文献传递
- 自然手语动作序列生成的研究被引量:6
- 2010年
- 文章探讨了如何让在手语新闻播报中的卡通人按照自然手语的语法规则而非正常人的语法规则来打手语。首先整理了现代汉语自然手语的规则并将其形式化,并建立了正常汉语到汉语自然手语转换的形式规则库;从而实现了现代汉语文本到相应的自然手语的手语动作序列的自动生成。最后将其嵌入到通过手语合成技术和卡通动画的手语新闻播报系统中,使其在线输出的是符合聋人习惯的自然手语。
- 范双南陈益强周经野
- 关键词:自然手语倒装省略
- 基于动态基元选取的真实感可视语音合成系统
- 2008年
- 伴有说话者面部表情及唇动的文本-可视语音转换系统(TTVS)能够大大增强人机交互的生动性和真实感。结合当前主要的两类TTVS技术,利用数据驱动法中的动态基元拼接获得参数序列,驱动MPEG-4人脸动画模型,在保留灵活性和可移植性等优点的前提下,以较小的数据量,获得了较为生动的效果,形成了具有较高真实感的中文可视语音合成系统。
- 周密穆凯辉陶建华
- 关键词:可视语音MPEG-4