国家自然科学基金(60085001) 作品数:19 被引量:90 H指数:5 相关作者: 韩纪庆 王承发 张磊 吕成国 张磊 更多>> 相关机构: 哈尔滨工业大学 黑龙江科技学院 黑龙江大学 更多>> 发文基金: 国家自然科学基金 教育部留学回国人员科研启动基金 博士科研启动基金 更多>> 相关领域: 电子电信 自动化与计算机技术 语言文字 更多>>
基于特征加权的应力影响下顽健语音识别方法 被引量:5 2002年 通过对应力影响下语音数据的分析 ,发现不同的特征维对变异的敏感程度不同。一般低维特征对变异比较敏感 ,相应的高维特征敏感程度差些。在此基础上 ,提出一种新的基于特征加权的变异语音识别方法。该方法通过对不同维特征加不同的权值来消除变异因素对语音特征的影响 ,从而提高系统的识别性能。文中提出对线性权值用最大相对熵估计方法获得权值。对航空模拟飞行器中采集的特定话者小词表孤立词的实验 ,最大相对熵估计方法的识别率可达到 89 9% ,与多重风格训练方法相比 ,识别率提高了 13 1%。 张磊 韩纪庆 王承发 张文祥关键词:应力影响 特征加权 一种新的修正Mel频率映射的应力影响下变异语音识别方法 2002年 Based on the spectrograms analysis and the individual frequency bands of speech under G-force, in this pa-per, a new Mel frequency scale is proposed, and the related MFCC (Mel Frequency Cepstrum Coefficient) is adoptedas the features for recognition of stressed speech under G-force. It is shown from the experiments that the proposedmethod is better than other methods of Mel-based features for stressed speech recognition. 毕继武 韩纪庆关键词:变异语音识别 语音信号处理 基于MAP自适应算法的应力下变异语音识别方法 2004年 变异情况对语音的影响是导致语音识别系统性能下降的原因之一。一般情况下变异语音数据采集困难,获得的训练数据量少,这样即使测试环境和训练环境都相同,识别性能也不理想。利用自适应算法可以解决这类问题,它采用少量的测试环境数据进行训练,以达到训练模型和测试数据匹配的目的,保证系统良好的识别性能。MAP算法是常用的自适应算法,大多应用于话者自适应环境,该文尝试将其应用于变异语音识别系统中,并通过对该模型做相应改进获得了较好的识别结果。在小词表特定人应力变异的识别实验中,分别用非特定人模型和改进的特定人模型作为初始模型,应用MAP算法,系统识别率均有明显提高,与基本识别系统相比,在10遍自适应数据前提下,识别率分别提高了15.84%和15.97%,最好的识别率达到85.56%和90.42%。 钱芳 韩纪庆 张磊关键词:语音识别 变异语音 MAP算法 自然风格言语的汉语句重音自动判别研究 被引量:20 2006年 重音是语音合成中韵律处理的一个重要参数。本文分析了轻声和重读音节同正常重音在各声学参数上的差异,包括基频、音节时长、强度、停顿长度等,还特别考察了时长同基频参数之间的关系,以及上声音调同基频的关系。建立了基于人工神经网络的三种重音预测模型,即声学预测模型、语言学预测模型和混合预测模型,对汉语句重音(包括轻声、正常重音、重读)进行了自动判别,结果显示混合模型要优于另外两种模型。此外,本文还根据重音标注的多样性现象设计了支持率的评价方法。 邵艳秋 韩纪庆 刘挺 赵永贞关键词:自动判别 自然风格 声学参数 混合模型 语音合成 基频 声道的调频-调幅模型及其在语音分析中的应用 被引量:10 2002年 传统的线性声学理论是基于这样一个假设:流经声带的气流在声道中是以平面波的形式传播.而根据Teager的研究结果,由于在声道中有涡流分布,这个假设将不成立.基于这种非线性现象的存在,Maragos提出了一个调频-调幅模型来表示语音产生的过程;近年来这个模型已经被成功地应用到语音处理的许多领域中.介绍了调频-调幅模型的产生背景及其主要理论核心,重点讨论它在语音分析中的应用及在变异语音识别中的应用前景. 张磊 韩纪庆 王承发关键词:声道 调频 语音分析 TEAGER能量算子 语音信号处理 语音识别 一种基于非线性特征的应力影响下变异语音识别方法 被引量:3 2002年 考虑到变异语音产生的非线性特点,本文提出了一种基于TEO能量算子倒谱特征的应力影响下变异语音识别方法。先将语音信号分割成21个不同频带的信号,然后计算TEO能量,最后进行对数运算和离散余弦变换。对航空模拟飞行器中采集的小词表特定人的识别实验,采用非线性分析的基于TEO能量算子倒谱特征的方法,能有效地提高变异语音的识别性能,比传统的基于MFCC特征的方法识别率提高了11.3%。 王玉伟 张磊 韩纪庆关键词:语音识别 变异语音 应力 Study on automatic prediction of sentential stress for Chinese Putonghua Text-to-Speech system with natural style 被引量:2 2007年 应力是为韵律在讲话合成处理的一个重要参数。在这份报纸,我们把中立音调音节和强壮的压力音节的声学的特征与中等压力音节作比较,包括沥青,音节持续时间,紧张并且暂停在音节以后的长度。在持续时间和音质之间的关系,以及第三个音调(T3 ) 和音质也被学习。三压力预言基于 ANN 当模特儿,即声学的模型,语言学模型和混合模型,为预言中国句子的 stress.The 结果证明混合模型比另外的二个模型更好表演被介绍。以便解决用手的标记的差异的问题,支持比率的一个评估索引被建议。 SHAO Yanqiu HAN Jiqing ZHAO Yongzhen LIU Ting关键词:言语合成 普通话 基于多路差别子空间的语速变化语音的识别 被引量:2 2005年 语速变化是发音变异的一种,文章建立了快、慢和正常语速的语音库,运用差别子空间方法对语速变化的语音进行了训练和识别,并对其进行了改进,提出了多路差别子空间方法。实验结果表明,该方法对语速变化的语音有良好的识别效果。 吕成国 韩纪庆 高文关键词:语音识别 基于子空间方法的应力影响下变异语音分类 2007年 应力影响下的变异语音是由于说话人受到重力加速度变化而产生的,与正常语音相比,变异语音频谱能量在频带范围内分布更加分散。把整个频带划分成8个子带,采用子带频谱能量的比值为特征,提出一种基于子空间方法的正常/变异语音分类方法。该方法采用CLAFIC方法设计初始向量子空间,并通过LSM算法对两类样本子空间按不同的旋转方式训练,用预分类的结果调整分类器的参数来改善分类器的性能。实验结果表明,该方法对应力影响下的变异语音与正常语音具有良好分类效果,平均分类正确率达到了95.9%。 吕成国 韩纪庆关键词:应力 变异语音处理的研究进展 被引量:4 2003年 本文讨论了变异语音处理技术及其研究进展 ,分析了变异情况对语音识别性能产生的影响 ,综述了变异语音分类和变异语音识别方法 ,探讨了变异语音处理研究中存在的问题及未来的研究重点 . 张磊 韩纪庆 王承发关键词:变异语音 语音分类 语音处理