您的位置: 专家智库 > >

国家教育部博士点基金(20101101110020)

作品数:8 被引量:27H指数:3
相关作者:谢湘匡镜明王晶杨立东那兴宇更多>>
相关机构:北京理工大学内蒙古科技大学更多>>
发文基金:国家教育部博士点基金国家自然科学基金内蒙古自治区自然科学基金更多>>
相关领域:电子电信理学机械工程更多>>

文献类型

  • 7篇期刊文章
  • 1篇会议论文

领域

  • 8篇电子电信
  • 1篇机械工程
  • 1篇理学

主题

  • 6篇语音
  • 2篇信号
  • 2篇语音合成
  • 2篇语音识别
  • 2篇矢量
  • 2篇矢量量化
  • 2篇听觉模型
  • 2篇傅里叶
  • 2篇傅里叶变换
  • 2篇HMM
  • 2篇大尺度
  • 1篇带噪语音
  • 1篇倒谱
  • 1篇多分辨
  • 1篇多分辨率
  • 1篇多分辨率分析
  • 1篇音频
  • 1篇音频分类
  • 1篇语音信号
  • 1篇张量分解

机构

  • 7篇北京理工大学
  • 2篇内蒙古科技大...

作者

  • 6篇匡镜明
  • 6篇谢湘
  • 4篇王晶
  • 2篇杨立东
  • 2篇那兴宇
  • 1篇马多佳
  • 1篇尹辉

传媒

  • 2篇中国科技论文...
  • 1篇声学学报
  • 1篇清华大学学报...
  • 1篇北京理工大学...
  • 1篇信号处理
  • 1篇Chines...

年份

  • 1篇2015
  • 1篇2013
  • 1篇2012
  • 5篇2011
8 条 记 录,以下是 1-8
排序方式:
基于听觉模型与自适应分数阶Fourier变换的声学特征在语音识别中的应用被引量:14
2012年
分数阶Fourier变换在处理非平稳信号尤其是chirp信号方面有着独特的优势,而人耳听觉系统具有自动语音识别系统难以比拟的优良性能。本文采用Gammatone听觉滤波器组对语音信号进行前端时域滤波,然后对输出的各个子带信号用分数阶Fourer变换方法提取声学特征。分数阶Fourier变换的阶数对其性能有着重要影响,本文针对子带时域信号提出了采用瞬时频率曲线拟合求取阶数的方法,并将其与采用模糊函数的方法作了比较。在干净与含噪汉语孤立数字库上的语音识别结果表明,采用新提出的声学特征得到的识别正确率相对MFCC基线系统有了显著提高;根据瞬时频率曲线搜索阶数的算法与模糊函数方法相比,计算量大大减少,并且根据该方法提取的声学特征得到了最高的平均识别正确率。
尹辉谢湘匡镜明
关键词:分数阶FOURIER变换声学特征听觉模型CHIRP信号自适应
基于多分辨率分析的特征波形分解与重构算法被引量:2
2011年
基于多分辨分析的思想,用双正交小波滤波器组对波形内插编码中提取的特征波进行多级分解和重构。二维特征波表面被分解为一系列时间分辨率递减的波平面,可以利用人耳对缓变和快变成分的感知重要性不同对各层的特征波形幅度谱进行不同精度的量化,相对于传统的低通滤波波形分解过程能够更好地对特征波序列进行多尺度的描述,有利于增强编码效果。借助基于时域设计的最小相位滤波器对特征波平面进行多级分解与重构,解决了用小波变换方法产生较大延迟的问题,有利于实时编码。
王晶那兴宇谢湘匡镜明
关键词:波形内插多分辨率分析小波变换
用于统计语音合成的大尺度压缩HMM的方法
2011年
统计语音合成使用隐Markov模型(HMM)作为声学特征的统计模型。提出了一种利用声学模型空间距离进行HMM的大尺度压缩的量化方法,通过对矢量量化码本进行的优选迭代步骤,减小压缩后的声道谱模型与原模型之间的声学距离,使通过量化模型合成的语音更加接近未量化模型。主观和客观测试结果显示:使用该方法进行声道谱模型的压缩,在压缩至原模型大小的0.06左右时,仍有约90%的评价得分认为合成语音的质量没有明显下降。
那兴宇谢湘匡镜明何娅玲
关键词:矢量量化
Acoustic features based on auditory model and adaptive fractional Fourier transform for speech recognition
2011年
人的那个听觉的系统有自动语音识别 ASR 系统斜面火柴,和部分 Fourier 变换 FrFT 在非静止的信号处理有唯一的优点的优秀性能,是众所周知的。在这份报纸, Gammatone filterbank 为前端被用于讲话信号时间的过滤,然后产量 subband 信号的声学的特征基于部分 Fourier 被提取变换。就为 FrFT 的变换顺序的批评效果而言,一个顺序改编方法基于即时频率被建议,并且它的表演基于歧义功能与方法相比。ASR 实验在干净、吵闹的 Putonghua 位上被进行,并且结果证明建议特征基于即时频率比 MFCC 基线,和顺序改编方法完成显著地更高的识别率基于歧义比那有低得多的复杂性函数。进一步更,基于 FrFT 的特征用建议顺序改编方法完成最高的识别率。
YIN Hui XIE Xiang KUANG Jingming
关键词:分数傅里叶变换自动语音识别声学特性听觉模型
用于统计语音合成的大尺度压缩HMM的方法
统计语音合成使用隐Markov模型(HMM)作为声学特征的统计模型。提出了一种利用声学模型空间距离进行HMM的大尺度压缩的量化方法,通过对矢量量化码本进行的优选迭代步骤,减小压缩后的声道谱模型与原模型之间的声学距离,使通...
那兴宇谢湘匡镜明何娅玲
关键词:矢量量化
文献传递
基于张量分解模型的语音信号特征提取方法被引量:7
2013年
提出了一种通过张量分解提取语音信号特征的方法.该方法对语音信号进行预处理,然后对每帧语音信号进行小波分解得到不同尺度上的信息,对这些信息提取传统特征参数,构建一个帧结构×分解尺度×特征参数的三阶张量,并经过张量分解得到各阶投影矩阵,从而建立语音信号在高阶空间上的特征体系,以便充分表征语音信号的特征.实验结果表明,本文提出的方法与传统特征参数体系比较,有利于语音识别系统性能的提高,并且对于带噪语音的识别具有一定的鲁棒性.
杨立东王晶谢湘匡镜明
关键词:张量分解特征提取投影矩阵
基于分数阶倒谱的带噪语音基频跟踪方法被引量:1
2011年
分数阶傅里叶变换(FrFT)是一种同时融合了信号在时域和频域的信息的时频分析工具。利用分数阶傅里叶变换在频率随时间变化的信号进行分析的优势,结合语音信号处理中获得语音信号的声道和激励信息的重要手段之一的倒谱分析,以适当的信干比定义作为搜索准则进行自适应搜索合适的变换阶数,使得基于分数阶傅里叶变换的倒谱更能够体现语音信号频率的时变特性。通过对带噪汉语元音的基频跟踪实验,可以看到基于分数阶傅里叶变换倒谱的语音基频提取方法的效果比传统基于傅里叶变换的倒谱更准确。
马多佳谢湘王晶匡镜明
关键词:分数阶傅里叶变换倒谱
基于Tucker分解的音频分类研究被引量:3
2015年
提出一种利用Tucker分解获得鲁棒性较强的音频信号不同属性的特征,在高斯混合模型上测试音频信号分类性能的方法。音频信号经过预处理后,提取其不同类型特征集合,包括常规声学特征参数集合、听觉感知特征参数集合、心理声学特征参数集合;然后由三种特征集合构建三阶特征张量,通过Tucker分解得到每一类特征阶投影矩阵并进行主分量分析;最后使用包括音乐、语音、噪声3种类型的300条音频数据测试不同特征集合的分类效果,在此过程中使用了有监督学习的高斯混合模型作为分类器。实验中比较了不同特征集合使用高斯混合模型的分类正确率。实验结果表明,Tucker分解获得的特征集合实现了较好的分类,说明该方法性能优于传统特征集合。
杨立东王晶谢湘匡镜明
关键词:音频分类高斯混合模型
共1页<1>
聚类工具0