您的位置: 专家智库 > >

广东省自然科学基金(10151805702000000)

作品数:4 被引量:3H指数:1
相关作者:王健关添叶大田更多>>
相关机构:清华大学更多>>
发文基金:国家自然科学基金广东省自然科学基金广东省教育部产学研结合项目更多>>
相关领域:电子电信医药卫生理学更多>>

文献类型

  • 4篇中文期刊文章

领域

  • 2篇电子电信
  • 1篇医药卫生
  • 1篇理学

主题

  • 2篇音高
  • 2篇感知
  • 1篇带通
  • 1篇带通滤波
  • 1篇带通滤波器
  • 1篇倒谱
  • 1篇倒谱系数
  • 1篇动态时间弯折
  • 1篇音素
  • 1篇时域
  • 1篇时域模型
  • 1篇评分
  • 1篇评分模型
  • 1篇谱系数
  • 1篇谐波
  • 1篇滤波器
  • 1篇模型分析
  • 1篇可分离性
  • 1篇感知机
  • 1篇感知机制

机构

  • 3篇清华大学

作者

  • 3篇叶大田
  • 3篇关添
  • 3篇王健

传媒

  • 1篇声学学报
  • 1篇北京大学学报...
  • 1篇清华大学学报...
  • 1篇Chines...

年份

  • 2篇2013
  • 2篇2012
4 条 记 录,以下是 1-4
排序方式:
基于特征比较和模拟退火-遗传算法的普通话音素评分模型被引量:3
2012年
为了帮助发音困难者障碍者和外语学习者矫正普通话发音错误,提出基于Mel频率倒谱系数(Mel frequencycepstrum coefficient,MFCC)特征比较和模拟退火-遗传算法(simulated annealing genetic algorithm,SAGA)的普通话音素评分模型。该模型采用动态时间弯折(dynamic timewarping,DTW)算法对普通话音素进行相似度比对,并基于SAGA评分机制对发音进行自动评分。本文对比了不同优化算法(SAGA和局部优化算法)、不同DTW算法对语音评分的影响。结果发现:SAGA评分模型下的音素评分正确率大于94%,远远优于局部优化算法。此外,在SAGA评分模型下,搜索路径为平行四边形的改进DTW算法具有最优的评分结果。因此,基于MFCC和SAGA的评分模型适用于普通话音素评分。
王健关添叶大田
兴奋模式下谐波复合音音高感知机制的研究
2013年
通过测量谐波复合音的基频辨别阈,探讨中等"高次谐波"的音高感知是否依赖于谐波的可分离性,以及掩蔽音对实验结果的影响。实验方法:在目标音单独存在或目标音与掩蔽音混合时,将刺激通过高、中、低三个带通滤波器以获得不同的谐波可分离度。实验刺激设计为5种基频差异和4种相位组合。五名被试均为年轻人,纯音听阈≤15 dB HL。研究结果发现:谐波复合音的基频辨别阈随着信号频段的上移而增大;目标音和掩蔽音的基频差异对基频辨别阈有显著影响;但相位影响不显著。结论:谐波的可分离性对基频辨别阈有显著影响,但中等"高次谐波"的音高感知不依赖于可分离性;混合音的大部分音高感知结果与兴奋模式的峰值大小密切相关。
王健关添叶大田
关键词:感知音高可分离性高次谐波带通滤波器
Pitch perception of harmonic complex tones based on excitation patterns
2013年
Fundamental frequency difference limens were measured to study whether pitch perception of medium-rank harmonic complex tones depends on the resolvability of the compo- nents and to study the effect of masker tone on discrimination performance. Target tone was presented alone, or mixed with the masker, which were filtered into the same bandpass frequency region (low, medium, or high) to obtain different resolvability. There were five kinds of funda- mental frequency difference and four kinds of phase combination between target and masker. Five young subjects participated in experiments, all of whom had normal hearing (thresholds ≤ 15 dB HL). Results found fundamental frequency difference limens were increased with up-shift frequency region of the harmonics. The fundamental frequency difference between target and masker had a significant impact on the performance, while phase effects were small. Analysis suggested that resolvability of harmonics had a significant impact on the fundamental frequency difference limens, but pitch perception of medium-rank harmonics was not based on the resolv- ability. Analysis also suggested that most results of pitch perception of target-masker mixture were closely correlated with peaks on the excitation patterns.
WANG JianGUAN TianYE Datian
基于时域模型分析谐波复合音的音高感知机制
2012年
为了探讨中等次数的谐波复合音是否依赖于时间精细结构信息进行音高感知,测量了谐波复合音的基频辨别阈。目标复合音可以单独存在,或者和掩蔽复合音同时存在。二者经过相同的带通滤波区域,具有不同的相位组合和基频差异。结果表明:相位组合对音高感知没有显著影响;滤波区域和基频差异对音高感知具有显著影响。采用时域模型分析发现,中等次数的谐波复合音可能依赖于时间精细结构信息获得较好的音高感知结果。研究结果能帮助建立复杂声音场景下的音高感知机制。
王健关添叶大田
关键词:时域模型
共1页<1>
聚类工具0