周治
- 作品数:2 被引量:8H指数:1
- 供职机构:中国科学院声学研究所更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 汉语听觉视觉双模态信息的互补特性和人脸特征的结构化建模
- 该文以汉语语音交互为背景,采用实验和分析和方法进行研究,以求获得这些问题的进一步的认识.作为这项研究的重要基础,研究人员首先建立了第一个汉语听觉视觉双模态数据库.在借鉴国外其他语种听觉视觉双模态数据库经验的基础上,分析了...
- 周治
- 关键词:汉语语言听觉视觉人脸特征
- 文献传递
- 汉语听觉视觉双模态信息的互补作用被引量:8
- 2000年
- 从汉语听觉视觉双模态数据库CAVSR1.0中选出 10个人的视听数据 ,每人发 14个音节 /ba,bi,bian ,biao ,bin ,de ,di,dian ,duo,dong,gai,gan ,gen ,gu/ .感知实验的样本分单语音信号、语音信号 +视觉信号、单视觉信号 3类 .单语音信号、语音信号+视觉信号分别包括 5种声学条件 :无噪语音信号 ,信噪比S/N为 0 ,-8,-12 ,-16dB的语音信号 .由 2 0名观察者进行感知识别 .通过对实验结果分析 ,发现人类对单视觉信号有较强的识别能力 ;声母的发音方法、发音部位和韵母造成了视觉上的不同差异 ;在噪声环境下 ,视觉信息对听觉信息有非常明显的补偿作用 ,可以使正确识别率大幅度提高 .
- 周治杜利民徐彦君
- 关键词:汉语