中国科学院战略性先导科技专项(XDA06030500)
- 作品数:12 被引量:36H指数:4
- 相关作者:颜永红孙鹏曾学文姜艳许春冬更多>>
- 相关机构:中国科学院北京理工大学国家互联网应急中心更多>>
- 发文基金:中国科学院战略性先导科技专项国家高技术研究发展计划国家自然科学基金更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 基于DNN的声学模型自适应实验被引量:5
- 2015年
- 声学模型自适应算法研究目的是缓解由测试数据和训练数据不匹配而引起的识别性能下降问题.基于深度神经网络(DNN)模型框架的自适应技术中,重训练是最直接的方法,但极容易出现过拟合现象,尤其是自适应数据稀疏的情况下.文章针对领域相关的自动语音识别任务,对典型的两种声学模型自适应算法进行了尝试,实验了基于线性变换网络的自适应方法和基于相对熵正则化准则的自适应方法,并对两种算法进行了详尽的系统性能比较.结果表明,在不同的自适应数据量下,相对熵正则化自适应方法均能表现出较好的性能.
- 张宇计哲万辛张震葛凤培颜永红
- 关键词:语音识别
- 两扬声器配置下的串声消除系统参数优化设置被引量:1
- 2014年
- 针对三维声音两扬声器重放中基本上独立研究逆滤波器的设计或扬声器的配置等因素对串声消除系统(CCS)性能的影响,提出了采用频域最小均方(LS)估计逼近方法,系统考察这些因素之间的关联以及对串声消除性能优化的作用,并通过折中考虑CCS的运算效率及系统性能获得了一组最优参数。实验采用通道分离度(CS)和性能误差(PE)两个指标对串声消除效果进行综合评价,仿真结果表明,该组最优参数能获得很好的串声消除效果。
- 许春冬李军锋裘嫄夏日升颜永红
- 关键词:三维声音逆滤波
- 基于SVM的合成语音检测
- 斯超向量分类技术引入到了合成语音检测系统中,利用svm二分类起进行合成语音检测在保证检测速度的情况下可以达到一个较为优秀的效果。但由于训练数据标注问题,对性能还是一定影响。并且在更大的训练数据规模下,svm也很难进一步进...
- 杨朔计哲郭耀辉颜永红
- 关键词:自动化检测信号识别
- 一种嵌入式终端多应用网络资源分配协议被引量:1
- 2013年
- 为了在嵌入式终端多应用之间合理分配有限的网络带宽资源,提出一种嵌入式终端多应用网络资源分配协议。根据应用特性对网络数据包进行分类,结合实时探测的可用带宽,为每种类型数据包分别添加不同的延迟时间,依据延迟大小调度数据包。将该协议应用于实际IP机顶盒中,在同时运行HTTP流媒体应用和FTP下载应用的环境中,能够优先保证前台流媒体应用的流畅播放。实验结果表明,该协议在多应用运行环境下,能够优先满足用户关注度高的应用网络带宽需求,实现了网络资源在嵌入式终端上的合理分配。
- 姜艳曾学文孙鹏朱小勇
- 关键词:嵌入式终端网络资源分配
- 多领域系统融合在语音云系统中的应用
- <正>0引言近年来,各大IT公司推出了自己的语音云系统,语音识别技术被大量运用到人们的日常生活中。通过云系统的强大计算能力,用户可利用语音通过移动终端打开手机应用,编辑短信、电子邮件,拨打电话和搜索网页等。各式各样的功能...
- 陈梦喆张晴晴颜永红
- 文献传递
- 利用二重打分方法的激活词语音识别
- <正>0引言语音被认为是人与人之间交流最自然的方式之一,自动语音识别(ASR)也是一种重要的人机交互方式。几十年来,众多学者做了大量与语音识别相关的工作,其中的一个方向就是激活词语音识别,也可以称为激活词检测:向机器发出...
- 邢安昊黎塔颜永红
- 文献传递
- 汉语连续语音识别系统中三音子模型的优化被引量:4
- 2013年
- 为了更准确地估计状态聚类前有调三音子的模型参数,从而提高聚类后捆绑状态的精度及系统的识别性能,针对汉语连续语音识别中,有些有调三音子的训练样本数非常少,而其对应的无调三音子的训练样本数相对较多的情况,提出用其对应的无调三音子的模型参数进行初始化,并用最大后验概率准则训练模型。汉语大词汇量连续语音识别实验表明,该方法可以提高训练语料中稀疏三音子聚类前的模型精度,从而提高系统的识别性能。
- 齐耀辉潘复平葛凤培颜永红
- 关键词:三音子模型最大后验概率
- 基于DNN的声学模型自适应实验研究
- 声学模型自适应算法研究目的是缓解由测试数据和训练数据不匹配而引起的识别性能下降问题。基于深度神经网络模型框架的自适应技术中,重训练是最直接的方法,但极容易出现过拟合现象,尤其是自适应数据稀疏的情况下。文章针对领域相关的自...
- 张宇计哲万辛张震葛凤培颜永红
- 关键词:语音识别
- 文献传递
- 一种小资源下语音识别算法设计与优化
- 在可穿戴设备和智能家居系统的实际应用中,语音识别引擎需要占用极小的资源并具有较强的拒识能力。传统的语音识别算法无法满足小资源的这种需求,本文在解码策略和拒识算法设计上均提出了改进方法。解码策略方面,通过修改垃圾音素的重入...
- 张鹏远计哲侯炜金鑫韩卫生
- 关键词:语音识别置信度
- 文献传递
- 基于N元文法的领域语法语料扩展算法
- 语言模型训练语料的数据稀疏性问题,一直是语音识别任务所面临的一个严重问题。基于领域语法扩展训练语料的方法,能够有效地缓解特定域语言模型训练数据稀疏性问题。本文在领域语法的基础上,提出了一种基于语言模型N元文法(Ngram...
- 梁宏黎塔
- 关键词:N元文法语言模型语音识别
- 文献传递