蒋兵
- 作品数:3 被引量:12H指数:2
- 供职机构:中国科学技术大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 基于深度神经网络的语种识别被引量:7
- 2015年
- 语音段的有效表示方法存在易混淆语种和短时语音段识别率较低等问题,为满足不同时长和方言的识别要求,提出基于深度神经网络不同层的有效语音段表示方法.采用含有中间瓶颈层的深层神经网络作为前端特征提取,综合利用该网络的输出层和中间瓶颈层输出结果,得到不同形式的语音段表示并用于语种识别.在美国国家标准技术局语种识别评测2009年和2011年阿拉伯方言数据集上验证了方法的有效性.
- 崔瑞莲宋彦蒋兵戴礼荣
- 关键词:语种识别
- 采用DBN的TV改进方法在语种识别中的应用被引量:4
- 2015年
- 近年来基于深度神经网络(Deep Neural Network,DNN)的全差异空间建模方法(Total Variability,TV)在语种识别领域得到了广泛研究。本文提出了一种基于DNN的改进TV方法,既利用了DNN对数据的音素状态对齐效果,又充分考虑了语种任务的相关性。该方法首先利用带有瓶颈层的深层神经网络(Deep Bottleneck Network,DBN)对语种数据特征按照音素状态进行聚类,得到语种任务相关通用背景模型(Universal Background Model,UBM),然后利用该UBM模型并结合深度瓶颈特征(Deep Bottleneck Feature,DBF)进行TV建模。实验表明,与经典的TV方法相比,该方法能够显著的提升系统性能和效率,并且融合后性能得到了进一步提升。
- 洪新海宋彦蒋兵戴礼荣
- 关键词:语种识别
- 基于多视觉码本的图像表示被引量:1
- 2013年
- 基于词袋模型的图像表示方法的有效性主要受限于局部特征的量化误差.文中提出一种基于多视觉码本的图像表示方法,通过综合考虑码本构建和编码方法这两个方面的因素加以改进.具体包括:1)多视觉码本构建,以迭代方式构建多个紧凑且具有互补性的视觉码本;2)图像表示,首先针对多码本的情况,依次从各码本中选择相应的视觉单词并采用线性回归估计编码系数,然后结合图像的空间金字塔结构形成最终的图像表示.在一些标准测试集合的图像分类结果验证文中方法的有效性.
- 宋彦蒋兵戴礼荣
- 关键词:图像分类聚类分析图像表示