李燕萍
- 作品数:105 被引量:104H指数:7
- 供职机构:南京邮电大学更多>>
- 发文基金:国家自然科学基金浙江省自然科学基金江苏省博士后科研资助计划项目更多>>
- 相关领域:自动化与计算机技术电子电信文化科学语言文字更多>>
- 基于MFCC和HMM的音乐分类方法研究被引量:9
- 2008年
- 采用基于Mel倒谱系数特征的隐马尔可夫模型对音乐进行分类.对音乐通过有监督的学习方式进行聚类,分类时将测试样本归入似然值最大的类别,对同一音频抽取若干样本,对样本识别结果采用投票法判定该音频的音乐类别,使分类的准确率得到进一步的提高.仿真实验对4种分类器在有干扰和无干扰的环境下的分类性能进行了比较,实验结果表明该方法具有更好的抗干扰能力和正确率.
- 张燕唐振民李燕萍邹益
- 关键词:MEL倒谱系数音乐分类隐马尔可夫模型
- 基于说话人风格特征建模的多对多语音转换方法及系统
- 本发明公开了一种基于说话人风格特征建模的多对多语音转换方法及系统,首先提出在StarGAN神经网络中添加多层感知器和风格编码器,实现对说话人风格特征的有效提取和约束,克服了传统模型中one‑hot向量携带说话人信息有限的...
- 李燕萍张成飞
- 基于SE-ResNet STARGAN的多对多说话人转换方法
- 本发明公开了一种基于SE‑ResNet STARGAN的多对多说话人转换方法,基于STARGAN与SE‑ResNet相结合来实现语音转换系统,在残差网络基础上,引入注意力思想和门控机制对各通道的依赖性进行建模,通过全局信...
- 李燕萍曹盼何铮韬
- 一种非平行语料训练下基于VAE的语音转换方法
- 本发明公开了一种在非平行语料训练条件下基于VAE的语音转换方法,在非平行文本条件下,通过深度神经网络提取瓶颈特征,即Bottleneck特征,然后基于变分自编码模型实现转换函数的学习与建模,在转换阶段,可以实现多说话人对...
- 李燕萍凌云志
- 基于beta-VAE的多对多语音转换方法
- 本发明公开了一种基于beta‑VAE的多对多语音转换方法,通过引入可调节参数β和C,完成对变分自动编码器(VAE)框架的修改,在提高隐变量解纠缠能力的同时,也改善其在瓶颈层编码能力不足的问题,实现多说话人对多说话人的语音...
- 李燕萍张成飞许吉良张燕
- 基于特征增强注意力机制的语音欺骗检测方法
- 本发明公开了一种基于特征增强注意力机制的语音欺骗检测方法,包括训练阶段和测试阶段,在训练阶段获取训练语料并进行预处理,构建语音欺骗检测模型,将训练语料的声学特征输入到检测模型中进行模型训练,检测模型包括特征提取和分类两大...
- 李燕萍谭誌诚邵曦丁卓
- 基于自适应高斯聚类的非平行文本条件下的语音转换方法
- 本发明公开了一种基于自适应高斯聚类的非平行文本条件下的语音转换方法,属于语音信号处理技术领域。首先利用基于单元挑选和声道长度归一化相结合的方法对非平行语料进行语音特征参数对齐,然后进行自适应高斯混合模型和双线性频率弯折加...
- 李燕萍左宇涛
- 基于单字音特征提取的说话人识别方法被引量:1
- 2009年
- 证实普通话可以分解为辅音音素和单元音音素通过过度音的连接,提出一种单字音特征提取方法。该方法在传统的帧特征提取基础上,对相关帧进行二次处理,得到单字语音中的多个代表帧,将代表帧进行拼接作为单字的特征矢量。这种特征提取方法能更好地表现说话人单字发音中相邻语音帧之间的连续性。仿真实验表明该方法在说话人识别系统的应用中达到较高的识别率,使识别时间进一步缩短。
- 张燕唐振民李燕萍
- 关键词:说话人识别特征提取
- 基于自适应频率规整的鲁棒说话人辨认研究
- 2009年
- 该文提出了一种基于自适应频率规整的鉴别性特征提取算法。该方法通过对语音频谱的各个频带的鉴别性分析及其量化结果对各个频域进行自适应的频率规整,进行非均匀子带滤波设计提取鉴别性特征;同时在噪声环境下,在特征提取前端进行了预增强处理,解决了测试语音与训练语音失配的问题,保证了特征的正确提取。实验证明,该特征原理简单,稳定性好,对语音内容不存在依赖性,有良好的抗噪性能,并且结合预增强处理是有效的,能够进一步提高辨认系统的识别率和鲁棒性。
- 李燕萍唐振民张燕丁辉
- 关键词:计算机应用中文信息处理说话人辨认鲁棒性
- 基于DenseNet STARGAN的多对多说话人转换方法
- 本发明公开了一种基于DenseNet STARGAN的多对多说话人转换方法,采用STARGAN与DenseNet相结合来实现语音转换系统,并将GELU激活函数引入STARGAN中。一方面利用DenseNet来解决训练过程...
- 李燕萍袁昌龙徐玲俐