中央高校基本科研业务费专项资金(HITNSRIF2012047)
- 作品数:12 被引量:221H指数:6
- 相关作者:李海峰马琳韩文静吴明权房春英更多>>
- 相关机构:哈尔滨工业大学哈尔滨理工大学清华大学更多>>
- 发文基金:中央高校基本科研业务费专项资金国家自然科学基金深圳市基础研究计划项目更多>>
- 相关领域:自动化与计算机技术电子电信医药卫生更多>>
- 情感语音数据库综述被引量:15
- 2013年
- 情感语音数据库是语音情感识别研究的数据基础,为语音情感识别模型的建立提供训练和测试数据。近年来,国内外研究者们以各自的科研任务为背景,建立了若干面向语音情感识别研究的数据库。然而,由于情感的复杂性以及缺乏统一的数据库建立标准,只有少数的高质量的数据库得到了大多数研究者们的认可。通过文献调查与分析,对当前领域内极具代表性的一些情感语音数据库进行了综述,目的是为相关研究者们的数据库建立和选择工作提供可靠的对比和参考依据。
- 韩文静李海峰
- 关键词:情感计算语音情感识别
- 基于样本空间分布距离的支持向量机
- 2016年
- 由于支持向量机(Support Vector Machine,SVM)在处理样本不平衡分布时会有偏向性,使少数类别的分类错误率的上界高于多数样本类别。分析总结了针对该问题当前的研究方法,并指出存在问题。研究分析针对不平衡样本SVM分类识别率的倾向性问题。考虑全局样本信息,提出了3种针对所有样本空间分布距离信息的方法。在UCI数据集上进行实验,结果证明MSEDR-SVM(Mean Sample Euclidean Distance Ratio-SVM)能够有效增加少数样本类别的F-值。从而改善标准的SVM只依靠支持向量样本构建分类超平面的局限性。
- 于波李海峰马琳
- 关键词:SVM
- 病理语音的S变换特征及其应用
- 病理语音具有强烈的非平稳性和突变性特点。S变换具有良好的时频分辨率和时频定位能力。本文在S变换基础上结合人耳听觉的Mel特性,提出一种能够突出发声器官病变的病理语音特征MSCC(Mel S-Transform Cepst...
- 李海峰房春英马琳张满彩孙佳音
- 关键词:S变换
- 文献传递
- 阅读认知模式下的图案识别方法研究被引量:1
- 2013年
- 本文模拟人类对图案的认知识别机理,提出了一种基于阅读认知模式的特征提取方法,提取基于视觉信息的图案特征,并提出了一种基于基元拓扑关系建模的通用图案识别方法。利用滑动窗来实现对人类认知图案机制的模拟,通过滑动窗的滑动过程完成对图案局部结构特征提取以及空间拓扑关系的构建。在图案识别建模方法中,采用了人工神经网络和隐马尔科夫模型相结合的混合识别模型,利用人工神经网络的强大计算能力完成基元建模,结合隐马尔科夫模型的强大的处理时序数据的优势,实现了图案的整体拓扑结构建模。实验结果验证了本文提出的图案识别方法的有效性和通用性。
- 秦银雪李海峰马琳
- 关键词:人工神经网络隐马尔科夫模型
- 单通道脑电信号中眼电干扰的自动分离方法被引量:15
- 2015年
- 当前主流的眼电(EOG)去除方法需要利用多通道脑电的相关性,难以在单通道的便携式脑机接口(BCI)中应用。该文提出一种基于长时差分振幅包络与小波变换的眼电干扰自动分离方法。首先在原脑电信号的长时差分振幅包络上实施双门限法来精确检测眼电的起止点,然后利用sym5小波对脑电进行分解并引进Birgé_Massart策略来自适应地确定小波重构系数阈值,最后通过小波重构精确地估计眼电,实现单通道上眼电与脑电的自动分离。大量实验证明,该方法与主流的平均伪迹回归分析和基于独立成分分析(ICA)的方法相比,能够获得更好的估计眼电与原眼电的相关性,保证更高的校正信噪比和较强的实时性,能够满足脑机接口多方面的需要。
- 吴明权李海峰马琳
- 关键词:小波变换
- 听觉通道语音冲突大脑皮层电位的听觉认知控制特征提取方法
- 2016年
- 认知心理学发现,视觉、听觉接收到信息有冲突时,大脑皮层电位会发生扰动,由此可探索认知冲突控制的“刺激-反应”机制。视觉认知冲突实验较多,成果丰硕,而相应的听觉实验很少,并且得到不一样的结论。本研究利用冲突和非冲突的语音信号刺激,分析研究脑电信号,提出基于三阶段听觉认知控制的时域特征模型。研究人脑听觉通道在出现语音认知冲突时的认知控制的规律下的单次试验脑电数据特征提取方法。根据得到的认知规律,单次试验脑电样本被分成3个部分。被分割的每个阶段使用时域上的平均幅值和Lempel-Ziv复杂度(LZC)进行计算,从而联合3个阶段的特征作为听觉认知脑电样本的特征。结果表明:(1)先发现的认知冲突相关的混合脑电成分“N1-P2&N2&Late-SW”分别体现了听觉认知控制的3个阶段;(2)一个更完整的听觉认知控制过程应包括3个阶段的时域特征:感知阶段:110~140 ms,识别阶段:260~320 ms,解决阶段:500~700 ms;(3)提出针对单次听觉认知控制脑电样本的特征提取方法,联合使用平均幅度和LZC可以获得最好的识别率(99.33%)。实验结果证明了提出的方法能够有效地检测听觉认知控制脑电数据,进而提供人脑认知控制能力评价的声学方法。
- 于波李海峰马琳王勋达
- 关键词:特征提取听觉刺激认知心理学视觉认知STROOP脑电信号
- 基于复杂网络构建与分析技术的语音响度差异神经处理机制研究
- 2014年
- 相关分析能够找出研究现象之间的依存关系、相关方向以及相关程度,可以发现大数据集里隐藏的关联网络。本文面向语音响度变化认知问题,提出"差异度"的概念,利用相关分析构建大脑功能的复杂网络,探索深层的神经处理机制与脑认知新规律。提出一种短时窗分析方法,构建不同认知阶段的脑网络;基于不同刺激下节点度的拓扑特征,构建基于差异度的脑地形图,实现脑区之间数据关系的可视化表达和动态演化过程表达。结果发现,前额叶、右额颞区和右后颞区分别在听觉处理的早期、中期和晚期对声音响度变化具有显著响应。研究表明脑复杂网络构建与分析技术可以成为研究神经处理机制与认知规律的有效工具。
- 房春英李海峰马琳刘哲王勋达
- 关键词:差异度
- 面向内容的语音信号压缩感知研究被引量:9
- 2012年
- 压缩感知理论依据信号的稀疏性质进行压缩测量,将信号的获取方式从对信号的采样上升为对信息的感知,是信号处理领域的一场革命。本文提出一种基于非确定基字典(Uncertainty Basis Dictionary,UBD)对语音信号进行稀疏表示的方法,将压缩感知理论应用于对语音信号稀疏表示的压缩,并提出了基于求解线性规划问题的方法重构语音信号的算法。通过语音识别、话者识别和情感识别实验,从面向内容分析的角度,研究这种基于压缩感知理论的信息感知方法是否保留了语音信号的主要内容。实验结果表明,语音识别、话者识别和情感识别的准确率,与目前这些领域研究方法得到的结果基本一致,说明基于压缩感知理论的信息感知方法能够很好地获取语音信号的语义、话者和情感方面的信息。
- 高畅李海峰马琳
- 关键词:压缩感知语音信号线性规划信息感知
- 多粒度特征融合的维度语音情感识别方法被引量:9
- 2017年
- 针对传统维度语音情感识别系统采用全局统计特征造成韵律学细节信息丢失以及特征演化规律缺失的问题,本文提出了一种基于不同时间单元的多粒度特征提取方法,提取了短时帧粒度、中时段粒度以及长时窗粒度特征,并提出了一种可以融合多粒度特征的基于认知机理的回馈神经网络(Cognition-Inspired Recurrent Neural Network,CIRNN)。该网络模拟了人脑处理语音信号时"循序渐进"的过程,通过融合多粒度特征,使得不同时间单元的特征均参与网络训练,既突出了情感的时序性,也保留了全局特性对情感识别的作用,实现多层级信息融合。该网络同时模拟大脑运用以往经验模式进行对比的过程,在网络中引入记忆层,用于记忆上文情感特征,强化了上下文信息对识别的影响作用。本文将该方法用于VAM维度语料库的维度情感识别,分别从Activation、Dominance、Valence三个维度进行测试,平均相关系数为0.66,识别结果明显优于传统ANN和SVR的识别结果。
- 陈婧李海峰马琳陈肖陈晓敏
- 基于F-score的大数据公共空间模式选择方法被引量:6
- 2014年
- 公共空间模式(CSP)分析由于具有变换简单、实现快速等优点,被广泛应用于信息挖掘、脑电信号处理等大数据处理应用中。本文以基于脑电信号的人类认知状态分类识别为背景,研究一种基于Fisher分数(Fscore)的特征评价与选择的CSP构建方法。利用F-score计算代价小、可以快速从高维数据中选择出有效信息和特征的优点,实现了对模式重要程度做出定量的表达;针对F-score阈值确定困难、信息冗余、无法自适应实现等难点问题,提出了相应的解决方法。所提出方法在脑认知活动解析实验中,针对五类认知状态分类问题取得了92%的识别准确率。本方法为大数据的公共模式挖掘等问题供了一个强有力的新工具。
- 王欣杰李海峰马琳吴明权
- 关键词:信息选择大数据