您的位置: 专家智库 > >

国家自然科学基金(61171186)

作品数:6 被引量:12H指数:2
相关作者:李海峰马琳高畅张珑王建华更多>>
相关机构:哈尔滨工业大学哈尔滨师范大学更多>>
发文基金:国家自然科学基金中央高校基本科研业务费专项资金黑龙江省自然科学基金更多>>
相关领域:自动化与计算机技术电子电信语言文字更多>>

文献类型

  • 6篇期刊文章
  • 3篇会议论文

领域

  • 4篇自动化与计算...
  • 3篇电子电信
  • 2篇医药卫生
  • 1篇语言文字

主题

  • 2篇信号
  • 2篇音频
  • 2篇普通话
  • 2篇普通话水平
  • 2篇普通话水平测...
  • 2篇暴力
  • 1篇多尺度
  • 1篇信息感知
  • 1篇压缩感知
  • 1篇音频特征
  • 1篇语音
  • 1篇语音信号
  • 1篇声学
  • 1篇声学特性
  • 1篇声学特征
  • 1篇特征矩阵
  • 1篇统计特征
  • 1篇线性规划
  • 1篇脑电
  • 1篇脑电信号

机构

  • 8篇哈尔滨工业大...
  • 2篇黑龙江科技大...
  • 1篇哈尔滨师范大...
  • 1篇黑龙江大学

作者

  • 6篇李海峰
  • 4篇马琳
  • 1篇高畅
  • 1篇王建华
  • 1篇张珑
  • 1篇梁家欣
  • 1篇刘新磊

传媒

  • 3篇智能计算机与...
  • 1篇声学学报
  • 1篇信号处理
  • 1篇Chines...
  • 1篇第十三届全国...

年份

  • 1篇2018
  • 1篇2016
  • 2篇2015
  • 3篇2014
  • 1篇2013
  • 1篇2012
6 条 记 录,以下是 1-9
排序方式:
基于张量模型的暴力音频检测研究被引量:1
2016年
针对传统方法忽略时序信息的问题,提出了一种基于张量模型的暴力音频分类技术。该方法首先对音频样本提出矩阵特征,然后把同一类型的样本特征组成一个张量特征。采用ALS算法对张量进行分解,然后提出一个基于张量模型的分类器。实验结果表明,张量模型的特征对暴力音频分类问题具有一定提高效果,证明了保留时间维度上的信息是有意义的。
梁家欣李海峰马琳
关键词:特征矩阵
病理声音诊断系统的设计与实现
通过听病人的声音、语言、呼吸、咳嗽等各种声响,探究人体的病理变化,是一种医学上的重要诊断手段。有学者运用声谱仪,语声仪等设备对病人的上述声音进行分析。但这些设备需要专业知识强等应用不便之处。本文设计了一种基于声音的计算机...
房春英李海峰张满彩
关键词:高斯模型
Automatic detection and evaluation of Erhua in the Putonghua proficiency test
2014年
An automatic detection and evaluation method of the Erhua(also called r-retroflexion or retrofex suffixation)in the Putonghua proficiency test(PSC)is proposed.Based on the framework of the computer assisted pronunciation evaluation system,the present authors made an in-depth analysis of phonologic rules and acoustic characteristics of the Erhua,and solved the detection and evaluation of the Erhua as a typical classification problem.Then more representative acoustic features were selected and a variety of difierent classification algorithms were used.The results showed that the boosting classification and regression tree(Boosting CART)could make full use of the characteristics of the Erhua,and the classification accuracy was 92.41%.Based on further analysis of the acoustic feature group,it was found that formant,pronunciation confidence and duration were the most important clues of the Erhua,and these clues could effectively realize the automatic detection and evaluation of the Erhua.
ZHANG LongLI HaifengMA LinWANG Jianhua
关键词:普通话水平测试声学特性
基于多尺度时长音频特征的暴力音频事件检测
2014年
暴力镜头检测是近年来的研究热点之一。早期的暴力镜头检测主要依赖视频特征,由于音频信息具有良好的稳定性和在不同文化和人群之间的一致性,现在人们越来越多地关注音频信息的使用。为此研究使用音频特征对电影镜头中的暴力音频事件进行检测。为此提出了一种基于多尺度时长的特征提取方法。提取了除MFCC、LPC、能量等短时特征以外,还提取了能量均值方差、子带能量均值和方差、帧间差分等长时特征。暴力镜头中出现较多且具有代表性的音频事件有爆炸、尖叫、枪击三种。本文以电影的镜头为识别单位,使用支持向量机分类算法实现了一个检测系统。通过在15部好莱坞电影上的实验,表明本文基于多尺度时长的音频特征在暴力音频事件检测工作中,能够取得较好的结果。
徐战苍李海峰
病理语音的S变换特征及其应用
病理语音具有强烈的非平稳性和突变性特点。S变换具有良好的时频分辨率和时频定位能力。本文在S变换基础上结合人耳听觉的Mel特性,提出一种能够突出发声器官病变的病理语音特征MSCC(Mel S-Transform Cepst...
李海峰房春英马琳张满彩孙佳音
关键词:S变换
文献传递
汉语普通话水平测试中儿化音的自动检测与评价被引量:2
2014年
提出一种汉语普通话水平测试中儿化音的自动检测与评价方法。在现有计算机辅助发音评测系统的框架下,深入分析儿化音的发音规律和声学特性,将儿化音的检测与评价转化成典型的分类问题进行处理。经过挑选多个有代表性的声学特征,并尝试多种不同的分类算法,结果表明,集成分类回归树(Boosting CART)强化分类模型,能充分利用儿化音的各种声学特征,分类正确率达到92.41%。通过对声学特征组的进一步分析,发现共振峰、发音置信度、时长是表达儿化音的最重要线索,利用这些线索能有效地实现对儿化音的自动检测与评价。
张珑李海峰马琳王建华
关键词:普通话水平测试汉语声学特征分类回归树
基于脑电信号的博弈决策预测方法研究被引量:1
2018年
博弈认知状态由于其严密的逻辑性和数学框架,是脑机接口的新兴领域。近年来受到数学家、心理学家和计算机学者广泛的关注,并且已经取得一定的研究成果。首先,本文设计了具有典型博弈活动的"石头-剪刀-布"认知状态研究实验。接着对博弈活动进行了阶段性的划分。然后,采集了17个被试的脑电数据,接着对采集到的脑电数据进行:(1)脑电预览;(2)伪迹剔除与矫正;(3)数字滤波;(4)转参考;(5)Double-ICA去伪迹;(6)脑电分段;(7)基线矫正等离线预处理操作。在此基础上,分别从统计学特征、时域特征和频域特征3个方面对被试出石头、剪刀、布3种情况下的脑电信号进行特征提取,使用基于关联的特征选择方法进行特征选择。最后使用SVM分类器进行分类识别,其中SVM的核函数采用线性核函数,达到了83.3%的识别率。
刘新磊李海峰马琳
关键词:博弈统计特征功率谱
面向内容的语音信号压缩感知研究被引量:8
2012年
压缩感知理论依据信号的稀疏性质进行压缩测量,将信号的获取方式从对信号的采样上升为对信息的感知,是信号处理领域的一场革命。本文提出一种基于非确定基字典(Uncertainty Basis Dictionary,UBD)对语音信号进行稀疏表示的方法,将压缩感知理论应用于对语音信号稀疏表示的压缩,并提出了基于求解线性规划问题的方法重构语音信号的算法。通过语音识别、话者识别和情感识别实验,从面向内容分析的角度,研究这种基于压缩感知理论的信息感知方法是否保留了语音信号的主要内容。实验结果表明,语音识别、话者识别和情感识别的准确率,与目前这些领域研究方法得到的结果基本一致,说明基于压缩感知理论的信息感知方法能够很好地获取语音信号的语义、话者和情感方面的信息。
高畅李海峰马琳
关键词:压缩感知语音信号线性规划信息感知
病理语音的特征及其提取与优化
病理语音通常指的是由于发声器官发生病变而引起的异常发音,针对病理语音包含非平稳和时频域上的突变特征,本文从不同角度构建一个新的特征集,并提出可视化方法对特征集进行降维优化,实现病理语音识别率的提高,为中医闻诊提供理论依据...
李海峰房春英马琳郑丽红马晓梅王海强
文献传递
共1页<1>
聚类工具0