您的位置: 专家智库 > >

张田

作品数:2 被引量:4H指数:1
供职机构:哈尔滨工业大学计算机科学与技术学院更多>>
发文基金:国家自然科学基金黑龙江省留学归国人员基金更多>>
相关领域:电子电信自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 1篇电子电信
  • 1篇自动化与计算...

主题

  • 1篇信息可视化
  • 1篇旋律
  • 1篇音乐
  • 1篇音乐认知
  • 1篇音乐旋律
  • 1篇音频
  • 1篇音频检索
  • 1篇语音
  • 1篇语音识别
  • 1篇数字媒体
  • 1篇听觉
  • 1篇文本检索
  • 1篇媒体
  • 1篇可视化

机构

  • 2篇哈尔滨工业大...

作者

  • 2篇李海峰
  • 2篇张田
  • 1篇高畅
  • 1篇孙佳音
  • 1篇邱荣发
  • 1篇马琳
  • 1篇李嵩

传媒

  • 1篇燕山大学学报
  • 1篇信号处理

年份

  • 2篇2010
2 条 记 录,以下是 1-2
排序方式:
基于音频的数字媒体内容分析及其可视化
2010年
为了对音视频内容进行更加有效地分析,将信息可视化方法引入数字媒体信息处理领域。设计并实现了集多媒体信号采集、大词表连续语音识别、文本检索和音频检索为一身的多媒体内容可视化分析平台,取得了较理想的效果,充实了信息可视化理论并对其具体应用进行了有益尝试。
张田李嵩高畅邱荣发李海峰
关键词:信息可视化语音识别文本检索音频检索
基于音乐认知原理的音乐旋律发现技术被引量:4
2010年
旋律是音乐主题思想的最重要表现手段,分析音乐的旋律、研究智能旋律分析处理方法是音乐信息检索领域的重要课题之一。本文根据脑神经科学及认知心理学关于人类对音乐感知特点的研究成果,引入听觉显著度(AS)的概念,提出了基于音乐认知理论的模拟人类认知过程的旋律发现技术。在前期处理阶段,针对音乐特性采用常数Q变换(CQT)建立音乐的频谱统计模型,采用贝叶斯理论计算每个半音子带数据分布的听觉显著度特征,利用时序神经网络检测各个时刻的听觉变化,得到旋律分量的候选。在后期处理阶段,我们提出了表达形式接近乐理与认知的旋律流(MelodyStream)的概念,以人对音乐和弦感知结果作为先验知识,进行旋律候选分量的规范化处理。在包含各种乐曲风格的实验音乐数据库上,验证了所提取结果同人类听感的接近程度,根据旋律流来捕捉传统旋律线获得了75%的准确率,主观听感打分对旋律流的接受度超过90%。
李海峰孙佳音张田马琳
关键词:音乐认知
共1页<1>
聚类工具0