您的位置: 专家智库 > >

欧智坚

作品数:38 被引量:73H指数:5
供职机构:清华大学更多>>
发文基金:国家高技术研究发展计划国家自然科学基金更多>>
相关领域:自动化与计算机技术电子电信语言文字文化科学更多>>

文献类型

  • 18篇期刊文章
  • 10篇专利
  • 9篇会议论文
  • 1篇学位论文

领域

  • 21篇自动化与计算...
  • 14篇电子电信
  • 1篇文化科学
  • 1篇语言文字

主题

  • 19篇语音
  • 15篇语音识别
  • 8篇自适
  • 8篇自适应
  • 5篇信息处理
  • 5篇信息检索
  • 5篇存储介质
  • 4篇马尔可夫
  • 4篇马尔可夫模型
  • 4篇混合模型
  • 4篇计算机
  • 4篇关键词检索
  • 3篇音频
  • 3篇隐马尔可夫模...
  • 3篇用户
  • 3篇帧间
  • 3篇帧间相关性
  • 3篇置信度
  • 3篇神经网
  • 3篇神经网络

机构

  • 37篇清华大学
  • 4篇中国移动通信...
  • 2篇中国移动通信...
  • 1篇上海交通大学
  • 1篇国家电网有限...
  • 1篇中国电力科学...
  • 1篇国网浙江省电...
  • 1篇国网浙江省电...
  • 1篇国家电网有限...

作者

  • 38篇欧智坚
  • 14篇王作英
  • 8篇罗骏
  • 3篇林晖
  • 3篇赵贤宇
  • 2篇王晶莹
  • 2篇张毅
  • 2篇谢达东
  • 2篇孙怿
  • 1篇孟一鸣
  • 1篇孙甲松
  • 1篇郑志航
  • 1篇叶楠
  • 1篇肖述才
  • 1篇刘红
  • 1篇邓侃
  • 1篇周佳俊

传媒

  • 3篇清华大学学报...
  • 2篇电讯技术
  • 2篇通信学报
  • 2篇电子学报
  • 2篇广播与电视技...
  • 2篇中文信息学报
  • 1篇计算机应用与...
  • 1篇计算机应用研...
  • 1篇计算机工程与...
  • 1篇浙江电力
  • 1篇数字通信世界
  • 1篇2005全国...
  • 1篇2007年全...
  • 1篇第八届全国人...
  • 1篇全国网络与信...
  • 1篇第八届全国人...
  • 1篇全国网络与信...
  • 1篇全国网络与信...

年份

  • 4篇2023
  • 3篇2022
  • 3篇2021
  • 2篇2020
  • 1篇2019
  • 1篇2016
  • 2篇2013
  • 1篇2010
  • 1篇2008
  • 1篇2007
  • 1篇2006
  • 7篇2005
  • 4篇2004
  • 2篇2003
  • 1篇2002
  • 3篇2001
  • 1篇1999
38 条 记 录,以下是 1-10
排序方式:
一种高效的语音关键词检索系统被引量:12
2006年
针对音频检索任务中的关键词检索提出一种新的基于拼音图的两阶段检索系统,可以高效地从大量语音数据中检索出感兴趣的文本信息,从而达到为国家安全服务的目的。该系统分为预处理阶段和检索阶段。预处理阶段将语音数据识别成具有高覆盖率的拼音图,在这一过程中通过若干次的无监督最大似然线性回归自适应算法渐次提高拼音图的质量。检索阶段响应用户的频繁查询,只需在拼音图中查找出与关键词拼音匹配的拼音串,并采用基于N元拼音文法的前后向算法计算置信度以实现对检索结果的筛选。实验表明:系统具有较高的召回率和正确率,且检索阶段仅需0.01倍实时,可以满足快速检索的需要。
罗骏欧智坚
关键词:信息检索关键词检索置信度
基于VTS的稳健语音识别
2005年
为了进一步提高矢量Taylor级数(VTS)算法的模型补偿精度以及在噪声环境下的识别性能,提出将无监督聚类与VTS算法相结合。无监督聚类算法利用噪声模型之间的Kullback-Leibler距离将含噪语音段划分为若干个子段。然后针对各个子段分别进行一阶Taylor级数展开,并在此基础上逐段估计噪声参数和补偿声学模型。该算法结合一个中文数字串识别系统进行实验,在Babble噪声和Gauss白噪声环境下该算法的误识率相对传统的VTS算法分别下降了27.7%和17.8%。证明这种结合无监督聚类的分段VTS算法能够更加有效地将语音和噪声在倒谱域上的非线性混合模型用一阶线性模型来近似。
赵贤宇欧智坚王作英
关键词:信息处理语音识别模型自适应稳健性
一种高效的语音关键词检索系统
本文针对音频检索任务中的关键词检索提出一种新的基于拼音图的两阶段检索系统,可以高效地从大量语音数据中检索出感兴趣的文本信息,从而达到为国家安全服务的目的。该系统分为预处理阶段和检索阶段。预处理阶段将语音数据识别成具有高覆...
罗骏欧智坚
关键词:信息检索关键词检索置信度
文献传递
对话状态跟踪方法、装置、计算机设备和存储介质
本申请涉及一种对话状态跟踪方法、装置、计算机设备和存储介质,通过获取当前轮对话文本,根据所述对话文本与富对话状态跟踪规则,确定当前轮对话语义,再根据所述对话语义与上一轮对话状态,更新当前轮对话状态。采用本方法能够提高对话...
欧智坚戴音培张毅
文献传递
一种高效的语音关键词检索系统
本文针对音频检索任务中的关键词检索提出一种新的基于拼音图的两阶段检索系统,可以高效地从大量语音数据中检索出感兴趣的文本信息,从而达到为国家安全服务的日的。该系统分为预处理阶段和检索阶段。预处理阶段将语音数据识别成具有高覆...
罗骏欧智坚
关键词:语音数据关键词检索
文献传递
融合神经网络与电力领域知识的智能客服对话系统研究被引量:8
2020年
为了开发面向电力领域的智能客服对话系统,提出了融合神经网络和电力领域知识的方法。利用基于神经网络的自然语言理解技术从客户的话中提取有用信息;利用对话流配置框架和知识图谱将电力客服业务流程、客服数据库和标准问答对等电力领域知识融入对话系统,指导对话系统给出正确的回复。最后通过实现两个电力领域客服对话系统验证了方法的可行性。
吕诗宁张毅胡若云沈然江俊军欧智坚
关键词:神经网络
最大似然线性回归说话人自适应算法在LPHMM中的应用
本文提出了一种改进的最大似然线性回归说话人自适应方法一线性预测最大似然线性回归说话人自适应方法.由于LPHMM相比于经典的HMM充分利用了语音信号的时间相关性信息,能更充分地描述语音特性,因此将MLLR应用在LPHMM中...
王晶莹王作英欧智坚
关键词:语音识别自适应算法
文献传递
汉语连续语音识别中多项式拟合语音轨迹模型的研究
2003年
尽管作为当前最为流行的语音识别模型 ,HMM由于采用状态输出独立同分布假设 ,忽略了对语音轨迹动态特性的描述 .本文基于一个更为灵活的语音描述统计框架—广义DDBHMM ,提出了一个具体的多项式拟合语音轨迹模型 ,以及新的训练和识别算法 ,更好地刻划了真实的语音特性 .本文还给出了一种有效的剪枝算法 ,得到一个实用化模型 .汉语大词汇量非特定人连续语音识别的实验表明 。
欧智坚王作英
关键词:连续语音识别隐马尔可夫模型
一种MPEG压缩域上的快速场景分割算法被引量:7
1999年
本文提出了一种MPEG压缩域上的快速场景分割算法,该算法目前主要针对的是新闻节目。它采用了依次对MPEG码流中的Ⅰ帧间,然后P帧间,最后B帧间的场景分割进行定位的方法。在该算法的基础上可以快速地完成对MPEG码流的分割,并对每个场景提取Ⅰ帧作为关键帧,从而为新闻视频数据库的建立提供了基础。
叶楠欧智坚郑志航
关键词:MPEG视频压缩
基于交叉熵的音频指纹快速搜索方法
基于交叉熵的音频指纹快速搜索方法,属于音频指纹搜索技术领域,其特征在于,利用共分量高斯混合模型来描述音频指纹,并且用交叉熵来衡量音频指纹间的距离,然后用广义动态时序比对方法,以滑动窗方式将用户指定音频段与输入音频流进行指...
欧智坚林晖
文献传递
共4页<1234>
聚类工具0