欧智坚
- 作品数:38 被引量:73H指数:5
- 供职机构:清华大学更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信语言文字文化科学更多>>
- 一种高效的语音关键词检索系统被引量:12
- 2006年
- 针对音频检索任务中的关键词检索提出一种新的基于拼音图的两阶段检索系统,可以高效地从大量语音数据中检索出感兴趣的文本信息,从而达到为国家安全服务的目的。该系统分为预处理阶段和检索阶段。预处理阶段将语音数据识别成具有高覆盖率的拼音图,在这一过程中通过若干次的无监督最大似然线性回归自适应算法渐次提高拼音图的质量。检索阶段响应用户的频繁查询,只需在拼音图中查找出与关键词拼音匹配的拼音串,并采用基于N元拼音文法的前后向算法计算置信度以实现对检索结果的筛选。实验表明:系统具有较高的召回率和正确率,且检索阶段仅需0.01倍实时,可以满足快速检索的需要。
- 罗骏欧智坚
- 关键词:信息检索关键词检索置信度
- 基于VTS的稳健语音识别
- 2005年
- 为了进一步提高矢量Taylor级数(VTS)算法的模型补偿精度以及在噪声环境下的识别性能,提出将无监督聚类与VTS算法相结合。无监督聚类算法利用噪声模型之间的Kullback-Leibler距离将含噪语音段划分为若干个子段。然后针对各个子段分别进行一阶Taylor级数展开,并在此基础上逐段估计噪声参数和补偿声学模型。该算法结合一个中文数字串识别系统进行实验,在Babble噪声和Gauss白噪声环境下该算法的误识率相对传统的VTS算法分别下降了27.7%和17.8%。证明这种结合无监督聚类的分段VTS算法能够更加有效地将语音和噪声在倒谱域上的非线性混合模型用一阶线性模型来近似。
- 赵贤宇欧智坚王作英
- 关键词:信息处理语音识别模型自适应稳健性
- 一种高效的语音关键词检索系统
- 本文针对音频检索任务中的关键词检索提出一种新的基于拼音图的两阶段检索系统,可以高效地从大量语音数据中检索出感兴趣的文本信息,从而达到为国家安全服务的目的。该系统分为预处理阶段和检索阶段。预处理阶段将语音数据识别成具有高覆...
- 罗骏欧智坚
- 关键词:信息检索关键词检索置信度
- 文献传递
- 对话状态跟踪方法、装置、计算机设备和存储介质
- 本申请涉及一种对话状态跟踪方法、装置、计算机设备和存储介质,通过获取当前轮对话文本,根据所述对话文本与富对话状态跟踪规则,确定当前轮对话语义,再根据所述对话语义与上一轮对话状态,更新当前轮对话状态。采用本方法能够提高对话...
- 欧智坚戴音培张毅
- 文献传递
- 一种高效的语音关键词检索系统
- 本文针对音频检索任务中的关键词检索提出一种新的基于拼音图的两阶段检索系统,可以高效地从大量语音数据中检索出感兴趣的文本信息,从而达到为国家安全服务的日的。该系统分为预处理阶段和检索阶段。预处理阶段将语音数据识别成具有高覆...
- 罗骏欧智坚
- 关键词:语音数据关键词检索
- 文献传递
- 融合神经网络与电力领域知识的智能客服对话系统研究被引量:8
- 2020年
- 为了开发面向电力领域的智能客服对话系统,提出了融合神经网络和电力领域知识的方法。利用基于神经网络的自然语言理解技术从客户的话中提取有用信息;利用对话流配置框架和知识图谱将电力客服业务流程、客服数据库和标准问答对等电力领域知识融入对话系统,指导对话系统给出正确的回复。最后通过实现两个电力领域客服对话系统验证了方法的可行性。
- 吕诗宁张毅胡若云沈然江俊军欧智坚
- 关键词:神经网络
- 最大似然线性回归说话人自适应算法在LPHMM中的应用
- 本文提出了一种改进的最大似然线性回归说话人自适应方法一线性预测最大似然线性回归说话人自适应方法.由于LPHMM相比于经典的HMM充分利用了语音信号的时间相关性信息,能更充分地描述语音特性,因此将MLLR应用在LPHMM中...
- 王晶莹王作英欧智坚
- 关键词:语音识别自适应算法
- 文献传递
- 汉语连续语音识别中多项式拟合语音轨迹模型的研究
- 2003年
- 尽管作为当前最为流行的语音识别模型 ,HMM由于采用状态输出独立同分布假设 ,忽略了对语音轨迹动态特性的描述 .本文基于一个更为灵活的语音描述统计框架—广义DDBHMM ,提出了一个具体的多项式拟合语音轨迹模型 ,以及新的训练和识别算法 ,更好地刻划了真实的语音特性 .本文还给出了一种有效的剪枝算法 ,得到一个实用化模型 .汉语大词汇量非特定人连续语音识别的实验表明 。
- 欧智坚王作英
- 关键词:连续语音识别隐马尔可夫模型
- 一种MPEG压缩域上的快速场景分割算法被引量:7
- 1999年
- 本文提出了一种MPEG压缩域上的快速场景分割算法,该算法目前主要针对的是新闻节目。它采用了依次对MPEG码流中的Ⅰ帧间,然后P帧间,最后B帧间的场景分割进行定位的方法。在该算法的基础上可以快速地完成对MPEG码流的分割,并对每个场景提取Ⅰ帧作为关键帧,从而为新闻视频数据库的建立提供了基础。
- 叶楠欧智坚郑志航
- 关键词:MPEG视频压缩
- 基于交叉熵的音频指纹快速搜索方法
- 基于交叉熵的音频指纹快速搜索方法,属于音频指纹搜索技术领域,其特征在于,利用共分量高斯混合模型来描述音频指纹,并且用交叉熵来衡量音频指纹间的距离,然后用广义动态时序比对方法,以滑动窗方式将用户指定音频段与输入音频流进行指...
- 欧智坚林晖
- 文献传递