您的位置: 专家智库 > >

万玉奇

作品数:4 被引量:8H指数:2
供职机构:哈尔滨工业大学计算机科学与技术学院更多>>
发文基金:教育部“新世纪优秀人才支持计划”国家自然科学基金黑龙江省自然科学基金更多>>
相关领域:自动化与计算机技术理学更多>>

文献类型

  • 3篇期刊文章
  • 1篇学位论文

领域

  • 4篇自动化与计算...
  • 1篇理学

主题

  • 4篇唇读
  • 2篇特征提取
  • 2篇DCT
  • 1篇单通
  • 1篇单通道
  • 1篇语言模型
  • 1篇色度空间
  • 1篇文字
  • 1篇像素
  • 1篇聚类
  • 1篇聚类算法
  • 1篇基于像素
  • 1篇DISCRE...
  • 1篇GABOR
  • 1篇HLM
  • 1篇HMM
  • 1篇MEAN-S...
  • 1篇COSINE
  • 1篇TRANSF...

机构

  • 4篇哈尔滨工业大...

作者

  • 4篇万玉奇
  • 3篇姚鸿勋
  • 3篇洪晓鹏
  • 1篇陈蓉
  • 1篇王丹

传媒

  • 2篇计算机工程与...
  • 1篇计算机科学

年份

  • 1篇2008
  • 3篇2007
4 条 记 录,以下是 1-4
排序方式:
唇读中基于像素的特征提取方法的研究被引量:4
2007年
针对单独视觉通道唇读中的基于像素的特征提取问题,提出一个级联的特征提取策略。首先对图像采用相应的变换,然后对变换结果降维,最后进行特征归一化。基于对几种变换方法的比较与分析,提出利用PCA对DCT和Gabor小波变换结果降维的DCT-PCA和Gabor-PCA方法,与传统人工选择变换系数的方法相比识别率提高了约10%。
万玉奇姚鸿勋洪晓鹏
关键词:唇读特征提取DCTGABOR
唇读中的HLM模型及其文字流解析被引量:1
2008年
由于唇动序列和语言序列是一对多的映射,计算机自动唇读识别仅使用HMM是远远不够的。以HMM为基础,结合语言先验知识,建立了新的唇动识别模型——HLM(HMM and Bigram Language Model)。HLM突破了单纯采用HMM计算声学后验概率进行识别的传统框架,将HMM和语言背景知识紧密联系起来,依据语言模型对语言背景知识进行统计,在识别阶段融合声学后验概率和语言学先验概率进行判决。实验结果表明,HLM可使单音识别率提高7.3%,句子识别率提高19.5%。另外,采用语言模型对文字流进行解析,而不再是盲目文字匹配,单一视觉流的解析精确率达70.5%。
王丹姚鸿勋万玉奇洪晓鹏
关键词:唇读HLMHMM
提高唇读理解的关键技术研究
唇读为人机自然交互和生物特征识别提供了一种新的途径,本文主要针对单独视觉通道唇读,重点研究为提高唇读理解的关键技术中的特征提取和语言模型问题。  在唇区检测与定位方面简要介绍了自适应色度滤波模型,该模型通过对人脸区域的实...
万玉奇
关键词:特征提取语言模型色度空间
文献传递
视觉单通道唇读系统的有效性被引量:2
2007年
在建立视觉单通道的大词汇量唇读系统中,提出了归一化的U-LDCT-KL两级唇读特征提取方法,即针对唇区分块的DCT(Discrete Cosine Transform)系数进行二级KL(Karhunen-Loeve Transform)去局域参数的交叠。此方法一方面提取了唇读的最有效的低级语义特征,另一方面更加合理地选择利用了特征的有效可区分性,使得用42维二级视觉特征,对特定人的唇动内容识别正确率达到77.8%。实验还证明了系统中分块的唇区DCT特征对的视觉单通道唇读系统是最有效的。
陈蓉姚鸿勋洪晓鹏万玉奇
关键词:唇读DISCRETECOSINE
共1页<1>
聚类工具0