国家自然科学基金(61303150) 作品数:10 被引量:34 H指数:4 相关作者: 汪增福 於俊 李贤 李睿 赵军 更多>> 相关机构: 中国科学技术大学 中国科学院 更多>> 发文基金: 国家自然科学基金 中国博士后科学基金 中央高校基本科研业务费专项资金 更多>> 相关领域: 自动化与计算机技术 一般工业技术 电子电信 更多>>
基于改进逆向运动学的人体运动跟踪 被引量:4 2015年 随着人们对智能系统需求逐年增高,基于视觉的运动研究引起计算机视觉领域工作者更多的关注。这使它成为模式识别、行为学、行为处理分析与处理等学科的研究热门。现存算法存在需要标记、相机标定等各种约束条件,不能满足人们对人体运行跟踪的需求。论述了一种结合改进逆向运动学和图像模板匹配算法的人体运动位置的跟踪方法。该算法以改进逆向运动学为框架,首先依据逆向运动学知识与正向运动学知识计算出的关节点的粗略位置,对外观模型的各个模块进行模板匹配,接着确定关节点的最优位置,然后确定关节点的三维坐标值,最后重构得到三维动作序列。实验表明,在主观视觉感受与客观衡量标准两方面,此算法获得的实验结果都能够逼近乃至达到人体运动跟踪领域的最佳水准。 赵军 於俊 汪增福关键词:计算机视觉 用户接口 一种同步人脸运动跟踪与表情识别算法 被引量:6 2015年 针对单视频动态变化背景下的人脸表情识别问题,提出了一种同步人脸运动跟踪和表情识别算法,并在此基础上构建了一个实时系统.该系统达到了如下目标:首先在粒子滤波框架下结合在线外观模型和柱状几何模型进行人脸三维运动跟踪;接着基于生理知识来提取人脸表情的静态信息;然后基于流形学习来提取人脸表情的动态信息;最后在人脸运动跟踪过程中,结合人脸表情静态信息和动态信息来进行表情识别.实验结果表明,该系统在大姿态和丰富表情下具有较好的综合优势. 於俊 汪增福 李睿关键词:人脸表情识别 流形学习 粒子滤波 一种鲁棒高精度的人脸三维运动跟踪算法 被引量:2 2014年 提出了一种在粒子滤波框架下的结合在线外观模型(online appearance model,OAM)和柱状人头模型(cylinder head model,CHM)的人脸三维运动跟踪方案,具体包括:1)融合多种观测信息来降低OAM的光照敏感性和个体相关性;2)针对OAM适合跟踪局部运动但在大姿态下会跟踪失败的问题,将OAM与适合于大姿态下全局运动跟踪的CHM结合起来,在当前帧将CHM匹配得到的全局运动参数作为OAM匹配的初始值,将OAM匹配得到的人脸运动参数作为下一帧CHM匹配的初始值;3)基于局部优化和改进重采样来改进粒子运动滤波策略.实验表明:该系统在大姿态、表情剧烈变化、遮挡和强光照下能得到较好的跟踪效果,且OAM+CHM的跟踪正确率高于OAM的24%,OAM+CHM的姿态跟踪范围大于OAM的11%.主观实验表明:由跟踪得到的人脸运动参数合成的虚拟人脸具有较高的辨识度. 於俊 汪增福关键词:粒子滤波 信息融合 面向情感语音转换的韵律转换方法 被引量:9 2014年 面向情感语音转换,该文提出了一种韵律转换方法。该方法包含基频转换和时长转换两个部分,前者选择离散余弦变换(DCT)参数化基频,根据基频的层次结构特点,将基频分解为短语层和音节层两个层次,使用基于混合高斯模型(GMM)的转换方法对两个层次分别进行转换;后者使用基于分类回归树(CART)的方法以声韵母为基本单位对时长进行转换。一个包含三种基本情感的语料库用作训练和测试,客观评测以及主观评测实验结果显示该方法可有效进行情感韵律转换,其中悲伤情感在主观实验中达到了接近100%的正确率。 李贤 於俊 汪增福关键词:混合高斯模型 离散余弦变换 对数域 均方根误差 高斯分布 基于经验模式分解和多种评价准则的电子稳像 被引量:2 2014年 针对摄影中易产生视频抖动的问题,提出一个实时鲁棒的视频去抖动系统.该系统具有如下特性:1)提取参考帧和当前帧的Sift特征点,并对它们进行匹配,通过随机采样一致(RANSAC)算法来得到全局运动参数;2)基于经验模式分解以及多种评价准则(全局运动参数和特征点对位置误差)来确定抖动参数以实现对当前帧的运动补偿;3)结合图像纹理合成算法来修复运动补偿后的视频帧,从而得到稳定和完整的输出视频.通过比较抖动视频和去抖动后的视频结果表明:该系统能够在保持实时性的同时提高视频的平均信噪比约7.2dB,大大提高人对视频中内容的辨识度和观察舒适感. 於俊 汪增福关键词:图像匹配 视频修复 Synthesizing Performance-driven Facial Animation 2014年 LUO Chang-Wei YU Jun WANG Zeng-Fu关键词:人脸动画 面部表情 动画系统 人脸模型 数字字符 面向人机接口的多种输入驱动的三维虚拟人头 被引量:2 2013年 面向人机接口领域,文中提出了一个可由多种输入驱动的三维虚拟人头系统.该系统具有如下特性:(1)由视频、文本和语音多种输入驱动,增加了与人交互的多样性;(2)在粒子滤波框架下根据在线外观模型跟踪视频中的人脸三维运动,并且融合多种观测信息来降低在线外观模型的光照敏感性和个体相关性;(3)参数模型和肌肉模型相结合的三维人脸动画,在保持生理结构的基础上描述人脸运动,进而达到高真实感,同时大大降低了计算量;(4)在保持正确率的前提下,采用三音子模型降低了可视化协同发音模型的计算复杂度.对该虚拟人头的客观和主观测试验证了其在人机交互上的有效性. 於俊 汪增福关键词:人机接口 人脸动画 基于SIFT特征匹配的实时鲁棒视频去抖动系统 被引量:4 2014年 面向视频去抖动领域,提出了一个实时系统。在有效地利用尺度不变特征转换算法的鲁棒特征提取特性和随机采样一致算法的鲁棒拟合特性的基础上,所提系统可以根据运动参数的变化剧烈程度,自动调整低通滤波器的尺寸来确定抖动参数以实现图像补偿,从而有效地避免了过稳和欠稳现象;所提系统将丰富的视频参考信息与图像纹理合成算法结合起来,有效地提高了输出视频的稳定性和完整性。客观实验结果表明,该系统在峰值信噪比和耗时方面具有较好的综合优势。主观实验结果表明,所提系统在消除抖动视频中让人不舒适感方面具有较好的优越性。 於俊 汪增福关键词:图像匹配 视频修复 A Vivid Visual Emotion Synthesis System:From Face To Hair A visual emotional synthesis system is proposed. Firstly, facial expression is synthesized by the anatomical m... Jun Yu Lingyan Li