陈恳
- 作品数:72 被引量:182H指数:7
- 供职机构:宁波大学信息科学与工程学院更多>>
- 发文基金:宁波市自然科学基金国家自然科学基金浙江省教育厅科研计划更多>>
- 相关领域:自动化与计算机技术电子电信文化科学更多>>
- 一种快速深度视频编码方法
- 本发明公开了一种快速深度视频编码方法,通过将多视点深度视频预测编码结构中的所有视点分为主视点、第一级辅助视点和第二级辅助视点三类,且针对不同视点不同类型的编码帧采取不同的快速编码策略,利用已编码帧信息判断深度视频信号的视...
- 郁梅姒越后蒋刚毅陈恳彭宗举邵枫
- 文献传递
- 基于形状及边界参数的凸形图像公制周长的计算方法研究
- 2008年
- 基于二值凸形图像的形状及边界参数,提出一种以毫米为度量单位进行周长计算的方法.需首先进行毫米/单位像素的换算,然后对凸形图像的原始灰度图进行二值化处理以便于边界识别,再基于边界来进行图像形状及边界参数的提取.将这些参数作为回归变量建立多元线性回归模型,用以估算凸形图像的周长偏移率,进而估算其周长.实验结果表明:本算法具有精度高、易实现等特点,为相关图像图形分析提供一定的理论参考。
- 赵攀陈恳汪一聪杨任尔
- 关键词:特征参数提取
- 基于稀疏DBN和双向LSTM的视觉语音识别算法被引量:4
- 2019年
- 唇部视觉信息作为语音识别的辅助信息一直受到广泛关注,为更好的提取唇部视觉信息,提出一种基于稀疏深度信念网络(Deep Belief Network,DBN)和双向长短期记忆网络(Bidirectional Long Short-Term Memory,BiLSTM)的视觉语音识别算法。该算法通过在DBN的目标函数后引入混合的范数和范数来实现DBN的稀疏表示,以此稀疏DBN对唇部视觉信息进行稀疏瓶颈特征的提取,再将提取的瓶颈特征送入BiLSTM进行特征的学习分类。实验表明,该算法能有效的识别唇部视觉信息。
- 王一鸣陈恳
- 基于光线空间插值的任意视点绘制被引量:2
- 2009年
- 本文提出了一种基于改进动态规划的光线空间插值方法,区别于传统的动态规划算法,本文先利用扫描线间的平滑约束来消除条纹效应,并采用增量计算方案来加速动态规划算法中最耗时的匹配代价计算.然后,采用以视点为中心的视差估计方法插值出稠密的光线空间数据.最后,从光线空间数据快速生成高质量的任意视点图像.该方案采用Middlebury和3DTV数据库作为测试数据,实验结果表明,新方法在计算效率和生成视点图像的PSNR上优于块匹配插值方法和视差域滤波方法.
- 蒋刚毅范良忠郁梅陈恳
- 关键词:动态规划
- 融合显著度时空上下文的超像素跟踪算法被引量:1
- 2017年
- 为了更有效地利用目标的特征信息,提高目标的跟踪精度和鲁棒性,提出融合显著度时空上下文的超像素跟踪算法.首先对目标上下文区域进行超像素分割,根据运动信息计算目标上下文的运动相关性及特征协方差信息,得到相关性显著度.然后基于贝叶斯框架,在频域构建融合显著度信息的时空上下文模型.再利用联合颜色和纹理的直方图信息计算巴氏系数,更新时空上下文模型.此外,引入尺度金字塔模型,准确估计目标尺度.最后加入低通滤波自适应运动预测模块,在线更新动态模型样本集,使用岭回归方法实现低通滤波的参数在线更新.在公共数据上的实验表明,文中算法在光照变化、背景复杂、目标旋转、机动性高、分辨率低等情况下具有较好的跟踪效果.
- 郭春梅陈恳李萌李斐
- 关键词:目标跟踪岭回归
- 基于帧的多描述视频编码冗余插入研究
- 视频流在不可靠网络上传输时,可能会引起整帧的丢失,继而导致整个视频序列质量严重恶化。为了解决这个问题,本文使用基于帧的多描述视频编码,并提出采用预测的预处理和后处理过程方案,实现描述间的冗余插入。仿真实验结果表明,这种编...
- 杨任尔陈恳叶庆卫
- 关键词:视频流多描述视频编码多路径传输
- 文献传递
- 强跟踪卡尔曼滤波在视频目标跟踪中的应用被引量:13
- 2011年
- 针对经典卡尔曼滤波器在滤波数学模型与实际过程的数学规律不匹配、滤波特性较差的情况,提出利用强跟踪卡尔曼滤波器对视频序列图像中的运动目标进行跟踪。该方法是在经典卡尔曼滤波递推公式中的一步验前误差方差阵中引入可在线计算的时变渐消矩阵,从而调节增益K,使之能够不断变化,保证对新息序列的自适应调节,使状态滤波更准确。实验结果表明,较之经典卡尔曼滤波,该方法具有对运动目标更强的跟踪能力,跟踪精度更高,均方误差更小。
- 赵学梅陈恳李冬
- 关键词:视频图像目标跟踪
- 一种三维立体视频编码方法
- 本发明公开了一种三维立体视频编码方法,其通过建立彩色视频与深度视频的码率分配模型,分别获得对立体彩色视频和立体深度视频编码的目标码率和初始编码量化参数,然后根据目标码率和初始编码量化参数分别对立体彩色视频和立体深度视频进...
- 邵枫蒋刚毅郁梅陈恳
- 文献传递
- 基于语音PZCPA时频域特征融合的语音情感识别方法被引量:1
- 2021年
- 从人类自然语言中提取和准确分类语音中的情感状态一直是人机交互的一个难点,同时相关研究在人工智能领域发挥着至关重要的作用。为了使语音情感识别系统有更好的鲁棒性,本文提出新的语音情感识别算法结构,主要包括PZCPA特征的提取方法,并且使用该特征进行基于深度学习的时域和频域特征融合,最后使用KNN进行语音情感识别。该算法在德国柏林语音情感数据库中加以验证,并且使用混淆矩阵做出了评价。通过实验得出,算法的整体识别率到达了88.33%,其中对生气的识别率达到了95%,此外,其中能量较低、特征较为一般的恐惧、悲伤、中性这三种情感的识别率达到了83.33%、86.67%、86.64%,平均识别率比传统的方法提高了13.3%。最终结果表明,本文提出算法语音情感识别性能优越于同类算法。
- 阿卜杜萨拉木•艾海提陈恳
- 关键词:特征提取情感识别
- 基于鞍点搜索的粘连对象图像分割方法被引量:1
- 2009年
- 针对图像中不规则形状物体接触的分割问题,提出一种采用Hessian矩阵来判断分割点(即鞍点)进行粘连对象分割的方法。根据对图像进行腐蚀操作得到的三维地貌图,结合鞍点的数学特性,运用Hessian矩阵的特征值对鞍点进行搜索定位,沿经过鞍点的最大梯度路径分割粘连对象。与目前已有的几种分割算法相比,该方法具有算法简捷、分割效果好以及易于实现的特点。
- 汪一聪陈恳
- 关键词:鞍点HESSIAN矩阵特征值