王瑞平
- 作品数:15 被引量:39H指数:3
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家自然科学基金中国科学院“百人计划”国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 视频人脸识别进展综述被引量:10
- 2021年
- 人脸识别是生物特征识别领域的一项关键技术,长期以来得到研究者的广泛关注。视频人脸识别任务特指从一段视频中提取出人脸的关键信息,从而完成身份识别。相较于基于图像的人脸识别任务来说,视频数据中的人脸变化模式更为多样且视频帧之间存在较大差异,如何从冗长而复杂的视频中抽取到人脸的关键特征成为当前的研究重点。以视频人脸识别技术为研究对象,首先介绍了该技术的研究价值和存在的挑战;接着对当前研究工作的发展脉络进行了系统的梳理,依据建模方式将传统基于图像集合建模的方法分为线性子空间建模、仿射子空间建模、非线性流形建模、统计建模四大类,同时对深度学习背景下基于图像融合的方法进行了介绍;另外对现有视频人脸识别数据集进行分类整理并简要介绍了常用的评价指标;最后分别采用灰度特征和深度特征在YTC数据集及IJB-A数据集上对代表性工作进行评测。实验结果表明:神经网络可以从大规模数据中提取到鲁棒的视频帧特征,从而带来识别性能的大幅提升,而有效的视频数据建模能够挖掘出人脸潜在的变化模式,从视频序列包含的大量样本中找到更具判别力的关键信息,排除噪声样本的干扰,因此基于视频的人脸识别具有广泛的通用性和实用价值。
- 白子轶毛懿荣王瑞平
- 关键词:视频人脸识别子空间学习流形学习
- 视觉模式的局部建模及非线性特征获取理论与方法研究
- 陈熙霖山世光高文王瑞平张文超柴秀娟
- 该成果属于模式识别和计算机图像处理领域。主要发现点包括:提出了借鉴人类视觉特性的局部模式建模方法;提出了视觉内在非线性信息的提取与度量方法;提出了逆成像过程分析的建模方法。成果共发表论文70篇,其中包括IEEETrans...
- 关键词:
- 关键词:模式识别计算机图像处理
- 一种常识增强的图像合成方法及装置
- 本发明提出一种常识增强的图像合成方法,包括:数据准备步骤,选取场景描述模型对已知多模态数据进行处理,以获取物体于环境中放置位置的常识知识;模型训练步骤,对已知图像进行位置描述标注,生成训练集,以该训练集对合成模型进行训练...
- 秦亚璇许嘉钰王瑞平陈熙霖
- 大规模视觉检索前沿技术进展被引量:1
- 2020年
- 近年来,随着深度学习和人工智能技术的不断进步,大规模视觉检索技术也取得了长足的发展,在实际生活中的应用也越来越广泛。本文简要介绍了视觉检索技术的产生背景和基本流程,回顾了传统的实值特征检索技术,重点阐述了近年来备受关注的基于哈希学习的二值检索技术,最后介绍了大规模视觉检索技术在新零售、娱乐、安防领域的一些成功应用实践。
- 王睿岿王瑞平
- 关键词:人工智能技术安防领域视觉
- 一种多角度物体检测方法和系统
- 本发明涉及一种多角度物体检测方法,包括:以深度神经网络构建检测模型;对训练图提取特征以获得多个特征图,设置多个垂直矩形锚框,获取该垂直矩形锚框与该训练图的样本物体的相交比,并以该相交比大于正例阈值的垂直矩形锚框标记为该训...
- 刘永王瑞平山世光陈熙霖
- 文献传递
- 开放世界物体识别与检测系统:现状、挑战与展望
- 2024年
- 探究了从封闭环境到开放世界环境的转变及其对视觉感知(集中于物体识别和检测)与深度学习领域的影响.在开放世界环境中,系统软件需适应不断变化的环境和需求,这为深度学习方法带来新挑战.特别是,开放世界视觉感知要求系统理解和处理训练阶段未见的环境和物体,这超出了传统封闭系统的能力.首先讨论了技术进步带来的动态、自适应系统需求,突出了开放系统相较封闭系统的优势.接着,深入探讨了开放世界的定义和现有工作,涵盖开集学习、零样本学习、小样本学习、长尾学习、增量学习等5个开放维度.在开放世界物体识别方面,分析了每个维度的核心挑战,并为每个任务数据集提供了量化的评价指标.对于开放世界物体检测,讨论了检测相比识别的新增挑战,如遮挡、尺度、姿态、共生关系、背景干扰等,并强调了仿真环境在构建开放世界物体检测数据集中的重要性.最后,强调开放世界概念为深度学习带来的新视角和机遇,是推动技术进步和深入理解世界的机会,为未来研究提供参考.
- 聂晖王瑞平陈熙霖
- 关键词:视觉感知评价指标仿真环境
- 基于支持向量机的人脸检测训练集增强被引量:22
- 2008年
- 根据支持向量机(support vector machine,简称SVM)理论,对基于边界的分类算法(geometric approach)而言,类别边界附近的样本通常比其他样本包含有更多的分类信息.基于这一基本思路,以人脸检测问题为例,探讨了对给定训练样本集进行边界增强的问题,并为此而提出了一种基于支持向量机和改进的非线性精简集算法IRS(improved reduced set)的训练集边界样本增强算法,用以扩大训练集并改善其样本分布.其中,所谓IRS算法是指在精简集(reduced set)算法的核函数中嵌入一种新的距离度量——图像欧式距离——来改善其迭代近似性能,IRS可以有效地生成新的、位于类别边界附近的虚拟样本以增强给定训练集.为了验证算法的有效性,采用增强的样本集训练基于AdaBoost的人脸检测器,并在MIT+CMU正面人脸测试库上进行了测试.实验结果表明,通过这种方法能够有效地提高最终分类器的人脸检测性能.
- 王瑞平陈杰山世光陈熙霖高文
- 关键词:人脸检测支持向量机ADABOOST
- 一种多角度物体检测方法和系统
- 本发明涉及一种多角度物体检测方法,包括:以深度神经网络构建检测模型;对训练图提取特征以获得多个特征图,设置多个垂直矩形锚框,获取该垂直矩形锚框与该训练图的样本物体的相交比,并以该相交比大于正例阈值的垂直矩形锚框标记为该训...
- 刘永王瑞平山世光陈熙霖
- 文献传递
- 基于深度学习和哈希编码的图像检索方法
- 本发明涉及一种基于深度学习和哈希编码的模型训练方法,包括将部分标注的图像数据作为网络模型的训练数据,通过深度网络将所述训练数据表示为类二值哈希编码,其中,所述类二值哈希编码是指取值是连续值的一种模拟二值哈希编码;将获得的...
- 陈熙霖刘昊淼王瑞平
- 附加偏见预测器辅助的均衡化场景图生成
- 2022年
- 场景图是以场景中的物体为结点、以物体之间的关系为边构成的图结构,在视觉与语言交互理解和推理相关任务中具有广泛的应用前景.近年来,场景图自动生成逐渐受到关注,但生成结果中对于关系的描述受到长尾分布带来的偏见的影响,偏向于样本量较大的头部关系.然而头部关系往往过于空泛,描述不够准确,容易造成误解.由于这种关系价值不高,生成的场景图近似于退化为场景中物体信息的堆叠,不利于其他应用在图结构上进行结构化推理.为了使场景图生成器在这种不均衡的数据条件下,能够更均衡地学习,给出更加多样化的特别是尾部的更准确的关系,本文提出一种附加偏见预测器(additional biased predictor,ABP)辅助的均衡化学习方法.该方法利用一条有偏见的关系预测分支,令场景图生成器抑制自身对头部关系的偏好,并更加注重尾部关系的学习.场景图生成器需要为指定的一对物体预测关系,这是一种实例级的关系预测,与之相比,有偏分支以更简洁的方式预测出图像中的关系信息,即不指定任何一对物体,直接预测出图像中存在的关系,这是一种区域级的关系预测.为此,本文利用已有的实例级的关系标注,设计算法自动构造区域级的关系标注,以此来训练该有偏分支,使其具有区域级关系预测的能力.在不同场景图生成器上应用ABP方法,并在多个公开数据集(Visual Genome,VRD和OpenImages等)上进行实验,结果表明,ABP方法具有通用性,应用ABP方法训练得到的场景图生成器能够预测出更加多样化的、更准确的关系,进而生成更有价值、更实用的场景图.
- 王文彬王瑞平陈熙霖