王瑞平
- 作品数:16 被引量:39H指数:3
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家自然科学基金中国科学院“百人计划”国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 视频人脸识别进展综述被引量:10
- 2021年
- 人脸识别是生物特征识别领域的一项关键技术,长期以来得到研究者的广泛关注。视频人脸识别任务特指从一段视频中提取出人脸的关键信息,从而完成身份识别。相较于基于图像的人脸识别任务来说,视频数据中的人脸变化模式更为多样且视频帧之间存在较大差异,如何从冗长而复杂的视频中抽取到人脸的关键特征成为当前的研究重点。以视频人脸识别技术为研究对象,首先介绍了该技术的研究价值和存在的挑战;接着对当前研究工作的发展脉络进行了系统的梳理,依据建模方式将传统基于图像集合建模的方法分为线性子空间建模、仿射子空间建模、非线性流形建模、统计建模四大类,同时对深度学习背景下基于图像融合的方法进行了介绍;另外对现有视频人脸识别数据集进行分类整理并简要介绍了常用的评价指标;最后分别采用灰度特征和深度特征在YTC数据集及IJB-A数据集上对代表性工作进行评测。实验结果表明:神经网络可以从大规模数据中提取到鲁棒的视频帧特征,从而带来识别性能的大幅提升,而有效的视频数据建模能够挖掘出人脸潜在的变化模式,从视频序列包含的大量样本中找到更具判别力的关键信息,排除噪声样本的干扰,因此基于视频的人脸识别具有广泛的通用性和实用价值。
- 白子轶毛懿荣王瑞平
- 关键词:视频人脸识别子空间学习流形学习
- 视觉模式的局部建模及非线性特征获取理论与方法研究
- 陈熙霖山世光高文王瑞平张文超柴秀娟
- 该成果属于模式识别和计算机图像处理领域。主要发现点包括:提出了借鉴人类视觉特性的局部模式建模方法;提出了视觉内在非线性信息的提取与度量方法;提出了逆成像过程分析的建模方法。成果共发表论文70篇,其中包括IEEETrans...
- 关键词:
- 关键词:模式识别计算机图像处理
- 一种常识增强的图像合成方法及装置
- 本发明提出一种常识增强的图像合成方法,包括:数据准备步骤,选取场景描述模型对已知多模态数据进行处理,以获取物体于环境中放置位置的常识知识;模型训练步骤,对已知图像进行位置描述标注,生成训练集,以该训练集对合成模型进行训练...
- 秦亚璇许嘉钰王瑞平陈熙霖
- 大规模视觉检索前沿技术进展被引量:1
- 2020年
- 近年来,随着深度学习和人工智能技术的不断进步,大规模视觉检索技术也取得了长足的发展,在实际生活中的应用也越来越广泛。本文简要介绍了视觉检索技术的产生背景和基本流程,回顾了传统的实值特征检索技术,重点阐述了近年来备受关注的基于哈希学习的二值检索技术,最后介绍了大规模视觉检索技术在新零售、娱乐、安防领域的一些成功应用实践。
- 王睿岿王瑞平
- 关键词:人工智能技术安防领域视觉
- 一种多角度物体检测方法和系统
- 本发明涉及一种多角度物体检测方法,包括:以深度神经网络构建检测模型;对训练图提取特征以获得多个特征图,设置多个垂直矩形锚框,获取该垂直矩形锚框与该训练图的样本物体的相交比,并以该相交比大于正例阈值的垂直矩形锚框标记为该训...
- 刘永王瑞平山世光陈熙霖
- 文献传递
- 开放世界物体识别与检测系统:现状、挑战与展望
- 2024年
- 探究了从封闭环境到开放世界环境的转变及其对视觉感知(集中于物体识别和检测)与深度学习领域的影响.在开放世界环境中,系统软件需适应不断变化的环境和需求,这为深度学习方法带来新挑战.特别是,开放世界视觉感知要求系统理解和处理训练阶段未见的环境和物体,这超出了传统封闭系统的能力.首先讨论了技术进步带来的动态、自适应系统需求,突出了开放系统相较封闭系统的优势.接着,深入探讨了开放世界的定义和现有工作,涵盖开集学习、零样本学习、小样本学习、长尾学习、增量学习等5个开放维度.在开放世界物体识别方面,分析了每个维度的核心挑战,并为每个任务数据集提供了量化的评价指标.对于开放世界物体检测,讨论了检测相比识别的新增挑战,如遮挡、尺度、姿态、共生关系、背景干扰等,并强调了仿真环境在构建开放世界物体检测数据集中的重要性.最后,强调开放世界概念为深度学习带来的新视角和机遇,是推动技术进步和深入理解世界的机会,为未来研究提供参考.
- 聂晖王瑞平陈熙霖
- 关键词:视觉感知评价指标仿真环境
- 基于支持向量机的人脸检测训练集增强被引量:22
- 2008年
- 根据支持向量机(support vector machine,简称SVM)理论,对基于边界的分类算法(geometric approach)而言,类别边界附近的样本通常比其他样本包含有更多的分类信息.基于这一基本思路,以人脸检测问题为例,探讨了对给定训练样本集进行边界增强的问题,并为此而提出了一种基于支持向量机和改进的非线性精简集算法IRS(improved reduced set)的训练集边界样本增强算法,用以扩大训练集并改善其样本分布.其中,所谓IRS算法是指在精简集(reduced set)算法的核函数中嵌入一种新的距离度量——图像欧式距离——来改善其迭代近似性能,IRS可以有效地生成新的、位于类别边界附近的虚拟样本以增强给定训练集.为了验证算法的有效性,采用增强的样本集训练基于AdaBoost的人脸检测器,并在MIT+CMU正面人脸测试库上进行了测试.实验结果表明,通过这种方法能够有效地提高最终分类器的人脸检测性能.
- 王瑞平陈杰山世光陈熙霖高文
- 关键词:人脸检测支持向量机ADABOOST
- 一种多角度物体检测方法和系统
- 本发明涉及一种多角度物体检测方法,包括:以深度神经网络构建检测模型;对训练图提取特征以获得多个特征图,设置多个垂直矩形锚框,获取该垂直矩形锚框与该训练图的样本物体的相交比,并以该相交比大于正例阈值的垂直矩形锚框标记为该训...
- 刘永王瑞平山世光陈熙霖
- 文献传递
- 基于深度学习和哈希编码的图像检索方法
- 本发明涉及一种基于深度学习和哈希编码的模型训练方法,包括将部分标注的图像数据作为网络模型的训练数据,通过深度网络将所述训练数据表示为类二值哈希编码,其中,所述类二值哈希编码是指取值是连续值的一种模拟二值哈希编码;将获得的...
- 陈熙霖刘昊淼王瑞平
- 基于成分引导的多模态自蒸馏食品图像分割
- 2024年
- 目的:随着计算机视觉技术的发展,精确地识别并分割食品图像中的不同成分区域,对于食品营养分析和促进饮食健康管理至关重要。然而,当前图像分割模型多依赖于单一图像输入,这一做法在处理视觉差异较小的食品图像时,往往难以捕捉到细微的区分特征,从而影响分割精度。本文旨在解决单一模态在分割任务中的不足,利用文本信息为模型提供更加丰富的上、下文信息,采用自蒸馏技术,引导模型对食品图像的有效分割。方法:提出一种基于成分信息引导的多模态自蒸馏分割模型。该模型采用对比语言文本预训练模型(CLIP)捕捉成分信息,再与图像知识有效融合,结合扩散模型在稠密预测方面的优势,实现对食品图像的精准分割。结果:在基准数据集FoodSeg103上验证,所提模型的评估指标mIoU达到47.93%,超越了当前最优的FoodSAM模型1.51个百分点。在基准数据集UEC-FoodPIX Complete上,模型的评估指标mIoU达到75.13%,比FoodSAM模型高8.99个百分点。结论 :所提出的多模态自蒸馏网络在食品图像分割任务中表现出色,验证了成分信息对分割任务的有效指导作用,提升了分割精度,为食品图像分析提供了新的解决方案。
- 侯素娟孙月娟闵巍庆王瑞平蒋树强
- 关键词:图像分割多模态