李亚利 作品数:20 被引量:95 H指数:4 供职机构: 清华大学 更多>> 发文基金: 国家自然科学基金 国家教育部博士点基金 国家高技术研究发展计划 更多>> 相关领域: 自动化与计算机技术 文化科学 更多>>
ReID2.0:从行人再识别走向人像态势计算 2023年 行人再识别(person re-identification,Person ReID)指利用计算机视觉技术对在一个摄像头的视频图像中出现的某个确定行人在其他时间、不同位置的摄像头中再次出现时能够辨识出来,或在图像或视频库中检索特定行人。行人再识别研究具有强烈的实际需求,在公共安全、新零售以及人机交互领域具有潜在应用,具备显著的机器学习和计算机视觉领域的理论研究价值。行人成像存在复杂的姿态、视角、光照和成像质量等变化,同时也有一定范围的遮挡等难点,因此行人再识别面临着非常大的技术挑战。近年来,学术界和产业界投入了巨大的人力和资源研究该问题,并取得了一定进展,在多个数据集上的平均准确率均值(mean average precision,mAP)有了较大提升,并部分开始实际应用。尽管如此,当前行人再识别研究主要还是侧重于服装表观的特征,缺乏对行人表观显式的多视角观测和描述,这与人类观测的机理不尽相符。本文旨在打破现有行人再识别任务的设定,形成对行人综合性观测描述。为推进行人再识别研究的进展,本文在前期行人再识别研究的基础上提出了人像态势计算的概念(ReID2.0)。人像态势计算以像态、形态、神态和意态这4态对人像的静态属性和似动状态进行多视角观测和描述。构建了一个新的基准数据集Portrait250K,包含250000幅人像和对应8个子任务的手动标记的8种标签,并提出一个新的评价指标。提出的人像态势计算从多视角表观信息对行人形成综合性的观测描述,为行人再识别2.0以及类人智能体的进一步研究提供了参考。 王生进 豆朝鹏 樊懿轩 李亚利关键词:计算机视觉 多方向线积分的梯度特征 被引量:1 2011年 典型的梯度特征包括HOG(梯度方向直方图)、Shapelet及Edgelet等,这些特征被广泛用于目标检测、目标识别、图像检索及场景分类等领域。针对HOG特征运算复杂度高的问题,提出了一种新的多方向线积分的梯度特征(MDIG)。通过避免计算梯度方向并利用积分图,该特征简化了计算过程,提高了计算速度,因而便于在DSP等硬件上实现。实验中新特征被应用于人体头肩检测。实验结果表明当使用AdaBoost算法训练分类器时,该特征的描述能力与HOG相当,同时其计算时间仅为HOG的1/3,整体性能优于HOG。最后,针对梯度特征的适用范围对其未来应用的发展方向进行了讨论。 何飞 李亚利 鹿文浩 王生进 丁晓青关键词:梯度特征 梯度方向直方图 基于深度学习的视觉目标检测技术综述 被引量:68 2022年 视觉目标检测旨在定位和识别图像中存在的物体,属于计算机视觉领域的经典任务之一,也是许多计算机视觉任务的前提与基础,在自动驾驶、视频监控等领域具有重要的应用价值,受到研究人员的广泛关注。随着深度学习技术的飞速发展,目标检测取得了巨大的进展。首先,本文总结了深度目标检测在训练和测试过程中的基本流程。训练阶段包括数据预处理、检测网络、标签分配与损失函数计算等过程,测试阶段使用经过训练的检测器生成检测结果并对检测结果进行后处理。然后,回顾基于单目相机的视觉目标检测方法,主要包括基于锚点框的方法、无锚点框的方法和端到端预测的方法等。同时,总结了目标检测中一些常见的子模块设计方法。在基于单目相机的视觉目标检测方法之后,介绍了基于双目相机的视觉目标检测方法。在此基础上,分别对比了单目目标检测和双目目标检测的国内外研究进展情况,并展望了视觉目标检测技术发展趋势。通过总结和分析,希望能够为相关研究人员进行视觉目标检测相关研究提供参考。 曹家乐 李亚利 孙汉卿 谢今 黄凯奇 庞彦伟关键词:双目 视觉广告效果评估系统及方法 本发明公开了一种视觉广告效果评估系统及方法,图像处理及计算机视觉技术领域。该系统包括:采集模块,用于按照设定的采集频率,实时采集设定范围内经过待评估的广告牌的行人的视频图像、以及设定范围内的背景图像;数据处理模块,用于根... 李亚利 王生进 方驰 丁晓青文献传递 一种机器手抓取姿势质量的物理度量方法及装置 本发明提供一种机器手抓取姿势质量的物理度量方法及装置。其中,该方法包括:确定机器手的候选抓取姿势与物体之间接触点的平坦度分数;确定所述候选抓取姿势夹持所述物体的重心分数;基于所述平坦度分数和所述重心分数评估候选抓取姿势的... 王生进 鲁宇豪 李亚利清华大学研发多模态机器人脑计算技术与平台 2021年 传统意义上的机器人指的是工业机器人,通常做一些琐碎、单调和危险的工作。这些任务通常是机器人独立完成的,没有人的参与。在面对一些复杂精细的任务时,工业机器人就显得无能为力,这就需要机器人与人类协作完成更具挑战性的工作。 李亚利关键词:工业机器人 计算技术 多模态 基于部件的三维目标检测算法新进展 被引量:3 2012年 三维目标检测问题是计算机视觉领域的一个基础而重要的问题,如何解决部分遮挡、类内变化、复杂背景以及视角变化的问题是这类算法的研究重点.近年来,随着部分遮挡、类内变化等问题的逐步解决,越来越多的研究者针对视角问题展开研究.本文对三维目标检测问题进行了较为详细的分析,并且主要针对近几年的热点问题—视角问题展开讨论,介绍并总结了当前该领域的主要算法.通过对比说明了各种方法的优势与不足. 鹿文浩 李亚利 王生进 丁晓青关键词:目标检测 基于改进型抛物线Hough变换的眼睛特征提取 被引量:4 2010年 眼睛特征提取有广泛的应用。针对眼睛特征参数提取的需求,该文对传统的抛物线Hough变换算法进行改进,提出将抛物线的系数作为变换量,结合边缘梯度方向计算抛物线的顶点坐标并获取抛物线参数的方法。在此基础上将算法拓展到对称轴与坐标轴不平行情况下的抛物线的Hough变换,以适应旋转。实验表明:该算法可精确有效地提取眼睛特征并可应用在人机交互、驾驶员疲劳检测等领域。 李亚利 王生进 胡斌 丁晓青关键词:模式识别 眼睛特征提取 口罩人脸图像的鉴伪方法、装置、电子设备及存储介质 本发明提供一种口罩人脸图像的鉴伪方法、装置、电子设备及存储介质,其中的方法包括:获取目标人脸图像,目标人脸图像包括人脸区域和口罩区域;对目标人脸图像进行预处理,得到预处理人脸图像;根据预处理人脸图像中人脸区域对应的光谱信... 张学谦 李亚利 黄翊东一种大场景图像的区域提取方法及装置 本发明提供一种大场景图像的区域提取方法及装置,其中的区域提取方法包括:S1,获取目标图像;S2,将目标图像输入至骨干特征网络,得到目标图像的骨干特征图;S3,获取目标图像的区域记录特征图;S4,根据骨干特征图和区域记录特... 许景焘 李亚利 王生进