刘学亮
- 作品数:61 被引量:29H指数:3
- 供职机构:合肥工业大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划安徽省自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 一种社会媒体下的图像集摘要生成方法
- 本发明公开了一种社会媒体下的图像集摘要生成方法,首先提取社会媒体下的图像集中图像的视觉特征;然后对提取的局部特征和全局特征进行融合和匹配;接着利用最优特征点的空间约束关系构成空间位置地图并构成简化的几何约束代表数据集,进...
- 赵烨洪日昌汪萌刘学亮郝世杰
- 文献传递
- 结合语义与视觉信息的长查询图像检索重排序算法
- 本发明公开了一种结合语义与视觉信息的长查询图像检索重排序方法,其特征是按如下步骤进行:1.输入长查询语句获得初始返回列表;2.构建视觉词典;3.将长查询语句进行分割,提取视觉概念;4.由视觉概念分别获得各自的初始返回列表...
- 洪日昌高鹏飞汪萌刘学亮郝世杰
- 文献传递
- 一种基于超图模型的与事件相关的社会化图像查找算法
- 本发明公开了一种基于超图模型的与事件相关的社会化图像查找算法,其特征是按如下步骤进行:1提取所述社会化图像的模态特征;任意的社会化图像分别建立超边;3由超边集合构成超图模型;4建立基于超图模型的排序模型;5采用凸优化理论...
- 刘学亮汪萌洪日昌刘奕群孙茂松
- 文献传递
- 基于多尺度可形变注意力的红外图像目标跟踪系统及方法
- 本发明公开了一种基于多尺度可形变注意力的红外图像目标跟踪系统及方法。其中跟踪系统包括搜索图分支、模板图分支、特征融合模块和预测模块;其中搜索图分支用于提取搜索图在第一尺度和第二尺度下的特征拼接得到的搜索图多尺度特征F<S...
- 李小红周喜齐美彬庄硕郝世杰刘学亮
- 一种基于自底向上注意力机制和记忆网络的视觉问答方法
- 本发明公开了一种基于自底向上注意力机制和记忆网络的视觉问答方法,将自底向上的图像注意力机制与记忆网络相结合,通过端到端的训练,不断调整参数,使训练后的模型可以进行视觉问答,预测正确的答案,达到理想的效果。
- 洪日昌闫茹玉汪萌刘学亮徐超峰
- 文献传递
- 结合两种距离测度的说话人聚类算法被引量:1
- 2015年
- 说话人聚类研究如何将一段语音中同一说话人的语音聚合.提出一种基于结合广义似然比与归一化交叉似然比两种距离测度的聚类算法.算法首先提取每一段语音信号的MFCC特征,并建立高斯混合模型,最后采用基于结合广义似然比与归一化交叉似然比两种距离测度的层次化策略对语音信号进行聚类.在算法中,贝叶斯判据用以确定聚类结束的条件.实验表明,该算法提高了系统的综合性能,较好的解决了无监督说话人聚类问题.结合两种距离测度比单独使用任何一种距离测度的系统性能提高了6%.并且,通过改进更新类间距的方式,聚类速度相比传统高斯混合模型聚类方法提升6倍.
- 陈玥同刘学亮
- 关键词:说话人聚类
- 基于多分类器的目标跟踪方法、设备和存储介质
- 本发明公开了一种基于多分类器的目标跟踪方法、设备和存储介质,其中目标跟踪方法包括:1、建立第一特征提取网络和第二特征提取网络并进行预训练;2、构建离线训练样本集、离线分类器,离线giou预测器,并进行离线训练;3、构建在...
- 齐美彬吴晶晶蒋建国杨艳芳李小红詹曙苏兆品张国富刘学亮
- 文献传递
- 一种基于深度社交关系的推荐方法
- 本发明公开了一种基于深度社交关系的推荐方法,包括:1.构造用户对物品的评分矩阵和用户与用户之间的社交关系矩阵;2.通过独热编码方式构造输入层;3.根据用户与用户之间的社交关系矩阵利用自动编码得到社交嵌入矩阵;4.通过输入...
- 吴乐孙培杰汪萌洪日昌刘学亮杨文娟
- 文献传递
- 基于稀疏编码的多模态信息交叉检索被引量:2
- 2015年
- 目的多模态信息交叉检索的根本问题是多模态数据的特征表示。稀疏编码是一种有效的数据特征表示方法,但是当查询数据和被检索数据来自不同模态时,数据间存在分布差异,相似的特征可能被编码为差异显著的稀疏表示,此时传统稀疏编码便不再适用。为此,提出了一种基于稀疏编码的多模态信息交叉检索算法。方法采用最大均值差异(MMD)以及图拉普拉斯,并将二者加入到稀疏编码的目标函数中来充分利用多模态信息进行编码,模型求解采用特征符号搜索和离散线搜索算法逐个更新稀疏编码系数。结果在Wikipedia的文本图像对数据上进行实验,并与传统稀疏编码进行比较,实验结果表明,本文算法使交叉检索的平均准确率(MAP)提高了18.7%。结论本文算法增强了稀疏表示的鲁棒性,提高了多模态交叉检索的准确率,更适用于对多模态数据进行特征提取,并进行进一步的操作,如交叉检索、分类等。
- 刘菲刘学亮
- 关键词:多模态
- 一种基于多尺度字典的唇形同步方法
- 本发明涉及计算机视觉技术领域,公开了一种基于多尺度字典的唇形同步方法,包括:音频图像对的数据集建立;多尺度唇形字典的构建:利用预训练的VggFace模型提取FFHQ人脸图像数据集中人脸图像的多个尺度的人脸特征图,使用dl...
- 刘学亮步超飞赵烨汪萌洪日昌