万春红
- 作品数:11 被引量:31H指数:3
- 供职机构:河南财经政法大学计算机与信息工程学院更多>>
- 发文基金:国家自然科学基金河南省基础与前沿技术研究计划项目河南省教育厅科学技术研究重点项目更多>>
- 相关领域:自动化与计算机技术文化科学理学更多>>
- 用于多流形分类的核等距映射算法被引量:1
- 2016年
- 核等距映射(Kernel ISOMAP)算法具有较好的泛化性能,但不能直接用于多流形的分类。在多流形下,准确判定新数据点所在的流形是其获得良好泛化性能的基础,因此,提出了能够用于多流形分类的核等距映射算法。该算法根据同一流形上邻近局部切空间的相似性能够准确判定新数据点所在的流形,并对目前核等距映射算法中新数据点低维表示的计算过程进行了简化,从而具有良好的泛化性能。实验结果证实,该算法具有较高的分类准确率。
- 邵超万春红李洁颖
- 关键词:最小生成树局部切空间
- 流形学习算法中邻域大小参数的递增式选取被引量:2
- 2014年
- 流形学习算法能否成功应用依赖于邻域大小参数的选取是否合适,但该参数在实际中通常难以高效选取。为此,提出一种邻域大小参数的递增式选取方法。按照流形的局部欧氏性,邻域图上的所有邻域都呈线性或近似线性,邻域大小参数若合适,此时所有邻域的线性度量可聚成一类;而邻域大小参数若不合适,邻域图上就会有部分邻域不再线性,其线性度量也不能聚成一类。对邻域图上的每一个邻域执行加权主成分分析,用重建误差对其线性程度进行度量,并计算相应的贝叶斯信息准则,以探测其聚类个数,从而实现对邻域大小参数的递增式选取。实验结果表明,该方法无需任何额外参数,具有较高的运行效率。
- 邵超万春红赵静玉
- 关键词:流形学习邻域大小贝叶斯信息准则
- 一种新的基于SOM的流形学习算法
- 针对SOM(Self-Organizing Map,自组织映射)算法在进行流形学习时容易陷入局部极值和产生"拓扑缺陷"问题的原因,本文提出了一种新的基于SOM的流形学习算法——TO-SOM (Trai...
- 邵超万春红
- 关键词:流形学习SOM拓扑缺陷鲁棒性邻域大小
- 一种新的基于自组织映射的流形学习算法被引量:2
- 2009年
- 针对自组织映射(Self-Organizing Map,SOM)算法在进行流形学习时容易陷入局部极值和产生"拓扑缺陷"问题的原因,提出了一种新的基于SOM的流形学习算法:TO-SOM(TrainingOrderly-SOM).根据流形的局部欧氏性,TO-SOM算法从一个局部线性或近似线性的数据子集出发,按照数据的内在流形结构对其进行有序训练,可以避免局部极值、克服"拓扑缺陷".根据SOM算法的鲁棒性,TO-SOM算法在成功学习数据内在流形结构的同时,对邻域大小参数和噪声也不像ISOMAP和LLE等现有流形学习算法那样敏感,从而更容易得到实际应用.
- 万春红邵超
- 关键词:流形学习自组织映射拓扑缺陷鲁棒性邻域大小
- 基于自组织映射的流形学习与可视化被引量:2
- 2013年
- 针对自组织映射(SOM)在学习和可视化高维数据内在的低维流形结构时容易产生"拓扑缺陷"的这一问题,提出了一种新的流形学习算法——动态自组织映射(DSOM)。该算法按照数据的邻域结构逐步扩展训练数据集合,对网络进行渐进训练,以避免局部极值,克服"拓扑缺陷"问题;同时,网络规模也随之动态扩展,以降低算法的时间复杂度。实验表明,该算法能更加真实地学习和可视化高维数据内在的低维流形结构;此外,与传统的流形学习算法相比,该算法对邻域大小和噪声也更加鲁棒。所提算法的网络规模和训练数据集合都将按照数据内在的邻域结构进行同步扩展,从而能更加简洁并真实地学习和可视化高维数据内在的低维流形结构。
- 邵超万春红
- 关键词:流形学习自组织映射拓扑缺陷邻域结构
- 流形学习中邻域大小参数的合适性判定被引量:3
- 2010年
- 流形学习算法能否成功应用严重依赖于其邻域大小参数的选择是否合适,为此,提出了一种高效的邻域大小参数的合适性判定方法。基于流形的局部欧氏性,该方法用PCA(Principal Component Analysis,主成分分析)重建误差对邻域图上每一个邻域的线性程度进行衡量,然后根据邻域图上所有PCA重建误差的聚类个数来判定相应邻域大小的合适性。该方法无需象残差那样运行相对耗时的流形学习算法,从而具有较高的运行效率,其有效性可通过实验结果得以证实。
- 邵超张斌万春红
- 关键词:流形学习邻域大小贝叶斯信息准则
- 基于等距映射的监督多流形学习算法被引量:4
- 2014年
- 目前的监督多流形学习算法大多数都根据数据的类别标记对彼此间的距离进行调整,能较好实现多流形的分类,但难以成功展现各流形的内在几何结构,泛化能力也较差,因此文中提出一种基于等距映射的监督多流形学习算法.该算法采用适合于多流形的最短路径算法,得到在多流形下依然能正确逼近相应测地距离的最短路径距离,并采用Sammon映射以更好地保持短距离,最终可成功展现各流形的内在几何结构.此外,该算法根据邻近局部切空间的相似性可准确判定新数据点所在的流形,从而具有较强的泛化能力.该算法的有效性可通过实验结果得以证实.
- 邵超万春红
- 关键词:泛化能力局部切空间ISOMETRIC
- 基于最小连通邻域图的ISOMAP算法被引量:2
- 2007年
- 噪音的干扰和邻域大小的不合适会在ISOMAP算法的邻域图中引入"短路"边,使其不能正确表达数据的邻域结构,从而使该算法具有较差的鲁棒性和拓扑稳定性。为此,根据最小连通邻域图能有效避免"短路"边的特点,提出了一种能有效删除"短路"边因而更具鲁棒性和拓扑稳定性的ISOMAP算法——基于最小连通邻域图的ISOMAP(MCNG-ISOMAP)算法。该算法能在一定程度上避免邻域大小难以有效选取的问题,同时还能在不依赖于邻域大小的情况下发现数据真正的固有维数。
- 邵超万春红陈广宇
- 关键词:等距映射
- E-R图的精细设计被引量:11
- 2015年
- E-R图设计是数据库设计的关键,目前诸多流行的数据库原理教材,对E-R图设计部分的讨论均显得不够精细。针对这一现状,文章通过分析不同应用环境下实体之间的联系,提出E-R图的精细设计方案,说明E-R图的正确设计方法。
- 邵超万春红
- 关键词:数据库设计E-R图
- 基于随机游走的流形学习与可视化被引量:1
- 2017年
- 现有的全局流形学习算法都敏感于邻域大小这一难以高效选取的参数,它们都采用了基于欧氏距离的邻域图创建方法,从而使邻域图容易产生"短路"边。本文提出了一种基于随机游走模型的全局流形学习算法(Random walk-based isometric mapping,RW-ISOMAP)。和欧氏距离相比,由随机游走模型得到的通勤时间距离是由给定两点间的所有通路以概率为权组合而成的,不但鲁棒性更高,而且还能在一定程度上度量具有非线性几何结构的数据之间的相似性。因此采用通勤时间距离来创建邻域图的RW-ISOMAP算法将不再敏感于邻域大小参数,从而可以更容易地选取邻域大小参数,同时还具有更高的鲁棒性。最后的实验结果证实了该算法的有效性。
- 邵超万春红张啸剑
- 关键词:等距映射随机游走