陶运信 作品数:6 被引量:13 H指数:2 供职机构: 南京航空航天大学 更多>> 发文基金: 国家高技术研究发展计划 更多>> 相关领域: 自动化与计算机技术 建筑科学 更多>>
屏蔽输入参数敏感的异常点检测新方法 被引量:2 2008年 大多数基于密度的异常点检测算法需要设置两个输入参数,并对输入参数很敏感,用户设置不正确会导致算法不能发现所有有意义的异常点,甚至是发现错误的异常点,这使得评价一个数据挖掘算法的"3-E"标准中"易于使用"这一点不能得到满足。为此,首先根据对象的邻域、反邻域和局部密度构造基于邻域的局部密度因子NLDF,NLDF可指示异常点的异常程度,然后提出一种屏蔽输入参数敏感的异常点检测算法ODINP。ODINP的一个非常显著的优点就是只需要一个参数k并且对k不敏感。该算法在保持已有基于密度的异常点检测算法高效性的同时,具有很高的异常点检测精度。大规模、任意形状和高维数据集的测试结果表明该算法是有效的、可行的。 陶运信 皮德常关键词:数据挖掘 异常点检测 移动对象聚类和空间离群点检测算法研究 作为重要的数据挖掘任务和数据分析技术,聚类分析和离群点检测已被广泛研究,取得了丰硕的成果并应用到众多领域,引起学术界、工业界和各国政府及军队等部门的密切关注。目前,数据挖掘的研究主要针对简单和结构化的数据集。但是随着数据... 陶运信关键词:数据挖掘 聚类分析 文献传递 一种快速移动对象轨道聚类算法 2010年 针对已有轨道聚类(TRACLUS)算法的线段聚类模块需要对划分后的每条线段进行邻域查询的问题,将取样技术引入轨道聚类,提出一种快速移动对象轨道聚类(FTCS)算法。FTCS算法根据基于极大连通子图的合并原理,对核心线段的Eps邻域以及与该Eps邻域相重叠的所有轨道聚类进行合并,避免了TRACLUS算法中核心线段Eps邻域内线段的不必要邻域查询操作。在真实和合成轨道数据集上的大量实验结果表明,FTCS算法显著降低了邻域查询操作次数,在保持TRACLUS算法轨道聚类质量的同时,成倍提高了轨道聚类的时间效率。 陶运信 皮德常关键词:数据挖掘 聚类 一种基于取样的快速移动对象轨迹聚类方法 本发明公开了一种基于取样的快速移动对象轨迹聚类方法,属于轨迹数据聚类领域。该方法为:在用户设定输入参数发出聚类分析请求后,使用最小描述长度原理将每条原始轨迹划分成一个轨迹划分子集合,根据线段间的相似性度量,对轨迹划分集合... 皮德常 陶运信 段安利文献传递 一种基于取样的快速移动对象轨迹聚类方法 本发明公开了一种基于取样的快速移动对象轨迹聚类方法,属于轨迹数据聚类领域。该方法为:在用户设定输入参数发出聚类分析请求后,使用最小描述长度原理将每条原始轨迹划分成一个轨迹划分子集合,根据线段间的相似性度量,对轨迹划分集合... 皮德常 陶运信 段安利文献传递 基于邻域和密度的异常点检测算法 被引量:12 2008年 为了减少基于密度的异常点检测算法邻域查询操作的次数,同时避免ODBSN(Outlier Detection Based onSquare Neighborhood)中有意义异常点的丢失和稀疏聚类中的对象靠近稠密聚类时导致错误的异常点判断,提出了一种基于邻域和密度的异常点检测算法NDOD(Neighborhood and Density based Outlier Detection)。NDOD吸收基于网格方法的思想,以广度优先扩张方形邻域,成倍地减少了邻域查询的次数,从而快速排除聚类点并克服基于网格方法中的"维灾"。新引入的基于邻域的局部异常因子代表候选异常点的异常程度,用于对候选异常点的精选,可避免ODBSN的缺陷,发现更多有意义的异常点。大规模和任意形状的二维空间数据的测试结果表明,该算法是可行有效的。 陶运信 皮德常关键词:数据挖掘 异常点 局部异常因子