姚华传
- 作品数:8 被引量:11H指数:2
- 供职机构:云南大学信息学院计算机科学系更多>>
- 发文基金:国家自然科学基金云南省教育厅科学研究基金云南省应用基础研究基金更多>>
- 相关领域:自动化与计算机技术更多>>
- AC_SAR:基于强关联规则的可行动分簇算法
- 由于传统关联规则挖掘算法的低效性,以及挖掘结果产生大量冗余,使得我们难以快速地从海量数据中挖掘出有用、全面且可行动的关联规则,和根据这些关联规则对挖掘对象进行准确分簇。同时,传统的关联规则挖掘算法及相关的聚类方法均依赖支...
- 姚华传王丽珍陈红梅邹目权
- CP_SDD+RDS:基于分行排序单向检测求解最近对
- 2013年
- 求解最近点对问题在诸如地理信息查询、空间数据库等领域应用广泛。但到目前为止,还没有一种高效的求解算法,如传统求解最近对的分治算法存在比较次数较多、阈值收敛速度慢、计算距离次数较多的缺点。基于网格技术的求解最近邻方法存在网格的大小难以确定和算法效率低的问题。据此,首先提出基于单向检测的最近对求解算法(CP_SDD),然后提出按行划分的排序算法(RDS),最后得到基于分行排序单向检测的最近对求解算法(CP_SDD+RDS)。该算法不仅克服了分治法存在的缺点,而且子算法(RDS)的分行思想还克服了划分网格过程中存在的弊端。大量实验表明,CP_SDD+RDS算法是高效和可行的。
- 姚华传王丽珍陈红梅胡新
- 模糊空间的colocation模式挖掘研究
- 2014年
- 近年来空间colocation模式挖掘由传统数据扩展到了不确定数据、模糊数据领域,但在模糊数据层面上,只有少量关于对象模糊的研究,而对于模糊空间这一论域的研究还是空白。基于经典的colocation模式挖掘的理论,针对性地提出了面向模糊空间的colocation模式挖掘及相关定义,增加了模糊数据领域内研究的深度和广度,并根据模糊数学理论结合空间colocation挖掘的特点,在模糊距离隶属度函数未知的情况下建立了具有较好适用性的FS基本算法。该算法一改以往在经典数据集上需要验证"团实例"的复杂做法,大大提高了算法性能。在已知模糊距离隶属度函数时,给出一个同时适用于经典数据以及模糊数据的增加数据完整性的通用方法;引进模糊方位,给出完全有别于以往的FS补充算法,增加了数据的完整性,并能实现模糊数据空间向经典数据空间的转换。
- 邹目权王丽珍姚华传
- 关键词:数据完整性
- 面向大数据量挖掘空间cO-location模式的网格微分算法
- 在信息时代的今天,随着数据量的快速增长,如何从海量数据中高效地挖掘出有用的信息变得越来越重要。空间co-location模式表示在空间中存在若干空间特征,不同特征间的实例在空间中频繁关联。挖掘空间co-location模...
- 姚华传
- 关键词:海量数据数据挖掘
- 面向海量数据的空间co-location模式挖掘新算法被引量:2
- 2015年
- 空间co-location模式挖掘是空间数据挖掘的一个重要任务,目前无论是挖掘确定数据,还是不确定数据,算法的时间和空间效率都不高,更谈不上对海量数据进行挖掘。为此,在深入分析传统挖掘方式过度消耗时间和空间资源的根本原因的基础上,提出了网格微分挖掘co-location模式的算法。新算法在传统网格基础上实施微分,求出各微分格中属于同一特征的实例质心,并基于这些质心进行多分辨剪枝co-location模式挖掘。算法在保证具有较高准确率的前提下,较好地解决了传统挖掘方式中存在的效率问题,从而解决了面向海量数据进行空间co-location模式挖掘的难题。大量实验证明,网格微分算法具有高效性、稳健性和高准确率等优点。
- 姚华传王丽珍陈红梅邹目权
- 关键词:质心
- AC-SAR:基于强关联规则的可行动分簇算法
- 2014年
- 提出一种基于强关联规则的可行动分簇算法(AC-SAR)。AC-SAR算法为每一个对象寻找关联性最强的对象,并通过反对称原则和可连接原则删除和合并相应规则,最终挖掘出涉及事务数据库中所有对象的多个连通子图(簇)。与传统算法相比,新算法无需设置阈值,没有冗余知识,算法的中间挖掘结果及最终生成的簇,能有效地解决诸多领域的实际问题。大量试验结果表明,该新算法具有较高的效率、准确性以及较强的可行动性。
- 姚华传王丽珍吴萍萍邹目权
- 关键词:分簇
- 广义关联分析的蕴涵-约束框架及其挖掘算法被引量:1
- 2014年
- 本文将所有基于事务和非基于事务的关联分析称为广义的关联分析。基于事务的关联分析主要依托支持度-置信度框架进行数据挖掘,而非基于事务的关联分析常采用参与度-条件概率框架。首先,在讨论强关联规则的正确性、可靠性和有趣性的基础上,提出了蕴涵-约束框架。其次,提出并论证了最小支持度_和最小置信度_的合理取值范围,从而将最小置信度由支持度-置信度框架下的(0,1]缩小为蕴涵-约束框架下的(0.5,1],最小支持度由(0,1]缩小为(0,_]。第三,提出随机顶点极大团划分法,它能将非基于事务的关联分析转化为基于事务的关联分析,从而使广义关联分析问题整合成为基于事务的关联分析问题。第四,基于映射的概念,将约束划分为事前、事中和事后约束,从而形式化地解决了约束的应用及方法。第五,利用稠密维和稀疏维,提出了一种multi-knowledge tree的树形存储结构,能在无论频繁项集是否满足向下闭合性质时都有效降低算法的空间复杂度;同时,在数据增加、删除、修改后能快速获取新的强关联规则。最后,大量实验验证了所提出理论和算法的效果和效率。
- 邹目权王丽珍姚华传芦俊丽
- 度数法求解最大团问题被引量:8
- 2013年
- 由于最大团问题(maximum clique problem,MCP)的复杂性、挑战性,以及在数据挖掘等领域的广泛应用,使得求解MCP问题具有非常重要的意义。根据最大团顶点度数较大的特点,提出了从图中第一个度数最大的顶点出发递归求解最大团的算法(简称度数法)。为了进一步提高算法的效率,根据图的特点和最大团的特点提出了三个改进的剪枝策略。从理论上证明了算法的正确性和完整性,其时间复杂度为O(1.442n),空间为O(n2)。通过实验验证了度数法及其改进剪枝策略的效果和效率。
- 胡新王丽珍何瓦特姚华传
- 关键词:NP完全问题