周丽华 作品数:128 被引量:245 H指数:8 供职机构: 云南大学信息学院 更多>> 发文基金: 国家自然科学基金 云南省自然科学基金 云南省教育厅科学研究基金 更多>> 相关领域: 自动化与计算机技术 经济管理 天文地球 文化科学 更多>>
空间co-location模式挖掘算法介绍及应用 被引量:2 2007年 当前挖掘空间co-location模式所遇到的困难在于,空间对象的实例分布在连续的空间中并拥有复杂的空间关系,大部分的计算时间需要用来生成co-location模式的表实例.分析了co-location模式挖掘的实质,以及近年来提出的co-location模式挖掘的全连接算法和无连接算法,并对这两种算法在性能上加以比较.在此基础上,结合三江并流国家基金项目,用这两种算法挖掘出了共生植被及其分布情况,为生物学家的科学研究提供了有利的帮助. 包玉珍 王丽珍 周丽华关键词:空间数据挖掘 一种分布式环境下的skyline查询算法 2010年 skyline计算在多标准决策、数据挖掘和数据库可视化等领域具有非常重要的作用.研究了分布式环境下的skyline查询问题.提出通过合并局部skyline集合得到全局skyline集合的思想,在计算全局skyline集合时,先对局部skyline集合进行区域划分和动态编码,然后根据各个区域之间的制约关系进行数据合并.通过实验分析可知,当全局skyline集合的规模较大时,经过区域划分的算法比起直接合并的算法执行效率更好. 严伟榆 周丽华 赵家松关键词:SKYLINE计算 一种度量社会网络影响力的方法 本发明公开了一种度量社会网络影响力的方法,本发明以有效地选择种子节点。算法1显示了CCIM算法的伪代码。首先,通过社区检测算法将网络G(V,E)划分为M个社区,然后计算节点的影响并找到影响力最大的种子节点。为了避免重复计... 吴晴晴 周丽华 黄亚群文献传递 比例规则的优化算法 1引言关联规则的挖掘是KDD和DM研究中的一个重要研究课题。目前,挖掘出的关联规则大体可划分为三种类型: 卓明 王丽珍 周丽华 谭旭关键词:CLASSIFICATION FORECAST 文献传递 带障碍的空间分级聚类算法 被引量:4 2006年 带障碍的聚类问题是一个具有实际应用价值的问题,因为现实世界中确实存在河流、山脉等之类的物理障碍,它们的存在会影响聚类结果的合理性。传统的聚类算法在进行空间数据的聚类时,往往忽略了障碍对于聚类结果的影响。本文讨论了不同障碍对数据点间连通性的不同影响,提出了带障碍的分级聚类算法 OBHIEC。分级聚类方法使得需要计算障碍距离的点对数目减少,并能处理数据分布密度不同的情况。实验结果表明,OBHIEC 算法能有效完成带障碍的聚类,并具有较好的增量特性。 周丽华 王丽珍 陈克平关键词:数据挖掘 聚类 面向关系语境的罪犯藏匿位置预测方法 被引量:2 2015年 目标罪犯藏匿位置的预测是一个重要而艰巨的任务。提出了一种面向关系语境的目标罪犯藏匿位置预测方法。该方法主要通过在面向关系语境的社会网络中计算用户间的信任度得到目标罪犯的强关系子集,并根据所有用户的历史位置轨迹筛选出目标罪犯可能藏匿的候选位置子集,然后进行协同过滤计算,预测目标罪犯当前最可能藏匿的位置。这种方式融合了用户的社会关系及历史位置信息,有助于降低直接预测目标罪犯藏匿位置的盲目性和困难性。最后,利用模拟数据进行仿真实验,并对所提方法的有效性进行了验证。 张彩平 周丽华 陈红梅 阮惠风关键词:社会网络 带有时间标签的流行社交位置发现 2019年 流行社交位置是指大多数人日常生活中经常访问的位置,其广泛应用于推荐系统、定向广告应用等领域。随着基于位置的社交网络(Location-Based Social Network,LBSN)的迅速发展,流行社交位置的挖掘成为时空数据挖掘中的一个研究热点。然而,现有的研究主要是从LBSN中挖掘流行社交位置,忽略了流行社交位置的时间因素,因此,文中提出了带有时间标签的流行社交位置发现算法。该算法首先量化LBSN数据集中的时间信息,得到个体用户带有时间标签的频繁社交位置集合;然后计算这些带时间标签的位置在群体用户中的流行度;最后识别出符合要求的带时间标签的流行社交位置。文中采用约10个月的Foursquare东京用户签到数据对该算法的效率和正确性进行验证,结果表明,该算法能够较为准确地发现带有时间标签的流行社交位置。 刘长赟 杨宇迪 周丽华 赵丽红关键词:时空数据挖掘 基于概念层次树的例外挖掘方法研究 被引量:3 2002年 例外检测能够在诸如电子商务、信用卡欺骗及气象数据分析等领域中挖掘真正未预料到的知识,人们注意到,已有发现例外的方法只能处理数值型属性,同时不允许用户动态地改变参数。在此,文章基于“概念层次树”、“语义距离”及“语义贴近度”等概念,研究了SDB—例外及FCB—例外,并给出了挖掘这些例外的有效算法。 王丽珍 周丽华 陈红梅关键词:数据挖掘 数据采集 数据库 概念层次树 恶性肿瘤与工业污染之间的模糊关系挖掘 被引量:2 2020年 恶性肿瘤是危害人类健康的重要疾病之一,运用数据挖掘技术挖掘恶性肿瘤与各种致病因素之间的关系受到越来越多的关注。在实际中,肿瘤疾病与致病因素之间的关系往往是模糊的,肿瘤疾病的发生也不只受单一因素的影响,但目前还没有针对上述问题的研究。为此,基于空间共存模式挖掘技术,结合模糊理论,提出了模糊共存模式的概念;运用聚类方法对污染源进行了模糊化处理;在进行规则提取时采用了决策表提取规则的方法,并设计了相应的置信度计算算法;最终提出了一种能够挖掘出多种肿瘤疾病与多种污染源之间模糊关系的新方法。通过在实际案例上的应用验证了提出算法的有效性,通过在合成数据集上的实验分析了不同参数对算法运行时间的影响,并对算法的时间效率进行了理论分析。 储传鑫 王丽珍 周丽华 李旭阳关键词:空间数据挖掘 聚类分析 异质信息网络中基于解耦图神经网络的社区搜索 2024年 在异质信息网络(HINs)中搜索包含给定查询节点的社区具有广泛的应用价值,如好友推荐、疫情监控等。现有HINs社区搜索方法大多基于预定义的子图模式对社区的拓扑结构施加一个严格的要求,忽略了节点间的属性相似性,导致结构关系弱而属性相似性高的社区难以定位,并且采用的全局搜索模式难以有效处理大规模的网络数据。为解决这些问题,首先设计解耦图神经网络和基于元路径的局部模块度,分别用于度量节点间的属性相似性和结构内聚性,并利用0/1背包问题优化属性和结构两种凝聚性度量指标,定义了最有价值的c大小社区搜索问题,进而提出了一种基于解耦图神经网络的价值最大化社区搜索模型,执行3个阶段的搜索过程。第一阶段,依据查询信息与元路径,构造候选子图,将搜索范围控制在查询节点的局部范围内,保证整个模型的搜索效率;第二阶段,利用解耦图神经网络,融合异质图信息和用户标签信息,计算节点间的属性相似度;第三阶段,根据社区定义以及凝聚性度量指标,设计贪心算法查找属性相似度高且结构凝聚的c大小社区。最后,在真实的同质和异质网络数据集上测试了搜索模型的性能,大量实验结果验证了模型的有效性和高效性。 陈伟 周丽华 王亚峰 王丽珍 陈红梅