吴玲玉
- 作品数:6 被引量:8H指数:2
- 供职机构:北京科技大学经济管理学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术理学更多>>
- 基于属性——关系综合相似度的聚类算法被引量:2
- 2011年
- 为弥补属性空间聚类方法只关注对象属性信息以及结构聚类方法只关注对象间关系信息的不足,提出一种基于属性—关系综合相似度的聚类算法。在构建基于属性距离的有权网络后,算法给出对象间综合相似度以及类间综合相似度的计算方法,并设计相应策略自底向上实现聚类。与属性空间聚类和结构聚类方法相比,该算法由于兼顾了属性和关系信息而具有更高的聚类精度。与经典的基于属性—关系相似度的算法HyPursuit、M-S等相比,算法由于精简了综合相似度的计算而具有更高的效率。
- 吴玲玉高学东武森
- 关键词:数据挖掘聚类
- 基于高维聚类技术的中文关键词提取算法被引量:2
- 2011年
- 关键词提取是中文信息处理技术研究中的热点和难点,基于统计信息的方法是其中一个重要分支。本文针对基于统计信息关键词提取方法准确率低的问题,提出基于高维聚类技术的中文关键词提取算法。算法通过依据小词典的快速分词、二次分词、高维聚类和关键词甄选4个步骤实现关键词的提取。理论分析和实验显示,基于高维聚类技术的中文关键词提取方法具备更好的稳定性、更高的效率和更准确的结果。
- 高学东吴玲玉
- 关键词:关键词提取高维聚类
- 考虑对象属性信息的复杂网络社团结构发现算法被引量:2
- 2010年
- 针对社团结构发现算法仅考虑对象间相互关系的密集程度,忽视对象间属性特征差异的不足,提出考虑属性信息的复杂网络社团结构发现算法.算法引入属性特征相似度、基于属性特征相似度的有权网络、内聚度3个核心概念,迭代选取使内聚度指标上升最快的合并操作,自底向上实现社团聚集.由于考虑了属性信息,算法输出的社团结构具有更高准确度,更具应用价值.
- 吴玲玉高学东
- 关键词:复杂网络社团结构内聚度
- 基于互信息率的不均衡数据集属性约简算法
- 属性约简是粗糙集理论的核心内容,基于互信息的属性约简算法是其中非常重要的一类算法。然而,基于互信息的属性约简算法存在一定的不足:属性选取的度量标准存在偏向性;对不均衡数据集分类效果不理想;难以处理连续型属性等。本文主要针...
- 武森吴玲玉全喜伟高学东
- 关键词:粗糙集属性约简不均衡数据集约简算法
- 文献传递
- 基于属性与对象关系信息的综合差异度计算被引量:2
- 2011年
- 传统聚类算法仅考虑属性相似性,较少利用对象间的相互关系。为此,通过关系信息属性化操作,将关系数据转化为关系型属性数据,提出一种针对关系型属性的差异度计算方法。在此基础上,规范化属性变量中的区间和序数变量,将分类变量转变为二态变量,关系变量视为二态变量,提出一种兼顾属性与对象间关系信息的综合差异度计算方法。理论分析和实例结果表明,基于该差异度的聚类准确度更高,聚类结果的实用性更强。
- 高学东吴玲玉武森谷淑娟
- 关键词:数据挖掘
- 容差集合差异度高维不完备数据聚类
- 高维数据聚类一直是聚类研究的难点之一,在数据不完备的情况下尤其具有挑战性。针对高维不完备数据提出基于容差集合差异度的聚类算法(CABOTOSD),通过定义的容差集合差异度、容差集合精简和容差交运算,可以直接计算不完备数据...
- 武森张桂琼王莹吴玲玉
- 关键词:高维空间不完备数据聚类
- 文献传递