搜索到3359篇“ 数据聚类“的相关文章
数据聚类
数据挖掘领域的一个重要分支。本书全面系统地介绍的主要方法。首先,对涉及的各个方面进行简略的综述;然后,对各算法进行较详细的讨论。本书主要内容分为三大部分:*部分是经典算法部分(第2-6章),讨论k-均...
张宪超
关键词:数据采集
基于密度的多度量空间数据聚类算法
2025年
具有噪声的基于密度的数据聚类(DBSCAN)算法是数据挖掘领域中的经典方法之一,其不仅能发现数据中潜藏的复杂关系,还能过滤其中的数据噪声,从而获得高质量的数据聚类.然而,现有的基于密度的数据聚类算法仅支持单模态(型)数据,难以应对多模态(型)数据并存的应用场景.随着信息技术的快速发展,数据呈现多模态化的发展态势,现实生活中的数据不再是单一的数据型,而是多种数据模态(型)的组合,如文本、图像、地理坐标、数据特征等.因此,现有的数据聚类方法难以对复杂的多模态数据进行有效的数据建模,更无法进行高效的多模态数据聚类.基于此,提出一种基于密度的多度量空间算法.首先,为了刻画多模态数据间的复杂关系,利用多度量空间表征数据之间的相似性关系,并且利用合多度量图索引(AMG)实现多模态数据建模.接着,利用差分化的相似性关系优化合多度量图的图结构,并且结合最优策略优先的搜索策略进行剪枝,以实现高效的多模态数据聚类.最后,在真实与合成数据集上针对多种参数设置进行实验.实验结果验证了所提方法运行效率提升了至少1个数量级,并具有较高的精度与良好的可扩展性.
朱轶凡罗程阳马瑞遥陈璐毛玉仁高云君
关键词:数据挖掘
一种基于大模型的数据聚类的优化方法
本发明涉及一种基于大模型的数据聚类的优化方法,属于数据处理技术领域,包括如下步骤:步骤1):获取第一数据和第二数据,判断第一数据和第二数据的主题是否相似,分别找出第一数据的中心点和第二数据的中心点;步骤2):连接第一数据...
欧智坚刘岩赵贤宇孙磊许小丹
数据聚类方法及相关方法、设备和存储介质
本申请公开了一种数据聚类方法及相关方法、设备和存储介质,其中,数据聚类方法包括:基于若干业务数据数据特征进行分析,得到各个业务数据的分布密度和目标距离;其中,目标距离表征业务数据分别与各个具有更高分布密度的业务数据之间...
管晓钱
基于数据聚类的电网技改项目评估方法及系统
本发明公开了基于数据聚类的电网技改项目评估方法及系统,涉及电网技改技术领域,包括以下步骤收集电网技改项目的多维度数据,并对数据进行预处理;基于算法,对预处理后的数据进行,识别出具有相同特性的项目数据;获取相同特性...
唐越刘士李杨帆陈付雷罗沙高象方登洲李建青方天睿施晓敏赵迎迎沈思付安媛李荣夏雅利蒋伟陆欣欣
运单数据聚类方法、装置、计算机设备和存储介质
本申请涉及一种运单数据聚类方法、装置、计算机设备和存储介质。所述方法包括:获取待运单数据;每个待运单数据包括至少两种用户信息;根据第一用户信息对所述待运单数据进行分组,得到所述待运单数据的第一分组结果;根...
苏航刘琼李磊张培行李珂单增琪李思文
一种基于深度学习的航班数据聚类与分方法
本发明为一种基于深度学习的航班数据聚类与分方法,所述方法包括:1)航班数据潜在表示特征提取:用于构建卷积神经网络、双向门控循环单元和注意力机制的深度学习模型;2)结合动态优化的与分决策:用于实现对航班数据的自动分...
谈海生汤小倩吴迪李国鹏
基于图transformer的单细胞RNA测序数据聚类方法
本发明公开了基于图transformer的单细胞RNA测序数据聚类方法,涉及深度学习和生物信息技术领域,包括如下步骤:首先根据scRNA‑seq数据构建细胞特异性信号网络;然后用细胞特异性信号网络训练同一个图神经网络,以...
朱云平韩明飞李晓陈涛赵羽
基于网格算法的数据聚类方法及系统
本发明公开了基于网格算法的数据聚类方法及系统,涉及数据挖掘领域,解决了数据聚类方法效果差的问题,包括步骤S1:获取目标待数据,并分析建立网格矩形,通过网格矩形建立平面直角坐标系,并标记第一网格空间...
何洪磊
基于大模型的数据聚类方法、装置、介质及计算机设备
本申请公开了一种基于大模型的数据聚类方法、装置、介质及计算机设备,涉及大数据处理及金融科技技术领域。其中方法包括:获取待处理数据,并对待处理数据进行多次随机采样,得到多组样本数据;通过预训练的大模型,对各组样本数据进行...
曹壹臻

相关作者

焦李成
作品数:3,364被引量:8,727H指数:41
供职机构:西安电子科技大学
研究主题:SAR图像 图像 极化SAR 遥感图像 图像分类方法
赵沁平
作品数:792被引量:2,753H指数:22
供职机构:北京航空航天大学
研究主题:图像 三维模型 视频 虚拟现实 虚拟环境
武森
作品数:130被引量:467H指数:12
供职机构:大连海事大学
研究主题:数据挖掘 聚类 聚类算法 磨粒 微颗粒
周劲
作品数:95被引量:163H指数:8
供职机构:济南大学
研究主题:存储介质 聚类方法 模糊聚类 数据聚类 聚类中心
吴峰
作品数:285被引量:1,600H指数:20
供职机构:河海大学
研究主题:风电场 参数辨识 电力系统 轨迹灵敏度 微电网