您的位置: 专家智库 > >

国家自然科学基金(61190115)

作品数:5 被引量:16H指数:3
相关作者:高宏李建中孙纪舟方效林张安珍更多>>
相关机构:哈尔滨工业大学更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划中国博士后科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 5篇中文期刊文章

领域

  • 5篇自动化与计算...

主题

  • 2篇数据流
  • 1篇序列数据
  • 1篇生成树
  • 1篇生成树算法
  • 1篇时间序列
  • 1篇树算法
  • 1篇数据清洗
  • 1篇数据挖掘
  • 1篇贪心
  • 1篇贪心算法
  • 1篇清洗方法
  • 1篇最小生成树
  • 1篇最小生成树算...
  • 1篇挖掘数据流
  • 1篇网络
  • 1篇无线传感
  • 1篇无线传感器
  • 1篇无线传感器网
  • 1篇无线传感器网...
  • 1篇列数

机构

  • 5篇哈尔滨工业大...

作者

  • 3篇高宏
  • 3篇李建中
  • 1篇方效林
  • 1篇张安珍
  • 1篇孙纪舟

传媒

  • 3篇智能计算机与...
  • 1篇电子学报
  • 1篇哈尔滨工程大...

年份

  • 2篇2019
  • 2篇2018
  • 1篇2013
5 条 记 录,以下是 1-5
排序方式:
基于能量过滤的不确定时间序列数据清洗方法被引量:3
2019年
精确度是数据科学领域研究的重要方面,对后续数据处理等过程都有至关重要的影响.利用多个传感器返回的多个时间序列可提升时间序列数据的精确度,称为不确定时间序列,这多个时间序列样本在真实数据上下随机波动.已有关于时间序列的研究大多直接在不确定时间序列上提出新算法,其缺点是算法复杂度通常较高,直接对不确定时间序列进行清洗,获得尽可能接近真实的数据有重要意义.本文提出基于能量过滤的方法对不确定时间序列进行清洗,实验结果表明与已有方法相比,本文方法在效果和效率上都更优.
孙纪舟李建中
关键词:数据清洗
不确定图最小生成树算法被引量:2
2019年
很多领域产生的大量数据都可以很自然地用不确定图模型表示和描述,如蛋白质交互网络、社交网络、无线传感器网络等。本文研究不确定图上最可靠的最小生成树问题,该问题具有广泛的应用价值和研究意义。精确地求解算法需要枚举所有可能的最小生成树并找出其中出现次数最多的那个。因此,枚举开销随着边数增多呈指数增长,当图规模较大时并不可行。为此本文提出了一个时间复杂度为O(d|V|~2)的启发式贪心算法,其中d为最大的顶点度数,|V|为顶点数。实验结果表明,该算法具有较好的效率和较高扩展性。
张安珍李建中
关键词:贪心算法
基于滑动窗口挖掘数据流高效用项集的有效算法被引量:6
2018年
现有的基于滑动窗口挖掘高效用项集的研究方法存在:候选项集通常数量巨大,需要大量的存储空间及计算候选项集的真实效用是非常耗时的问题。本文提出一种不生成候选项集的挖掘算法HUISW(high utility itemset mining over a siding window),HUISW采用一种新的树结构HUIL-Tree(high utility itemset tee which arranges items according to lexicographic order)存储滑动窗口中的项集信息,采用效用数据库存储项集在窗口事务中的效用信息,在挖掘过程中HUISW采用模式增长的方法对由HUIL-Tree生成的项集通过其与效用数据库的对应关系,直接计算其在滑动窗口中的效用,整个过程避免了候选项集的生成。在实验中通过由稀疏和稠密数据集模拟的数据流对HUISW进行性能评估,并与同类算法SHU-Growth(siding window based high utility growth)进行比较,实验结果表明HUISW显著优于SHU-Growth,运行时间最快可提升两个数量级。
郭世明高宏
关键词:数据流数据挖掘
一种基站可移动传感器网络再编程协议被引量:3
2013年
本文针对基站可移动传感器网络实现了一再编程协议MovPro.该协议可以将新的二进制程序通过多跳的形式下发到网络内的节点上并使之运行.该协议的大致过程描述为,当基站在网络内移动时,基站将数据发送给它移动轨迹上的节点.节点收到部分二进制代码后通过窗口交换的形式将二进制代码传播到整个网络.MovPro是第一个在基站可移动传感器网络的真实系统.本文通过多种方式减少通信开销,并通过二级存储的方式减少外部flash的写次数.实验表明MovPro适用于基站可移动传感器网络.
方效林高宏李建中
关键词:无线传感器网络
在流滑动窗体上挖掘Top-K高效用项集的有效算法被引量:2
2018年
数据流上的频繁项集挖掘是数据挖掘的一个重要话题,并在现实生活中应用广泛。可是这个问题存在两个限制:(1)项在数据流中的权重没有被考虑;(2)项在每条事务中的数量没有被考虑。因此,研究人员提出了"数据流上的高效用项集挖掘"的研究问题。在这一问题中,项的权重及项在事务中的数量被考虑,数据流上的高效用项集挖掘是指在数据流中挖掘所有效用值不小于用户指定最小效用阈值的项集。对用户而言,由于不了解数据流中数据的统计特性,很难设置一个合适的最小效用阈值,如果最小效用阈值设置过高,则挖掘算法返回高效用项集的数量过少,使得用户无法准确分析;如果最小效用阈值设置过低,则挖掘算法返回太多的高效用项集,使得用户需要对结果集二次分析,为此研究人员提出了"数据流上的Top-K高效用项集挖掘"的研究问题。数据流上的Top-K高效用项集挖掘是指在数据流中寻找前k个具有最高效用值的项集,通过设置k值取代最小效用阈值,可有效地控制算法的输出规模,对用户而言更直观。与静态数据相比,数据流具有如下特点:快速的数据到达速率、数据流的尺寸未知和不能访问以前到达数据的特点,因此很难将整个数据流放入内存中处理,通常研究人员采用流滑动窗体模型。流滑动窗体是由固定数量的、最近到达的批数据组成,每个批数据包含一组事务集。现有的挖掘流滑动窗体上Top-K高效用项集的研究方法通常包含两个阶段:(1)采用高估技术高估项集在流滑动窗体中的效用,将高估效用不小于由阈值提升技术获得的最小效用阈值的项集选定为Top-K高效用项集候选项集;(2)通过扫描流滑动窗体内的批数据,计算第一阶段生成的候选项集的真实效用。可是,这个方法存在两个问题:(1)第一阶段生成的候选项集通常数量巨大,需要大量的存储空间;(2)计�
郭世明金代亮高宏
关键词:数据流
共1页<1>
聚类工具0