江苏省教育厅自然科学基金(09KJB20013)
- 作品数:5 被引量:8H指数:2
- 相关作者:陈崚屠莉陆林席艳秋潘舟金更多>>
- 相关机构:扬州大学江阴职业技术学院南京大学更多>>
- 发文基金:江苏省教育厅自然科学基金江苏省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术理学文化科学更多>>
- 流数据上的频繁项挖掘算法
- 2011年
- 提出了一种流数据上的频繁项挖掘算法(SW-COUNT)。该算法通过数据采样技术挖掘滑动窗口下的数据流频繁项。给定的误差ε,SW-COUNT可以在O(ε-1)空间复杂度下,检测误差在εn内的数据流频繁项,对每个数据项的平均处理时间为O(1)。大量的实验证明,该算法比其他类似算法具有较好的精度质量以及时间和空间效率。
- 屠莉陈崚
- 关键词:数据流频繁项采样技术数据挖掘
- 挖掘滑动窗口中的数据流频繁项算法被引量:2
- 2012年
- 滑动窗口是一种对最近一段时间内的数据进行挖掘的有效的技术,本文提出一种基于滑动窗口的流数据频繁项挖掘算法.算法采用了链表队列策略大大简化了算法,提高了挖掘的效率.对于给定的阈值S、误差ε和窗口长度n,算法可以检测在窗口内频度超过Sn的数据流频繁项,且使误差在εn以内.算法的空间复杂度为O(ε-1),对每个数据项的处理和查询时间均为O(1).在此基础上,我们还将该算法进行了扩展,可以通过参数的变化得到不同的流数据频繁项挖掘算法,使得算法的时间和空间复杂度之间得到调节.通过大量的实验证明,本文算法比其它类似算法具有更好的精度以及时间和空间效率.
- 屠莉陈崚包芳
- 关键词:数据流频繁项
- 独立级联模型下基于最大似然的负影响力源定位方法被引量:2
- 2022年
- 如今,网络谣言、传染病、计算机病毒等负面影响力的传播,给社会稳定、人类健康和信息安全造成了巨大的隐患,识别它们的传播源,对于控制负面影响力造成的危害有着重要的意义。目前大多数方法都只致力于单个传播源的定位问题,而在实际网络中,负影响力往往来自多个传播源,而且需要进行传播过程的模拟;此外,由于忽略了顶点之间拓扑限制的差异,导致定位传播源的准确率不高而且需要大量的计算时间。针对这些问题,提出了一种基于极大似然的方法,利用少量观测点提供的信息来有效定位多个传播源。首先,提出了传播图的概念以及产生传播图的方法,根据节点的入度和边的权重将其划分成若干层级,并去除传播概率较小的边,形成包含观测节点的传播图;然后,利用似然法计算传播图中的每一层顶点的激活概率,选取相对于观测点的似然最大的k个顶点构成源节点集合;最后,对所提方法进行了模拟实验,实验结果表明,该方法能够准确识别网络中的多个传播源,源定位结果的精确度高于其他类似算法;同时,也通过实验验证了观测点的选择和网络结构在不同程度上会影响传播源的定位结果。
- 邵玉陈崚刘维
- 关键词:社会网络最大似然
- 奇异向量空间双聚类算法被引量:3
- 2012年
- 本文针对0/1矩阵的双聚类问题提出一种奇异向量空间双聚类算法.通过SVD分解将0/1矩阵映射到左右奇异向量空间上,然后利用信息熵判断行聚类优先还是列聚类优先,最后根据判断结果递归进行行聚类或列聚类,直到满足停止条件.实验显示奇异向量空间双聚类算法可以分辨出完全无重叠的子矩阵,比较快速地得到硬的双簇.
- 徐晓华席艳秋潘舟金陆林陈崚
- 关键词:SVD分解布尔矩阵
- 现代物流系统中基于路径的RFID立方体构建方法被引量:1
- 2011年
- 为有效地存储和管理海量数据,提出了一种基于路径的射频识别技术数据立方体构建方法。该方法不受射频识别技术系统的物理分布影响,只与路径数据库的规模有关;在最小兴趣层和观察层之间,选择物化某些立方体单元,以保证能够快速构建立方体结构和较快响应系统不同用户的路径查询。理论分析和实验结果表明了该方法的有效性。
- 丁有伟崔荣青胡孔法陈崚宋爱波
- 关键词:物流射频识别数据立方体路径查询