您的位置: 专家智库 > >

肖瑞

作品数:8 被引量:29H指数:2
供职机构:东华大学计算机科学与技术学院更多>>
发文基金:国家自然科学基金国家教育部博士点基金更多>>
相关领域:自动化与计算机技术理学更多>>

文献类型

  • 6篇期刊文章
  • 1篇学位论文
  • 1篇会议论文

领域

  • 7篇自动化与计算...
  • 1篇理学

主题

  • 6篇时间序列
  • 6篇不确定性
  • 4篇降维
  • 3篇降维方法
  • 2篇聚类
  • 2篇查询
  • 1篇隐私
  • 1篇隐私保护
  • 1篇隐私保护模型
  • 1篇时间序列相似...
  • 1篇数据模型
  • 1篇统计学
  • 1篇匿名
  • 1篇欧氏距离
  • 1篇粒度
  • 1篇聚类算法
  • 1篇聚类研究
  • 1篇均匀分布
  • 1篇关联规则
  • 1篇K-匿名

机构

  • 8篇东华大学

作者

  • 8篇肖瑞
  • 6篇刘国华
  • 4篇宋转
  • 3篇陈爱东
  • 2篇刘玉静
  • 1篇石丹妮
  • 1篇廖小飞
  • 1篇万小妹

传媒

  • 2篇计算机应用研...
  • 2篇计算机与数字...
  • 1篇计算机工程与...
  • 1篇计算机科学
  • 1篇2013年全...

年份

  • 4篇2014
  • 4篇2013
8 条 记 录,以下是 1-8
排序方式:
k-匿名隐私保护模型中不确定性数据的查询问题
2013年
查询是一种重要的数据库操作。在k-匿名隐私保护模型中,每条元组不仅包括精确数据,还包括泛化数据,因此k-匿名数据是一种不确定数据。为了讨论k-匿名数据的查询问题,首先,提出一种描述k-匿名数据的不确定性数据模型,在此基础上,定义了k-匿名数据的成员(Membership)问题、可能性(Possibility)问题、确定性(Certainty)问题、包含(Containment)问题等查询问题,然后,讨论了这些问题的数据复杂度,证明了Membership问题是PTIME,q-Membership问题是NP-完全的,q′-Containment问题是Πp 2-完全的,q-Containment问题coNP-完全的,Possibility问题是PTIME,q-Possibility问题是NP-完全的,Certainty问题是coNP-完全的。这些结论为k-匿名隐私保护模型中不确定性数据查询方法的研究奠定了理论基础。
刘玉静刘国华李捷元肖瑞
关键词:不确定性数据K-匿名数据模型查询
不确定时间序列的编码匹配被引量:1
2013年
由于时间序列的长度很大,并且不确定时间序列在每个观察点的取值具有不确定性,这导致了维度灾难和庞大的可能世界集,给不确定时间序列相似性匹配带来了巨大的困难。针对此问题,提出一种基于桶分割和算术编码的相似性匹配算法,该算法不仅可以将不确定时间序列规约为一条确定的时间序列,并通过距离度量完成相似性匹配,而且可以通过规约后的确定时间序列近似地恢复原不确定时间序列。最后实验验证,使用该算法对不确定时间序列进行相似性匹配,不仅有很高的匹配效率和很低的时间复杂度,而且可对两种新的相似性类型完成匹配。
肖瑞刘国华宋转刘玉静
关键词:时间序列不确定性
均匀分布下不确定数据的关联规则变粒度查询被引量:2
2013年
云计算为大数据的关联规则挖掘与查询提供了平台。为防止隐私泄漏,大数据中往往包含人为添加的不确定因素,如何使用户对不确定数据的关联规则挖掘结果查询透明化是大数据挖掘结果查询亟待解决的问题。在用于共享的大数据中,不确定数据通过对精确数据的泛化处理来实现,具有均匀分布特性,这一特性不利于精确查询,但可为关联规则挖掘结果集的变粒度查询提供便利。首先,通过UFIDM算法进行挖掘并构建关联规则库,为提高查询效率,对泛化标识符和敏感属性分别构建Hilbert packed R树索引。在此基础上,提出了泛化值粒度转换方法和U-ARS查询算法。最后,通过理论分析和实验比对,展示了算法的可行性和有效性。
陈爱东刘国华肖瑞万小妹石丹妮
关键词:大数据关联规则
不确定性时间序列的降维与相似性匹配研究
时间序列是按时间顺序排列的实数序列,它反映了实体属性在时间顺序上的特征。时间序列的降维、相似性匹配及聚类研究是数据挖掘领域的重要研究方面,在位置定位系统、环境监测、物联网等领域中有广泛的应用。并且随着信息技术的发展和现实...
肖瑞
关键词:时间序列不确定性降维方法聚类算法
文献传递
不确定时间序列的相似性匹配研究被引量:2
2014年
确定时间序列的相似性匹配方法都没有考虑数据的不确定性,而现实世界中诸如温度传感器等设备采集到的数据往往是不确定的,并且两条不确定时间序列之间的距离也是不确定的,所以现有的确定时间序列的相似性匹配方法不适用于这些领域。针对此问题,提出了基于统计学的规约算法,并且基于该算法提出了不确定时间序列相似性匹配的两种新型算法。在规约过程中,规约算法优化了不同背景下不确定时间序列的小概率点和奇异点的处理。在匹配过程中,首先提出了圆环匹配算法,它通过构建匹配圆环完成相似性匹配,并且通过多次重启提高相似性匹配的准确度和效率;然后在规约算法的基础上,提出了期望匹配的改进算法,它通过增加包络约束消除期望匹配算法中出现的误判问题。
宋转廖小飞肖瑞
关键词:时间序列不确定性降维欧氏距离
不确定时间序列的统计降维方法被引量:2
2014年
由于不确定时间序列的长度很长,并且每个采样点的取值具有不确定性,导致了维度灾难和庞大的可能世界集,给不确定时间序列相似性匹配带来了巨大的困难,因此对不确定时间序列降维是实现对其方便存储、快速查询和相似性匹配的首要任务。不确定时间序列普遍采用小波变换的降维方法,但是该方法没有考虑到采样点之间的相关性。为解决该问题,提出一种基于概率统计和数据相关性的降维方法,该方法将不确定时间序列分为概率维度和时间维度,并分别对两维度进行降维。在时间维度,根据采样点之间的相关性,使用某个采样点代表后续相关度高的采样点;在概率维度,使用大概率点表示相邻的小概率点。实验效果表明:使用该方法对不确定时间序列进行降维后,降维序列可以保持原序列的变化趋势,压缩程度显著,并且可近似地恢复原序列。
肖瑞刘国华陈爱东宋转
关键词:时间序列不确定性降维
基于趋势的时间序列相似性度量和聚类研究被引量:19
2014年
由于时间序列的长度很大,并且不确定时间序列在每个采样点的取值具有不确定性,导致时间序列在相似性匹配和聚类挖掘中时间复杂度很高,为了解决该问题,提出了基于趋势的时间序列相似性度量方法和聚类方法。其中基于趋势的相似性度量方法根据时间序列的整体变化趋势,将时间序列映射为短的趋势符号序列,并利用各趋势的一阶连接性指数和塔尼莫特系数完成相似性度量;基于趋势的聚类方法通过定义趋势高度,并对趋势符号序列迭代进行区间划分和趋势判断,并以此构建趋势树,最后将趋势树根节点中趋势符号相同的序列聚集为一类。实验结果表明:a)五种趋势符号的一阶连接性指数可唯一地表示一条时间序列;b)基于趋势的相似性度量方法在多项式时间内可有效完成时间序列的相似性匹配;c)基于趋势的聚类方法将序列的相似性度量和聚类过程集中在一起,聚类效果显著。
肖瑞刘国华
关键词:时间序列不确定性聚类
不确定时间序列的统计降维方法
由于不确定时间序列的长度很长,并且每个采样点的取值具有不确定性,导致了维度灾难和庞大的可能世界集,给不确定时间序列相似性匹配带来了巨大的困难,因此对不确定时间序列降维是实现对其方便存储、快速查询和相似性匹配的首要任务.不...
肖瑞刘国华陈爱东宋转
关键词:统计学时间序列不确定性降维方法
文献传递
共1页<1>
聚类工具0