石丹妮
- 作品数:6 被引量:3H指数:1
- 供职机构:东华大学更多>>
- 发文基金:国家自然科学基金黑龙江省教育厅科学技术研究项目黑龙江省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- k-匿名数据上的聚集查询及其性质
- 2014年
- k-匿名数据中存在大量的有用信息,如何从k-匿名数据中得到有用的知识是目前亟待解决的问题。OLAP是知识发现的主要手段,聚集查询是OLAP的关键操作。为了解决k-匿名数据聚集查询问题,首先,给出了描述k-匿名数据的数据模型。其次,将聚集查询分为两个阶段,在第一阶段,给出k-匿名数据满足的性质和独立属性集的概念,利用k-匿名的性质和独立属性集给出求解满足查询约束的值和概率集合的算法,并将该集合作为第二阶段的输入。在第二阶段,给出聚集查询的语义。为了满足用户不同的查询需求,给出WITH子句约束及不同WITH子句约束的语义,作为聚集查询的第一阶段的补充。最后,讨论了聚集查询的性质,并用实验验证了查询的有效性。
- 张君宝刘国华王碧颖王梅王羽婷石丹妮翟红敏
- 关键词:数据共享OLAP隐私保护K-匿名聚集查询
- 基于指纹和推导模型的泄密信息检测方案
- 2012年
- 预防发布信息泄密是公开发布信息安全领域面临的一个富有挑战的问题。信息之间存在的推导关系是导致泄密的关键因素,本文将这种推导关系作为检测泄密信息的重要依据,提出了基于指纹和推导模型的泄密信息检测方案。首先,将需要保密的信息(即秘密信息)分为篇章、段落、句子和词;然后,采用现有的指纹提取技术对篇章、段落、句子进行处理;再通过定义词的层次关系和推导关系,利用推导模型解决由于词的推导而导致的泄密问题;最后,给出了泄密信息的检测算法,并对该算法进行了理论分析和实验验证。
- 王柠刘国华石丹妮
- 关键词:信息发布安全检测秘密信息指纹
- Attribute-or模型下不确定关系的无损分解算法
- 的可能世界集合是影响不确定关系查询效率的主要因素,分解是减小不确定关系可能世界集合的有效方法.为解决该问题,在Attribute-or数据模型上,定义了水平函数依赖和垂直函数依赖.提出了不确定关系水平划分算法,该算法能够...
- 叶杰敏刘国华貟慧石丹妮吴云龙费凡
- 关键词:数据库
- 均匀分布下不确定数据的关联规则变粒度查询被引量:2
- 2013年
- 云计算为大数据的关联规则挖掘与查询提供了平台。为防止隐私泄漏,大数据中往往包含人为添加的不确定因素,如何使用户对不确定数据的关联规则挖掘结果查询透明化是大数据挖掘结果查询亟待解决的问题。在用于共享的大数据中,不确定数据通过对精确数据的泛化处理来实现,具有均匀分布特性,这一特性不利于精确查询,但可为关联规则挖掘结果集的变粒度查询提供便利。首先,通过UFIDM算法进行挖掘并构建关联规则库,为提高查询效率,对泛化标识符和敏感属性分别构建Hilbert packed R树索引。在此基础上,提出了泛化值粒度转换方法和U-ARS查询算法。最后,通过理论分析和实验比对,展示了算法的可行性和有效性。
- 陈爱东刘国华肖瑞万小妹石丹妮
- 关键词:大数据关联规则
- Attribute-or模型下不确定关系的无损分解算法被引量:1
- 2013年
- 庞大的可能世界集合是影响不确定关系查询效率的主要因素,分解是减小不确定关系可能世界集合的有效方法.为解决该问题,在Attribute-or数据模型上,定义了水平函数依赖和垂直函数依赖.提出了不确定关系水平划分算法,该算法能够生成不确定关系的分解条件,解决了分解程度低的问题.给出了不确定关系分解过程和算法并证明该分解方法是无损的,讨论了k-匿名数据的分解问题.
- 叶杰敏刘国华貟慧石丹妮吴云龙费凡
- 关键词:K-匿名
- 中文句子语义相似判定问题的众包解决方案
- 随着计算机的普及以及互联网的迅速发展、海量信息以电子文档的形式出现在人们面前,如何快速准确地从大规模的文本信息中找到所需信息越来越困难。自然语言文本形式是最普遍的信息存储和信息交换形式,对中文句子语义相似判定研究是自然语...
- 石丹妮
- 关键词:语义相似度