国家自然科学基金(61033007) 作品数:39 被引量:150 H指数:6 相关作者: 李战怀 于戈 张晓 陈群 王晓玲 更多>> 相关机构: 西北工业大学 东北大学 华东师范大学 更多>> 发文基金: 国家自然科学基金 国家重点基础研究发展计划 国家高技术研究发展计划 更多>> 相关领域: 自动化与计算机技术 电子电信 理学 更多>>
一种面向关系数据库的语义关键字查询策略 在传统的关系数据库上进行关键字查询已经成为近来数据库领域的研究热点.面向关系数据库的关键字查询允许用户在不知道数据库模式、不使用复杂的查询语句的情况下查找出相关信息.然而这种方法可能会产生大量的查询结果,且这些结果与用户... 张瑶 申德荣 寇月 聂铁铮 于戈关键词:关系数据库 TOP-K 文献传递 Hyper_v虚拟机集群管理系统的设计与实现 被引量:4 2013年 随着Hyper_v虚拟机的应用普及,虚拟机资源的远程管理成为困扰企业的一个问题,主要包括:启动、停止、重启、快照、暂停、继续、保存、恢复、运行状态监测、机器信息采集等功能。本文针对上述问题展开研究,设计面向Web应用服务平台的Hyper_v虚拟机集群管理系统,介绍虚拟机集群资源管理的相关工作和阐述系统架构、功能模块特点、部署方式和优点。 黄昌华 康慕宁 韩朴杰关键词:虚拟机 高可用性 集群 远程唤醒 图数据中Top-k属性差异q-clique查询 被引量:6 2012年 紧密子图发现在许多现实世界网络应用中具有重要的研究意义.提出一种新的紧密子图发现问题——Top-k属性差异q-clique查询,找出图中k个节点间属性具有最大差异的q-clique.属性差异q-clique是一种结合图的结构特征和节点属性的紧密子图,在作者合作关系图数据中,该查询可以发现属性(如研究领域或所属单位)上不同的具有紧密合作关系的团队.给出了q-clique的属性差异度量,证明了该问题为NP难问题.采用分支限界策略,提出一种有效求解问题的算法AD-Qclique,同时依照best-first排序思想优化节点访问次序进一步提高算法性能.ACM作者信息数据集上的实验表明,算法AD-Qclique效率远优于基本算法BSL,并且结果中作者皆具有较高的H-index值及广泛的研究领域. 孙焕良 卢智 刘俊岭 于戈关键词:分支限界 SERA:股票历史交易重现和分析系统 2011年 当前股票市场正在对国民经济发挥着越来越重要的影响,同时也作为一个窗口反映国家的经济状况.分析历史交易和重现历史交易过程能够给人们带来很多启发和新信息.但是,考虑到现有股票交易系统安全性、可靠性和价格因素,无法在原有系统上进行修改或二次开发.这就需要一个全新的系统对历史数据进行管理.提出的原型系统是利用廉价PC构成的分布式系统实现了对股票历史交易重现和对股票交易数据进行统计分析的功能.详细介绍了该系统的整体架构和各模块的实现方法,并提出了完整的测试方案.该原型系统为进一步进行股票交易系统的开发和股票交易数据的分析研究奠定了基础. 周遥 冯亮 张俍 翁念龙 张蓉关键词:分布式系统 新型OLTP数据库系统设计的关键技术及挑战 被引量:5 2014年 传统的数据库系统是根据20世纪70年代的硬件特点而设计.随着"云计算"和"大数据"时代的到来,应用需求对数据库系统的事务吞吐量和可扩展性提出了更高的要求,同时内存、多核等新型计算机硬件技术的发展为数据库系统的发展提供了新的机遇,因此研究和设计新型数据库系统也变得越来越重要.本文针对新型计算机硬件和应用需求的特点,研究和分析了新型OLTP数据库系统设计所涉及的关键技术,并探讨了存在的挑战性问题. 任堃 李战怀关键词:可扩展性 计算机硬件 事务处理 基于信息流动分析的动态社区发现方法 被引量:16 2014年 随着社交网络和微博等互联网应用的逐渐流行,其用户规模在迅速膨胀.在这些大规模网络中,社区发现可以为个性化服务推荐和产品推广提供重要依据.不同于传统的网络,这些新型网络的节点之间除了拓扑结构外,还进行频繁的信息交互.信息流动使得这些网络具有方向性和动态性等特征.传统的社区发现方法由于没有考虑到这些新的特征,并不适用于这些新型网络.在传染病动力学理论的基础上,从节点间信息流动的角度,提出一种动态社区发现方法.该方法通过对信息流动的分析来发现联系紧密、兴趣相近的节点集合,以实现动态的社区发现.在真实数据集上的实验结果表明:相对于传统的社区发现方法,所提出的方法能够更准确地发现社区,并且更能体现网络中社区的动态变化. 索勃 李战怀 陈群 王忠关键词:社交网络 云存储系统性能评测技术研究 被引量:5 2014年 云存储系统目前应用广泛,其核心功能是向外提供存储服务,而云存储性能直接影响着云存储服务的质量.由于云存储系统的数据存储在云端,且使用角色众多,传统的性能评测技术不适用于云存储系统.从用户、云存储服务提供商、设备提供商3个角度出发,针对其关注的云存储系统不同层次,提出适用于多层次、多角色的性能评测指标和评测方法,提供可靠的适用于云存储系统的评测方案、规范测试方法,为性能优化提供数据参考,同时为用户选购、部署云存储系统提供可靠的参考意见. 齐婵颖 李战怀 张晓 张瑞杰关键词:性能评测 性能指标 基于堆叠文件系统的云计算存储优化 被引量:2 2014年 云环境中大量虚拟镜像带来的冗余会造成资源利用率降低,采用重复数据删除技术能缓解对存储空间以及网络带宽的需求,但同时也存在处理性能下降的问题。为此,提出一种基于堆叠文件系统的云计算存储优化方案。该方案利用可堆叠文件系统将用户对虚拟实例的少量修改信息存放于可读写盘中,将虚拟镜像存放于只读盘中,每次只保存用户对虚拟实例的少量修改信息,而无需保存整个实例。实验结果表明,该方案可在不影响性能的条件下降低存储容量,对文件系统性能的影响平均约为0.75%,在用户对虚拟实例只需少量修改的情况下,对存储容量的需求相比传统重复数据删除方案减少约35%。 郭婉 张晓 丰文雄关键词:虚拟图像 云计算 重复数据删除 一种基于增量分区的社交网络数据管理与维护方法 社交网站作为在线交流的最新形式,吸引了数以亿计的用户,同时产生了海量数据.为此,如何存储大量的用户及其交互信息成为了社交网站的一个挑战.在深入分析了社交网络数据的特点之后,提出了一种用来描述社交网络中用户交互行为的交互关... 白帆 申德荣 王习特 聂铁铮 寇月 于戈关键词:社交网络 文献传递 空间数据库中主题相关区域查询 被引量:2 2012年 空间查询处理已经广泛地应用于基于位置的服务、设施选址等领域.提出一种新的空间查询:主题相关区域查询(topic-relevant region queries,T2R),该查询可以用于位置选址等空间决策分析.给定一个由空间特征对象集合R定义的主题T、查询窗口q,T2R查询返回不交叠的k个与主题最相关的区域,区域与主题的相关程度由区域内特征对象的数量结合其重要性进行计算.为了有效处理T2R查询,提出BSL,FR和SHR3种算法,其中SHR算法将高相关程度区域先聚类、再收缩以获得更优的剪枝效果.所提出的算法解决了给定查询窗口下对数据空间任意位置按主题相关程度进行排序的问题.利用真实与人工数据集进行了充分实验,评估了所提出算法在不同参数设置下的查询效率,通过针对实际主题的查询验证了T2R查询的有效性. 刘俊岭 于戈 孙焕良关键词:空间数据库