云南省应用基础研究基金(2010ZC030)
- 作品数:3 被引量:13H指数:2
- 相关作者:游进国奚建清杨卓荦胡建华李孟娟更多>>
- 相关机构:昆明理工大学华南理工大学云南师范大学更多>>
- 发文基金:云南省应用基础研究基金广东省科技计划工业攻关项目云南省教育厅科学研究基金更多>>
- 相关领域:自动化与计算机技术更多>>
- Dtrie-allpair:高效的集合T-覆盖连接算法被引量:2
- 2012年
- 传统的T-覆盖连接算法会因生成的候选集庞大而导致系统性能降低,为此,文中提出了一种基于trie的动态索引结构——DTI结构,并构建了基于该结构的相似度连接算法——Dtrie-allpair算法.通过该算法可以直接得到allpair连接的结果,不产生任何候选集,有效解决了高候选集产生的问题,克服了传统算法因生成并验证候选集而带来的开销.文中还研究了数据库中记录的顺序及记录中元素顺序对Dtrie-allpair算法性能的影响,并在msweb、msnbc两个数据集下对Dtrie-allpair算法与All-pair、PPJoin算法进行对比.结果表明:Dtrie-allpair算法具有明显的优势,覆盖阈值较小时优势更明显;对msweb数据集,阈值为2时,Dtrie-allpair算法的效率相对于All-pair、PPJoin算法提高近两个数量级;通过对数据集进行频率降序和长度升序组合预处理可大幅降低Dtrie-allpair算法访问的trie结点数量,从而显著提升性能.
- 贾连印奚建清李孟娟游进国刘勇苗德成
- 语义缓存技术的研究被引量:1
- 2013年
- 语义缓存技术一直以来是数据库研究的热点之一。语义缓存是指将用户向服务器端提交的查询语句和查询实际得到的结果数据同一存储在指定的缓存中,因而其不仅包含有数据,还有对数据的相关描述信息,从而可以提高查询效率。在语义缓存之前,还存在页面缓存、元组缓存、块缓存等缓存技术。文中首先介绍语义缓存的模型,然后阐述和分析语义缓存查询匹配算法和缓存替换策略,最后对语义缓存技术进行总结,从而为语义缓存技术的进一步研究提供一定的理论基础。
- 涂建新游进国周水力丁军帅
- 关键词:语义缓存查询匹配缓存替换
- 一种支持大规模数据的多维可视化分析框架被引量:10
- 2011年
- 以Hadoop为代表的可扩展大规模数据库难以进行多维可视化分析。为此,设计基于B/S架构的可视化分析框架Bizard。数据模型通过封装底层数据接口以支持业界多维数据访问协议XMLA,从而在展现层易于接入支持XMLA的传统分析工具,同时采用视图物化技术提高分析性能,利用互联网技术丰富用户分析体验。实验结果表明,该框架能在高达千万条记录级的数据上进行多维可视化分析。
- 游进国杨卓荦胡建华奚建清
- 关键词:数据仓库可视化分析大规模数据