国家自然科学基金(60573089)
- 作品数:37 被引量:61H指数:5
- 相关作者:王国仁姜岩毛克明赵相国潘平更多>>
- 相关机构:东北大学沈阳工业大学上海宝信软件股份有限公司更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划高等学校科技创新工程重大项目更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 时序微阵列数据中的同步和异步共调控基因聚类被引量:5
- 2007年
- 基因的共调控可分为同步和异步两种.文中提出了一种新的聚类模型Reg-Cluster,将具有相同编码的同步和异步共调控基因聚集到同一个共调控基因类中.在此基础上,提出了一种有效的聚类算法FBLD,采用先宽度优先、后深度优先的搜索策略,并结合高效的削减规则,挖掘得到所有符合条件的最大Reg-Cluster.聚类结果中包含了详细而完备的共调控信息,有助于基因调控网的研究.算法可扩展用于三维基因-样本-时间微阵列数据集的分析.FBLD算法已经应用到真实和人造微阵列数据集中,其结果被提交到Gene Ontology,实验结果证明了算法的高效性和有效性.
- 印莹赵宇海张斌王国仁
- 关键词:聚类时间序列基因本体
- 一种基于混沌理论的数据流连续聚集查询预测算法被引量:1
- 2007年
- 为了有效地预测聚集查询的未来聚集值,提出了一种基于混沌理论的数据流连续聚集查询预测未来聚集值算法——CSPA算法.数据流看作是以数据到达时间为序的一个时间序列,借鉴传统时间序列分析技术探讨了连续聚集查询的未来聚集值预测问题,但由于数据流序列与传统时间序列在时间间隔和数据集的处理上存在很大差别,于是采用流滑动窗口技术加以处理.其次,针对目前数据流聚集查询预测领域已有的一些研究结果都未考虑流数据内在的复杂非线性动力学特征对预测的影响问题,该算法又利用了混沌理论中的局域预测思想解决了这一不足.实验结果表明,利用该算法进行预测具有很好的准确性.
- 于亚新王国仁陈灿付冲
- 关键词:数据流时间序列聚集查询混沌
- 专业搜索引擎数据更新的算法P^2FC被引量:1
- 2007年
- 网页更新策略的好坏直接影响到专业搜索引擎的整体性能。在分析了专业搜索引擎中网页更新模块结构和它所采用的监控技术的基础上,考虑了重要性、时新性、估计频率、点击率等综合因素,提出了一种新的增量式更新算法P2FC。实验证明,该算法在保证时新性和提高更新效率上都取得了很好的效果。
- 刘辉林孟莉杨松波王光兴
- 关键词:搜索引擎点击率
- Xtwig连接:基于流的对无根树查询模式的高效处理
- 为了提高对XML文档的查询能力,提出了一种Xtwig查询模式.Xtwig模式可以被表达成无根标签树,它在选择谓词中包含反向轴,可以从当前节点向后和向前查找指定的模式.现在已有很多处理Twig模式查询的经典算法,然而这些算...
- 宁博王国仁赵燕燕朴小雪
- 关键词:XML
- 文献传递
- TH-Ring:一种基于语义的结构化P2P网络
- 构建基于语义的P2P网络是支持基于语义的查找和提高网络性能的重要手段.考虑遵循某种分类层次的数据源的特点,提出了一种基于分类层次语义空间的P2P网络(TH-Ring),并给出具体实现算法.TH-Ring根据广度优先遍历算...
- 乔百友谢可心王国仁
- 关键词:P2P
- 文献传递
- 基于压缩叶子流的XML Twig查询
- 在XML数据库中的XML Twig查询是最近查询所关注的焦点,特别是基于整体的算法.很大部分查询算法是通过对XML文档进行编码来实现的,但是,这些算法忽略了文档中双生节点的共有特性.提出了用路径标记来代替已有的编码策略,...
- 董科王国仁宁博毛克明赵相国
- 关键词:TWIG查询
- 文献传递
- 移动对象环境下的Topk差值聚合查询策略
- 2006年
- 聚合查询(GNN)在空间数据库以及网络环境中是一个相对比较新的操作.与传统的只有一个查询结点的kNN查询相比,GNN具有多个查询结点,由于查询点的数目以及它们在数据库空间中分布的任意性,使得GNN查询比只有一个查询点的kNN查询复杂得多.提出了一种基于2个查询点的差值聚合查询,在GNN查询方法中提出的将多个查询点分布于一个MBR的算法并不适用于此类差值查询.基于单查询点的YPK-CNN,利用双曲线性质把查询空间分成几大部分,在此基础上计算出双曲线的渐近线以简化删减条件,直接删减掉不符合条件的搜索空间.实验结果显示,针对这种特定的差值聚合查询,所提出的基于双曲线渐近线过滤策略的查询算法要比基本查询算法在查询响应时间和访问结点次数方面更高效.
- 关晶王斌李柰罗旭王国仁信俊昌
- 关键词:最近邻居查询聚合查询
- XML函数依赖的定义及分析被引量:1
- 2006年
- 函数依赖是XML数据约束研究的重要组成部分.针对XML中存在的复杂的多种形式的函数依赖约束,分析了数据约束的特点,引入节点值相等的概念,提出了一种DTD的路径语言,进而提出了一种新的XML函数依赖(XFD)的定义,包括相对XFD和绝对XFD.其中,绝对键和相对键是XFD的特例.研究了XFD的逻辑蕴涵与闭包问题,给出一组相应的推理规则,并证明了推理规则的正确性及完备性.
- 赵相国王国仁张恩德丁大斌霍欢
- 关键词:XML函数依赖
- 音乐数字序列中主题重复片段的查找
- 2006年
- 随着将音乐作品转化为数字数据技术的不断涌现,基于音乐作品内容的查询已经成为未来音乐数据查询的一个重要方向,音乐作品中有意义的重复片段查询是其中一个重要部分.定义音乐数据中有意义的重复片段和给出有效的查找算法是亟待解决的两个重要问题.从音乐作品中重复片段的意义和听众对音乐作品的感知两个角度出发,定义了一种新的音乐数据重复片段--主题重复片段,并提出了查找算法.考虑到查找过程的复杂性,基于音乐数字序列中(δ,γ)相似性,设计了δ过滤器及γ过滤器,在线性时间内得到重复片段的候选集,提高了查找的效率.实验结果表明,算法在查找效率上是令人满意的.
- 陈白尘王镝王国仁赵毅于长永徐莹颖
- 关键词:过滤器
- DNA序列中基于后继数组索引的LPR查找算法被引量:4
- 2006年
- DNA序列中的重复片段在人类基因研究中有着非常重要的生物意义,因此,查找给定DNA序列中的重复片段是生物序列分析领域中的一个重要课题.基于重复片段的模式提出了新的重复片段定义LPR(largest pattern repetition)和模式单元的概念.对于长度为n的DNA序列,其中的LPR的数量是O(n)数量级的,但提供了与个数可多达n2/4的tandem repeat相同的重复片段信息.基于模式单元设计了可用于重复片段查找的全新索引--后继数组.后继数组有效地降低了索引空间,很好地突破了重复片段查找中的索引空间瓶颈.在后继数组上,通过模式单元可发现构成LPR的全部原子模式,并通过判断相同模式是否在原序列中连续出现完成LPR的查找.理论分析和实验结果均表明,设计的LPR查找算法的时间和空间复杂度均为O(n).
- 王镝王国仁吴青泉陈白尘赵毅毛克明
- 关键词:DNA序列LPR