王镝 作品数:22 被引量:20 H指数:3 供职机构: 上海宝信软件股份有限公司 更多>> 发文基金: 国家自然科学基金 高等学校优秀青年教师教学科研奖励计划 更多>> 相关领域: 自动化与计算机技术 生物学 理学 冶金工程 更多>>
Tandem repeat查找方法比较 被引量:1 2005年 Tandemrepeat在基因组成和进化中起到非常重要的作用,查找和分析Tandemrepeat已经成为当前生物信息学的一个前沿领域和研究焦点。目前在这一研究领域存在多类解决方法,主要有基于LZ分解技术的方法和最近兴起的基于后缀树索引的方法。本文选取了两种时间复杂度达到O(nlogn)数量级的代表性的方法,对这两种方法进行了全面的综述,并对它们的性能进行了系统的比较和分析。 徐恒宇 王镝 王国仁 郑若石关键词:TANDEM REPEAT 后缀树 基因组成 分解技术 数量级 后缀树 音乐数字序列中主题重复片段的查找 2006年 随着将音乐作品转化为数字数据技术的不断涌现,基于音乐作品内容的查询已经成为未来音乐数据查询的一个重要方向,音乐作品中有意义的重复片段查询是其中一个重要部分.定义音乐数据中有意义的重复片段和给出有效的查找算法是亟待解决的两个重要问题.从音乐作品中重复片段的意义和听众对音乐作品的感知两个角度出发,定义了一种新的音乐数据重复片段--主题重复片段,并提出了查找算法.考虑到查找过程的复杂性,基于音乐数字序列中(δ,γ)相似性,设计了δ过滤器及γ过滤器,在线性时间内得到重复片段的候选集,提高了查找的效率.实验结果表明,算法在查找效率上是令人满意的. 陈白尘 王镝 王国仁 赵毅 于长永 徐莹颖关键词:过滤器 DNA序列中基于后继数组索引的LPR查找算法 被引量:4 2006年 DNA序列中的重复片段在人类基因研究中有着非常重要的生物意义,因此,查找给定DNA序列中的重复片段是生物序列分析领域中的一个重要课题.基于重复片段的模式提出了新的重复片段定义LPR(largest pattern repetition)和模式单元的概念.对于长度为n的DNA序列,其中的LPR的数量是O(n)数量级的,但提供了与个数可多达n2/4的tandem repeat相同的重复片段信息.基于模式单元设计了可用于重复片段查找的全新索引--后继数组.后继数组有效地降低了索引空间,很好地突破了重复片段查找中的索引空间瓶颈.在后继数组上,通过模式单元可发现构成LPR的全部原子模式,并通过判断相同模式是否在原序列中连续出现完成LPR的查找.理论分析和实验结果均表明,设计的LPR查找算法的时间和空间复杂度均为O(n). 王镝 王国仁 吴青泉 陈白尘 赵毅 毛克明关键词:DNA序列 LPR DNA序列中基于后继数组索引的SATR查找算法 被引量:4 2007年 研究了基因序列分析中的DNA序列相似性重复片段的查找问题.在对重复片段的相似性衡量进行分析之后,基于海明距离提出了新的相似度衡量标准模式相似度和片段相似度,并在此基础上提出了一个新的相似性重复片段的定义SATR(segment-similarity based approximate tandem repeats).在进行SATR的查找时,采用了一个轻量级的索引后继数组,并设计出在后继数组上进行SATR查找的算法.实验评估和性能分析表明,基于后继数组的SATR查找算法在查找结果和查找时间上都要优于其他同类方法. 王镝 赵毅 陈白尘 王国仁关键词:DNA序列 DNA序列中基于后继数组索引的LPR查找算法 DNA序列中的重复片段在人类基因研究中有着非常重要的生物意义,因此,查找给定DNA序列中的重复片段是生物序列分析领域中的一个重要课题.基于重复片段的模式提出了新的重复片段定义LPR(largest pattern rep... 王镝 王国仁 吴青泉 陈白尘 赵毅 毛克明关键词:DNA序列 LPR 文献传递 音乐数字序列中主题重复片段的查找 随着将音乐作品转化为数字数据技术的不断涌现,基于音乐作品内容的查询已经成为未来音乐数据查询的一个重要方向,音乐作品中有意义的重复片段查询是其中一个重要部分.定义音乐数据中有意义的重复片段和给出有效的查找算法是亟待解决的两... 陈白尘 王镝 王国仁 赵毅 于长永 徐莹颖关键词:过滤器 文献传递 基于层次的物流结构分析方法 本发明提供了一种基于层次的物流结构分析方法,所述方法将物流结构的终点作为物流结构的第一层,然后根据后续路径的提单层次,依次为第二层到n层,n为大于2的自然数;然后根据采用提点的装点、卸点加层次的分析结构,构建并还原完整的... 王力 王镝 刘英林文献传递 基于分形理论的图像压缩算法的JAVA实现 2003年 阐述了分形理论应用在图像压缩领域的基本原理以及分类父块库搜索法和自适应四叉树编码法对灰度图像的压缩方法,并给出了Java语言的实现。对不同情况下的压缩图像的质量进行了讨论并给出了和JPEG格式图像的质量比较,试验表明,压缩到同等文件大小的时候,基于分型理论压缩的图像质量已经接近JPEG格式的图像质量。 朱伟勇 车明 王镝 廖欣关键词:分形 迭代函数系统 生物序列模式分析中神经网络的并行训练策略 2004年 神经网络作为模式识别、数据挖掘等方面的有效工具,已被广泛应用到生物序列的模式分析中,而生物序列的超大规模、超长同时也给神经网络提出了挑战,即必须解决训练时间过长、效率低下的问题。本文提出了若干适合生物应用的神经网络并行训练策略,并按其神经网络粒度进行分类,同时分析和比较了各种策略的代价。 王镝 吴青泉 王国仁 于戈关键词:神经网络 生物信息学 基于表面缺陷分布特征的钢卷表面缺陷判定方法 本发明公开了一种基于表面缺陷分布特征的钢卷表面缺陷判定方法,其包括以下步骤:步骤一,确定数据范围;步骤二、噪音数据过滤;步骤三、钢卷缺陷位置标准化:将缺陷在钢卷上的坐标,均转换为0至1之间,钢卷的长度和宽度均标准化为1等... 王镝 刘英林 丁文静文献传递