您的位置: 专家智库 > >

王海平

作品数:10 被引量:22H指数:3
供职机构:合肥工业大学计算机与信息学院更多>>
发文基金:国家自然科学基金安徽省自然科学基金中国博士后科学基金更多>>
相关领域:自动化与计算机技术医药卫生更多>>

文献类型

  • 9篇期刊文章
  • 1篇会议论文

领域

  • 8篇自动化与计算...
  • 1篇医药卫生

主题

  • 8篇通配符
  • 2篇约束模式
  • 2篇剪枝
  • 2篇剪枝算法
  • 1篇药物
  • 1篇医药
  • 1篇有限长
  • 1篇有向无环图
  • 1篇数据流
  • 1篇图算
  • 1篇图算法
  • 1篇推荐系统
  • 1篇问题求解模型
  • 1篇协同过滤
  • 1篇解空间
  • 1篇空位
  • 1篇后缀树
  • 1篇集成分类器
  • 1篇疾病
  • 1篇分类器

机构

  • 10篇合肥工业大学
  • 2篇合肥师范学院
  • 1篇佛蒙特大学
  • 1篇同济大学
  • 1篇中国科学技术...
  • 1篇中国人民解放...

作者

  • 10篇王海平
  • 6篇胡学钢
  • 6篇郭丹
  • 3篇吴信东
  • 2篇谢飞
  • 2篇汪浩
  • 1篇侯宝剑
  • 1篇刘琦
  • 1篇戴玮
  • 1篇甄田甜
  • 1篇刘应玲
  • 1篇张玉红
  • 1篇李培培
  • 1篇李燕

传媒

  • 4篇计算机科学
  • 2篇模式识别与人...
  • 1篇中国药理学通...
  • 1篇合肥工业大学...
  • 1篇计算机应用研...
  • 1篇2014湖北...

年份

  • 3篇2016
  • 2篇2015
  • 2篇2014
  • 2篇2012
  • 1篇2011
10 条 记 录,以下是 1-10
排序方式:
带通配符的模式匹配问题及其解空间特征分析被引量:1
2014年
随着生物信息学、信息检索等领域的发展,带有通配符和长度约束的模式匹配问题引起了广泛关注。该问题扩展了精确模式匹配问题,使匹配更加灵活,同时也增加了匹配的复杂性,极大地提高了非线性匹配算法的复杂度。求解该问题的匹配算法的效率与问题的解空间密切相关,而目前针对该问题的解空间及其特征尚缺乏系统的研究。鉴于此,描述了该问题的解空间,并分析了解空间的可分性。之后,提出解空间划分算法SPLIT,并分析了SPLIT的时间复杂性。实验部分以3个匹配算法为对照,在真实DNA数据集下,使用了5109组模式。实验结果表明,SPLIT不影响匹配解的结构,且可以有效降低非线性匹配算法的时间消耗。
项泰宁郭丹王海平胡学钢
关键词:解空间通配符
一种带有通配符和长度约束模式匹配问题的动态剪枝算法被引量:1
2015年
近年来,随着生物信息学、信息检索等领域的发展,串模式匹配问题被不断扩展。其中,具有代表性的是在模式中引入可变长度的通配符而形成带有通配符的模式匹配(PMWL)。该问题定义的灵活性给用户提供了方便,却也造成了求解上的困难。因此,如何在多项式时间内得到更好的匹配解成为研究的焦点。提出了一种启发式的小兵算法。小兵算法通过将PMWL问题转化为路径搜索问题,并借鉴动态剪枝思想,在算法搜索的过程中动态地将不可能的匹配位置剪枝,从而提高解的质量。实验在真实DNA序列上进行,并人工生成了196个模式。结果表明,相比于目前最有效的SAIL算法,小兵算法在绝大多数的尾部有重复字符的模式中可以获得更好的匹配解。
王海平戴玮郭丹
关键词:通配符剪枝
药物-疾病关系预测:一种推荐系统模型被引量:6
2015年
目的药物重定位是指发掘已有药物新的治疗作用,然而具有潜在治疗作用的药物-疾病往往隐藏在数以百万计的关系对中。该研究基于医疗大数据分析,预测具有潜在治疗关系的药物-疾病关系对。方法将社交网络中推荐系统模型应用于药物重定位研究,并假设具有相似化学结构的药物可能具有相似的适应症。从开源数据库收集已知药物-疾病的治疗关系、副作用关系以及药物和疾病特征描述符,计算得到药物-药物的相似度和疾病-疾病相似度,再构建推荐模型将上述信息融合,并预测具有潜在治疗关系的药物-疾病,最终得到预测关系对的排序列表。结果列表排名前500的关系对中,有12.8%得到临床实验支持或综述报道,20%得到模式生物实验或细胞实验支持。结论相比于已有分类模型和随机抽样结果,本模型可明显提高具有潜在治疗作用药物-疾病的富集程度。
汪浩王海平吴信东刘琦
关键词:推荐系统协同过滤
一种带有通配符和长度约束模式匹配问题的动态剪枝算法
近年来,随着生物信息学、信息检索等领域的发展,串模式匹配问题被不断扩展。其中,具有代表性的是在模式中引入可变长度的通配符而形成带有通配符的模式匹配(PMWL)。该问题定义的灵活性给用户提供了方便,却也造成了求解上的困难。...
王海平戴玮郭丹
关键词:通配符剪枝
图算法求解带有限长空位和one-off约束的模式匹配问题
2016年
讨论带有限长空位和one-off约束条件的模式匹配问题,其中限长空位改变单个匹配解结构,one-off条件约束匹配解之间的关系,从而形成规模较大且稀疏的解空间.借鉴约束可满足性问题框架,将PMGO问题转化为图结构下的路径搜索问题,并证明转化的等价性.然后提出图结构下的剪枝和匹配算法(GPM),根据one-off约束得到节点之间的约束关系,再迭代交互地进行剪枝与搜索.实验中使用匹配解丢失率度量已有启发式算法和GPM的完备性,证明GPM可与已有启发式算法形成互补,有效降低匹配解丢失率.
胡学钢王海平郭丹李培培
关键词:有向无环图
字符分布特征对带有通配符串匹配问题的影响
2016年
近年来,字符串匹配问题被不断扩展。其中,具有代表性的是在模式中引入可变长度的通配符,称之为PMWL问题。针对此问题,已有工作分析了在不同的模式特征下,匹配数卵随文本长度增加呈指数级增长。同时考虑文本分布特征和模式特征,建立了期望模型E(Ω)=nDπ(P),其中n为文本长度,D为模式中各通配符跨度的乘积,π(P)为基于字符分布的模式出现概率。实验部分,在人工随机数据和DNA真实数据上验证了E(Ω)的准确性,得到预测误差率分别为1.8%-3.2%和4.7%~7.8%;在不同字符分布中,分析了模式模长和通配符跨度对匹配数n的影响。E(Ω)模型揭示了n的增长趋势不一定呈指数级,而取决于π(P)和D的共同影响,且E(Ω)模型能够在线性时间内得到近似完备解。
王海平郭丹项泰宁胡学钢
关键词:串匹配通配符
带有通配符和长度约束的模式匹配问题求解模型被引量:1
2016年
讨论了带有通配符和长度约束的模式匹配(PMWL)问题,其中模式由子模式序列集组成,两个相邻子模式的间隔在一定长度范围内。针对PMWL问题,已有工作包括设计启发式求解算法和对特殊情况进行完备性分析,然而还需要构建问题的基础求解模型。借鉴约束可满足问题框架,构建了由变量、值域和约束组成的三元组求解模型,对PMWL问题的基本概念和基本性质给出了形式化描述。最后,给出了算法求解PMWL问题的特定条件下的完备解。
汪浩王海平吴信东
关键词:通配符
模式特征对带有通配符和长度约束的模式匹配问题的影响被引量:8
2012年
带有通配符的模式匹配问题(PMWL)模式定义的灵活性给用户提供方便,却也造成求解上的困难.目前没有任何多项式算法能得到该问题的完备解,同时也缺少足够的完备性分析.文中认为模式特征是影响PMWL完备性的关键因素,并提出模式重复度的概念,记为rep.证明在rep=0的限定条件下PMWL的完备性,同时分析rep>0时PMWL不完备的原因.实验以近似比为指标,说明rep对PMWL完备性的影响.
王海平胡学钢谢飞郭丹吴信东
关键词:通配符
一种基于UFFT的数据流分类器被引量:1
2011年
文章提出一种基于极速决策森林(UFFT)的加权装袋算法(UFFT-wb),它采用加权装袋算法模型,以UFFT算法构建基分类器。实验表明,该算法具有确定分割点及选择分割属性花费时间少、构建新结点占用空间小及可以增量式构建等特点,与基于C4.5算法的加权装袋算法模型相比,在保持相似精度的基础上,时间性能有一定程度的改进。
甄田甜张玉红李燕王海平胡学钢
关键词:数据流集成分类器
基于后缀树的带有通配符的模式匹配研究被引量:7
2012年
由于在生物序列分析、文本索引、网络入侵检测等领域的应用需求,带有通配符的模式匹配问题一直是研究的热点。针对已有的研究工作中通配符和长度约束具有较强的局限性问题,研究带有灵活通配符的模式匹配问题,其中通配符可以在模式的任意两子串间出现且可以指定灵活的长度约束。采用非线性数据结构——后缀树,设计了求解模式所有解的完备算法PAST。预处理阶段采用在线增量式算法构建具有文本先验知识的后缀树,搜索阶段结合动态规划的思想,逐个匹配模式中字符,最终得到完备解。在基因序列上的实验表明,PAST比其他算法具有更好的时间性能。
侯宝剑谢飞胡学钢刘应玲王海平
关键词:通配符后缀树
共1页<1>
聚类工具0