您的位置: 专家智库
>
资助详情>
国家教育部博士点基金(20020610007)
国家教育部博士点基金(20020610007)
- 作品数:59 被引量:547H指数:17
- 相关作者:唐常杰于中华元昌安左劼段磊更多>>
- 相关机构:四川大学成都中医药大学中国人民解放军炮兵学院更多>>
- 发文基金:国家教育部博士点基金国家自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术自然科学总论更多>>
- M-GEP:基于多层染色体基因表达式编程的遗传进化算法被引量:43
- 2005年
- 该文提出了一种新的基于多层染色体基因表达式编程的遗传进化算法MGEP,新算法引入了多层染色体的概念,利用染色体构建的层次调用模型对个体进行表达,在解决实际函数发现、电路进化等实际问题中取得了良好效果.该文主要贡献包括:(1)提出了基于多染色体的基因表达式编程算法(MGEP);(2)建立了不同染色体的层次调用模型及存储结构;(3)提出并实现了基于染色体的重组算子和基因随机重组算子.对多基因GEP和单基因GEP的对比实验结果表明,平均进化辈数仅为后者的29%~81%.
- 彭京唐常杰李川胡建军
- 关键词:遗传进化基因表达式编程
- 基于基因表达式编程的知识发现的三项新技术——转基因,重叠基因表达和回溯进化被引量:21
- 2005年
- 介绍了在研发基于基因表达式编程(GEP)的知识发现的三项新技术,包括:(a)转基因技术,通过注入转基因,引导进化方向,控制知识发现过程;(b)重叠基因表达,借鉴生物基因片段重叠表达,引入重叠基因概念,节约了表达空间;(c)回溯进化,借鉴生物“返祖现象”,引入回溯检查点概念和可回溯GEP算法、设计了等比递增检查点序列和加速递增检查点序列,约束回溯过程。实验表明,三项技术在一定的场合下分别提高了知识发现的性能1至2个数量级。
- 唐常杰彭京张欢钟义啸
- 关键词:知识发现基因表达式编程转基因
- 基于基因表达式编程的递归函数挖掘被引量:3
- 2007年
- 传统基因表达式编程(GEP)无法发现递归函数。为此,分析了传统GEP算法在函数挖掘方面不足的深层次原因,提出了基于递归染色体的基因表达式编程算法GEP-RecurMiner和动态进化策略(DSCMS)。理论分析和实验证明了GEP-RecurMiner极大地扩充了传统GEP函数挖掘方法的求解空间,能精确地发现传统GEP无法发现的递归函数,同时实验表明动态进化策略有效地提高了GEP-RecurMiner函数挖掘算法的效率,挖掘成功率提高20%,平均进化代数下降10%。
- 吴江唐常杰姜玥叶尚玉段磊李太勇
- 关键词:基因表达式编程递归函数函数挖掘
- 基于前后文词形特征的生物医学文献句子边界识别被引量:1
- 2006年
- 针对生物医学文献的特点及信息抽取的特殊要求,提出了基于前后文词形特征和有教师学习的句子边界识别算法.与针对一般英语书面语设计的句子边界识别算法不同,本文提出的算法不使用特殊的辅助词表和语法层面的特征信息,只使用前后文单词的词形信息作为句子边界识别和消歧的依据.利用这些特征设计了最大信息熵识别器和支持向量机识别器,并在Medline摘要上进行了实验,达到了超过99%的正确率.实验结果表明,最大信息熵法和支持向量机法在句子边界消歧问题上具有相近的性能,同时还表明,对生物医学文献句子边界识别,只使用词法层面的特征,不使用辅助词表和词性等语法层面的信息,仍可达到其它算法在一般英语书面语上利用辅助词表和词性信息所达到的性能.
- 于中华张容唐常杰左劼张天庆
- 关键词:自然语言处理句子边界识别
- 一种基于频度路径树的XML缓存模型被引量:1
- 2006年
- 提出并实现了一种新的称为频度路径树的XML缓存模型,FTree Cache.新模型根据频繁查询路径模式对源XML文件进行投影,生成相应的缓存文件.对用户提交的查询进行判断,提取相应的缓存文件来响应.通过对XML的投影缓存,可以有效降低查询的响应时间和大大减少内存的占用量.实验表明了方法的有效性,对内存的占用大约是原来的20%,响应时间约为原来的43%.
- 金朋纬唐常杰胡明耀孙茜陈宇
- 提高基因表达式编程发现知识效率的回溯策略被引量:13
- 2006年
- 传统基因表达式编程(GEP)编码简单,适应性强,但可能陷入局部最优的“早熟”陷阱.因此,作者借鉴生物界的“返祖现象”,提出了基于回溯的基因表达式编程方法.主要工作包括:(1)在传统GEP算法中引入回溯机制,提出基于回溯策略的GEP算法GEPBS(GEP withBacktracking Strategy);(2)提出回溯检查点概念,设计等比递增检查点序列和加速递增检查点序列,约束回溯过程;(3)扩充基于回溯的GEP算法,设计了退化因子(RF),提出了按比例回溯策略GEPPBS(GEP with Proportional Backtracking Strategy);(4)通过两个实验验证了新算法的有效性,在相同条件下较传统算法的适应度最大提高了49.2%,成功率最高提高了4倍.
- 钟义啸唐常杰陈宇段磊魏大刚
- 一种松耦合的生物医学命名实体识别算法被引量:3
- 2007年
- 生物医学命名实体识别(Bio-NER)是生物医学文献挖掘利用的基础工作。针对目前Bio-NER存在的困难和问题,提出了松耦合的Bio-NER算法LCA,该算法利用启发规则过滤器、词性模板匹配及改良的隐马尔科夫模型(HMM)识别生物医学命名实体。在GENIA corpus3.02语料库上进行的实验表明,LCA可以达到80%的准确率和89%的召回率,优于相关工作中的结果。
- 胡俊锋陈蓉陈源陈浩于中华
- 关键词:隐马尔科夫模型
- MAuct:一个基于Web服务技术的移动拍卖系统被引量:1
- 2006年
- Web服务是移动电子商务的有效解决方案.作者开发实现了一个基于Web服务技术的移动拍卖系统MAuct.主要工作包括:(1)分析了系统实现过程中的特殊困难和采用的特殊技术;(2)将MAuct系统成功地移植到无线移动设备中;(3)实验证明,作者提出的对移动拍卖系统应用程序进行优化的新方法可使系统整体性能提高约30%.
- 乔少杰唐常杰彭京彭舰朱明放曾涛韩楠
- 关键词:WEB服务
- 基于动态适应度的基因表达式编程挖掘反函数被引量:4
- 2007年
- 为提高基因表达式编程(GEP)发现知识效率,提出并实现了基因表达式编程的动态适应度函数。将逐步权重自适应(SAW)应用于基因表达式编程中适应度函数的动态调整;将线性N维向量函数引入作为适应度函数的组件,用于提高求适应度效率;通过挖掘反函数和方程求解的实验,表明新方法比传统基因表达式编程所求得的反函数表达式的精确度有较大的优势,性能提高约8%。
- 朱军唐常杰魏大刚段磊左劼
- 关键词:数据挖掘基因表达式编程适应度
- 数据库汉语自然语言查询接口 IDCQ设计与实现
- 信息技术的发展和普及,各种便携式信息终端(手机,PDA等)的大量涌现和使用,用户需求和市场呼唤使得数据库自然语言查询接口作为人机接口的重要研究领域得到重视.本文就数据库汉语自然语言查询接口IDCQ的设计与实现进行了综述.
- 胡明耀唐常杰金朋伟
- 关键词:数据库查询接口