浙江省重大科技专项基金(2006C11208)
- 作品数:2 被引量:1H指数:1
- 相关作者:唐文彬钱剑飞陈华陈纯刘康苗更多>>
- 相关机构:中国计量学院浙江大学上海理工大学更多>>
- 发文基金:浙江省重大科技专项基金国家自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 利用信息检索和概率有限自动机的程序理解
- 2008年
- 为提高基于信息检索的程序理解方法的准确性,提出了一种结合信息检索和概率状态机的两阶段程序理解方法.在该方法中使用概率有限自动机(probabilistic finite-state automata,PFA)解决了信息检索结果在程序理解中的不确定性,同时采用信息检索构建了多个简单的PFA,而不是单个复杂的PFA,提高了PFA分析的伸缩性.训练阶段先采用隐式语义分析对源代码进行聚类,然后在聚类结果上生成PFA.在识别阶段以词法处理后的程序作为检索项在程序模板库中进行信息检索,取检索结果中的最相关的n项作为候选模板,由候选模板对应得到相应的PFA,通过分析找到最大概率的PFA,完成对源码内容的语义标注.
- 陈华王灿陈纯唐文彬钱剑飞
- 关键词:概率有限自动机信息检索软件工程
- 基于后缀树的程序理解Plan自动提取被引量:1
- 2008年
- 为辅助维护用于程序理解的代码片段模版(Plan)库,提出了基于后缀树的Plan自动提取方法.通过词法/语法分析将源代码转换成Token串,然后对Token串生成后缀树,遍历后缀树得到候选代码Plan集,过滤后生成更小、更准确的Plan集.采用动态模式匹配合并合适的Plan和给Plan命名,最后生成可用于程序理解的Plan.由于后缀树的线性增长特性,该方法可以应用于大规模软件的程序理解.将方法应用于多个不同规模的软件,测试结果表明,该方法可以从源码中提取有效的Plan.
- 陈华陈纯唐文彬钱剑飞刘康苗
- 关键词:后缀树软件维护软件工程