郁抒思
- 作品数:3 被引量:36H指数:2
- 供职机构:复旦大学计算机科学技术学院上海市智能信息处理重点实验室更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于LDA主题模型的软件缺陷分派方法被引量:11
- 2011年
- 传统的基于向量空间模型的软件缺陷分派方法,由于存在特征空间维度高、数据稀疏且包含噪音等问题,分派准确率较低。为此,提出一种基于隐含狄利克雷分配(LDA)主题模型的软件缺陷分派方法,将缺陷报告从原始的高维文本单词空间映射到低维语义主题空间,在新的低维主题空间上进行分派。实验结果表明,在使用SVM和KNN分类器时,该方法的分派准确率较高。
- 黄小亮郁抒思关佶红
- 关键词:文本分类向量空间模型
- 软件工程数据挖掘若干问题研究
- 软件工程数据是软件工程整个过程中所产生的各种数据,包括软件的源代码、文档、缺陷报告等。在绝大多数情况下,软件工程数据是开发者获取信息的唯一来源。随着计算机软件规模的不断扩大,手工获取开发和维护软件所需的信息越来越困难。数...
- 郁抒思
- 关键词:软件工程数据挖掘文本分类
- 文献传递
- 软件工程数据挖掘研究进展被引量:24
- 2012年
- 随着计算机软件的规模不断扩大,手工获取、开发和维护软件所需的信息越来越困难。数据挖掘技术可从软件工程数据中自动发现所需信息,加快软件开发进程。对软件工程数据挖掘的研究进展进行了综述。概述了软件工程数据挖掘的基本概念与技术挑战;详细评述了在软件工程各个阶段,数据挖掘技术所能发现的信息/知识,以及获取这些信息/知识的意义、难点、步骤和方法,重点介绍了数据预处理和数据表示方法;对软件工程数据挖掘研究的发展趋势进行了展望。
- 郁抒思周水庚关佶红
- 关键词:软件工程数据挖掘数据表示数据预处理