江苏省博士后科研资助计划项目(0901014B)
- 作品数:16 被引量:136H指数:6
- 相关作者:曹建军刁兴春陈爽李凯齐谭明超更多>>
- 相关机构:总参第六十三研究所解放军理工大学中国人民解放军更多>>
- 发文基金:江苏省博士后科研资助计划项目中国博士后科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信兵器科学与技术军事更多>>
- 一种融合多种编辑距离的字符串相似度计算方法被引量:44
- 2010年
- 针对中西文混合字符串,采用了将汉字作为西文字符的等价单位计算编辑距离的方法,并从输入法的角度提出了采用拼音编码和五笔编码计算编辑距离的方法,最后给出了融合三种编辑距离计算字符串相似度的算法。仿真结果表明,该方法在提高相似重复记录检测的查全率的同时,也能获得较高的查准率。
- 刁兴春谭明超曹建军
- 关键词:数据清洗相似重复记录字符串匹配字符串相似度
- 数据清洗及其一般性系统框架被引量:31
- 2012年
- 数据清洗是提高数据质量的重要手段之一。从数据产品与传统的有形产品、软件产品相类比的视角,研究数据清洗及其系统框架。数据清洗是数据质量研究的起点,从数据质量发展的角度明确数据清洗的地位和作用,并将其类比为其他产品形式的故障诊断与维修。对数据清洗做了10点说明,进一步澄清了其基本内涵;将数据清洗与数据集成进行了比较分析,指出二者是同等的数据质量概念。提出了数据清洗的一般性系统框架,其由准备、检测、定位、修正、验证5部分组成,允许在多处停止以完成不同的数据清洗任务,是一个柔性的、可扩展的、交互性好的、松耦合的框架。
- 曹建军刁兴春陈爽邵衍振
- 关键词:数据质量数据清洗相似重复记录
- 信息系统模拟数据生成研究综述
- 2012年
- 信息系统模拟数据生成是提供信息系统试验、试用和演练中所需数据的重要途径。通过与软件测试数据生成、样本数据扩充、虚拟现实相关研究领域比较,讨论了信息系统模拟数据生成的研究定位;归纳了信息系统模拟数据生成的研究内容;提出了具有数据层、中间层和生成层三层结构的典型信息系统模拟数据生成系统结构框架;最后对信息系统模拟数据生成的研究方向进行了展望。
- 曹建军刁兴春张慧谭明超邓波
- 关键词:信息系统软件测试数据样本数据虚拟现实
- 基于进化强度的蚁群算法过程性能评价被引量:3
- 2013年
- 为了评价蚁群算法的过程性能,提出了一种基于进化强度的蚁群算法性能评价方法。以子集问题为例,引入谷元距离度量解的差异程度,并定义了迭代的相对进化幅度。将一次迭代的相对进化幅度与解的相对差异程度之比定义为进化强度,并据此将迭代区分为进化代与停滞代。通过多次运行算法并计算进化强度的平均值得到蚁群算法的进化强度趋势图,对比进化强度的趋势图进行蚁群算法过程性能评价。以4种求解子集的典型蚁群算法为例,通过标准测试实例验证了评价方法的有效性与合理性。
- 曹建军刁兴春李凯齐邵衍振
- 关键词:蚁群算法趋势图
- 基于位运算的不完整记录分类检测方法被引量:3
- 2010年
- 缺失数据的处理是数据清洗的重要内容。提出了一种基于位运算的不完整记录分类检测方法。对不完整记录进行了界定,将记录分为完整、不完整合格、不完整修正和不完整删除四类,并给出了其层次分类流程。定义了记录的二进制表示,根据不完整记录样本生成各类记录的标准二进制表示集,按在样本中出现的次数确定标准二进制表示的优先级,并对不完整删除标准二进制表示集中的二制表示进行了表达式合并。通过位运算实现记录的分类检测,并通过处理未检出二进制表示逐步完善二进制表示集。根据不完整记录二进制表示确定记录的进一步处理。应用实例验证了方法的有效性。
- 曹建军刁兴春吴建明袁震彭琮
- 关键词:数据质量数据清洗缺失数据
- 蚁群优化算法在求解随机组合优化问题中的应用综述被引量:1
- 2010年
- 不确定条件下的优化问题更贴近真实世界环境,因而日益受到广泛关注。综述了蚁群优化在求解一组不确定条件下的组合优化问题,即随机组合优化问题方面的应用。首先介绍了不确定条件下组合优化问题的概念分类模型,给出了随机组合优化问题的一般定义;然后指出了其与求解传统确定性组合优化问题的不同之处,即目标函数的计算存在不确定性,并详细论述了目前解决方法的进展;最后分析了该领域值得重点关注的几个研究方向,并对其未来发展进行了展望。
- 李凯齐刁兴春曹建军
- 关键词:蚁群优化不确定性组合优化
- 高炮与防空导弹射击时机互补性研究被引量:2
- 2014年
- 防空火力分配包含武器目标匹配和武器单元的射击时机分配两部分,其目的是明确由哪些火力装置对哪些目标在何时进行射击。在对防空导弹和高炮弹道特性及射击特点之间的差异进行分析的基础上,引入实例,分别对导弹有控弹道模型以及高炮弹头的飞行时间曲线进行了计算;根据它们的飞行时间曲线,分析了二者对同一航路的射击时机,定量论证了防空导弹和高炮的互补性,为弹炮结合防空系统的设计优化提供依据。
- 曹建军王艳霞邵衍振高科
- 关键词:火力分配
- 基于改进蚁群算法的高精度文本特征选择方法被引量:7
- 2010年
- 为了反映特征子集对分类结果的整体影响,去除噪声特征项,提出了一种基于改进蚁群算法的高精度文本特征选择方法。建立了特征选择数学模型,实现了特征选择过程与分类器分类过程间的直接关联;设计了特征优选与特征精选相结合的模型求解方案,降低了模型求解过程中的计算复杂度;提出了基于等效路径增强和局部搜索更新相结合的改进蚁群算法,提高了解的质量和稳定性。实验结果表明,与现有文本特征选择方法相比,该方法能大幅提升分类精度。
- 李凯齐刁兴春曹建军李峰
- 关键词:特征子集蚁群优化文本分类
- 领域无关数据清洗研究综述被引量:28
- 2010年
- 对领域无关数据清洗的研究进行了综述。首先阐明了全面数据质量管理、数据集成和数据清洗之间的关系,着重说明了领域无关数据清洗的特点。将领域无关数据清洗方法分为基于特征相似度的方法、基于上下文的方法和基于关系的方法分别介绍。最后对领域无关数据清洗的研究方向进行了展望。
- 曹建军刁兴春汪挺王芳潇
- 关键词:数据质量数据清洗数据集成
- 基于蚁群特征选择的相似重复记录分类检测被引量:8
- 2010年
- 为实现相似重复记录的检测,提出一种基于蚁群算法特征选择的分类检测方法。将相似重复记录检测看成二分类问题,定义了字符串型、枚举型和日期型3种典型属性类型的相似特征和归一化算法,以两记录的相似特征向量作为分类器的输入进行检测;建立了以召回率、准确率和特征规模综合最优的特征选择多目标优化模型,并根据问题特点将多目标模型转化为单目标模型,应用蚁群算法设计了模型求解算法。最后,用欧氏距离分类法和支持向量机2种分类器验证了该方法的有效性。
- 曹建军刁兴春杜鹢王芳潇张潇毅
- 关键词:信息处理技术数据清洗相似重复记录蚁群算法支持向量机