安徽省高校省级自然科学研究项目(KJ2011A048) 作品数:13 被引量:31 H指数:4 相关作者: 杨思春 高超 陈家骏 戴新宇 彭月娥 更多>> 相关机构: 安徽工业大学 南京大学 皖西学院 更多>> 发文基金: 安徽省高校省级自然科学研究项目 国家自然科学基金 计算机软件新技术国家重点实验室开放基金 更多>> 相关领域: 自动化与计算机技术 更多>>
融合基本特征和词袋绑定特征的问句特征模型 被引量:8 2012年 针对当前问句分类研究中特征提取的处理开销较大,提出一种融合基本特征和词袋绑定特征的问句特征模型。在分别提取问句中的词袋、词性、词义等基本特征及其对应的词袋绑定特征的基础上,通过将基本特征与词袋绑定特征进行融合,以获取更加高效的问句特征集合。在哈尔滨工业大学中文问句集上的实验结果表明,这种新的问句特征模型不仅具有实现简单、处理开销小的优点,而且有效弥补了单纯基本特征或词袋绑定特征在句法语义表达方面的不足,进一步提高了问句分类的准确率。 杨思春 高超 秦锋 戴新宇 陈家骏关键词:问答系统 问句分类 Tri-training算法中分类器组合的改进 被引量:4 2014年 Tri-training算法是半监督协同算法里的经典算法,该文针对算法中分类器的使用做了一些改进,由原先单一的分类器换成两个不同分类器的组合。使用SVM分类器和最大熵分类器的不同组合作为Tri-training算法里的三个分类器构成分类器模型,然后分别对稀疏型数据、密集型数据与原始Tri-training算法进行实验比较,从而验证改进的有效性。 李心磊 杨思春 彭月娥关键词:半监督学习 最大熵 面向中文问答社区的问题去重技术研究 2014年 基于《知网》语义知识资源,提出一种基于问句相似度计算的问答社区问题去重方法。通过计算已有问题集合中问题间的语义相似度,将其中重复度较高的问题进行筛选并去除,从而提高用户获取所需信息的效率,改善用户体验。在"爱问知识人"的真实问题集上的实验结果表明:该方法获得了较好的去重效果。 彭月娥 杨思春 李心磊 丁菲菲 向恒月关键词:相似度 相似度计算 基于平均信息熵的中文问句关键词提取 被引量:1 2014年 关键词提取是问答系统中问句分析的重要步骤,它有助于问答系统快速、准确地返回答案。针对现有文献中基于TFIDF等方法在关键词提取准确率及效率方面的不足,提出一种基于平均信息熵的中文问句关键词提取方法。通过加入专业领域词汇,并在停用词过滤的基础上计算问句中每个词的平均信息熵,以词的信息熵值直接体现该词在问句中的重要性;同时在关键词提取过程中,通过设定不同提取比例,并在不同提取比例下观察评价标准值,以最佳提取比例获取更为合适的关键词。实验结果表明,与传统的TFIDF等其他方法相比,该方法的查准率、查全率以及F1测度值都得到显著提高。 丁菲菲 杨思春 刘仁金关键词:关键词提取 TFIDF 基于差异性和重要性的问句特征组合 被引量:7 2014年 在问答系统问句分类研究中,对问句特征进行组合有助于构造高效的问句分类器.针对当前问句分类中的特征组合问题,提出一种基于差异性和重要性的特征组合(Diversity and Importance based Feature Combination,DIFC)方法.通过计算待组合特征与当前特征组合的错分差异度和正分差异度,以及待组合特征本身的重要度,从候选特征集中动态获取优化的特征组合.在哈工大中文问句集上对词袋绑定特征进行组合的实验结果表明,与其他特征组合方法相比,DIFC方法灵活高效,准确率更高. 杨思春 高超 戴新宇 尹存燕 陈家骏关键词:问句分类 基于冲突对象集的决策系统分配约简算法 2015年 目前对不一致不完备决策系统的粗糙集属性分配约简研究较少,研究不一致不完备决策系统的分配约简更具有实际应用价值。基于此,提出一种基于冲突对象集的不一致不完备决策系统分配约简方法。通过定义冲突对象集的概念,给出计算核属性集和属性重要性的方法;在此基础上,给出求解不一致不完备决策系统分配约简的算法。理论分析和实例结果表明,该方法显著降低了分配约简求解的空间复杂度,更加适合大规模数据库。 向恒月 杨思春 丁菲菲 王雷关键词:决策系统 分配约简 基于冲突域的测试成本独立决策系统属性约简 被引量:1 2015年 针对决策系统存在冲突对象的情况,提出一个基于冲突域的λ-权重约简的启发式算法来降低属性约简的测试成本。首先对决策系统进行简化,将不一致对象的决策属性值异类化,进而删除重复对象,然后对简化后的决策系统根据冲突强弱计算出核属性和属性重要性,在此基础上,利用启发式函数来求解测试成本较低的属性约简,其中启发式函数由属性重要性和权重共同组成,权重由测试成本和非正参数λ决定。实验结果表明该方法在保证降低测试成本的同时加快处理效率。 向恒月 杨思春 王小林 王雷关键词:决策系统 冲突域 属性约简 双序渐进式概念格合并算法 被引量:2 2013年 针对传统的概念格合并算法仅为单向的纵向或横向合并,提出一种基于概念内涵、外延升降序的双序渐进式合并算法。按照概念的内涵或外延的升序和降序,从两个方向(由上到下和由下到上)同时进行子概念格的纵向或横向合并。算法分析和示例结果表明,该算法不仅在结构上较好地保留了原有信息,而且在效率上也获得了显著的提高。 姚佳岷 杨思春 李心磊 彭月娥关键词:概念格 基于LRP的自适应运动目标检测算法 2013年 传统的运动目标检测算法主要基于像素值的统计模型,对于光照突变和噪声极为敏感.为此,提出了一种基于局部比率模式(LRP)的自适应运动目标检测算法.使用LRP描述视频图像序列中像素特征,通过自适应核密度估计对像素特征进行建模,提取出运动目标.实验结果表明,该算法适应光照变化,有良好的检测性能. 黄存东 刘仁金 杨思春关键词:目标检测 光照变化 带宽估计 基于时空LBP特征的自适应运动目标提取算法 被引量:2 2013年 传统的运动目标检测算法主要基于像素值的统计模型,对于光照突变和噪声极为敏感。为此,提出了一种基于时空LBP建模的自适应运动目标检测算法。通过使用结合了时序信息的LBP描述视频图像序列中像素特征,通过经典的高斯混合模型对像素特征进行建模,提取出运动目标。实验结果表明,该算法能够适应光照变化,具有良好的检测性能。 黄存东 杨思春 刘仁金关键词:光照变化 高斯混合模型