您的位置: 专家智库 > >

重庆市自然科学基金(2007BB2372)

作品数:18 被引量:91H指数:7
相关作者:熊忠阳张玉芳刘君王银辉邓剑勋更多>>
相关机构:重庆大学重庆广播电视大学上海宝信软件股份有限公司西南研发中心更多>>
发文基金:重庆市自然科学基金中国博士后科学基金中央高校基本科研业务费专项资金更多>>
相关领域:自动化与计算机技术经济管理更多>>

文献类型

  • 18篇期刊文章
  • 1篇会议论文

领域

  • 19篇自动化与计算...
  • 1篇经济管理

主题

  • 4篇支持向量
  • 4篇支持向量机
  • 4篇图像
  • 4篇向量
  • 4篇向量机
  • 3篇多示例学习
  • 3篇文本分类
  • 3篇本体
  • 2篇语义网
  • 2篇降维
  • 1篇蛋白
  • 1篇蛋白质
  • 1篇蛋白质二级结...
  • 1篇动态复制策略
  • 1篇多类分类
  • 1篇多类分类方法
  • 1篇信息抽取
  • 1篇引擎
  • 1篇引擎模型
  • 1篇语义

机构

  • 19篇重庆大学
  • 4篇重庆广播电视...
  • 1篇重庆市气象局
  • 1篇上海宝信软件...

作者

  • 15篇熊忠阳
  • 10篇张玉芳
  • 5篇王银辉
  • 5篇刘君
  • 3篇曾代敏
  • 3篇邓剑勋
  • 2篇冯永
  • 2篇钟将
  • 2篇叶春晓
  • 1篇李黎
  • 1篇耿晓斐
  • 1篇李志国
  • 1篇陈玲
  • 1篇吴林敏
  • 1篇莫凌琳
  • 1篇吴中福
  • 1篇黄涛
  • 1篇李华
  • 1篇张宇
  • 1篇陈小莉

传媒

  • 6篇计算机应用研...
  • 4篇计算机工程与...
  • 2篇计算机应用
  • 1篇模式识别与人...
  • 1篇计算机系统应...
  • 1篇四川大学学报...
  • 1篇计算机工程与...
  • 1篇重庆大学学报...
  • 1篇计算机科学

年份

  • 2篇2013
  • 1篇2012
  • 4篇2011
  • 6篇2010
  • 4篇2009
  • 2篇2008
18 条 记 录,以下是 1-10
排序方式:
基于条件随机场的科研论文信息分层抽取被引量:3
2009年
在利用条件随机场进行信息抽取时,单纯基于词或基于块的方法,不能充分利用上下文信息在恰当粒度上进行切分和抽取,因此提出了一种基于条件随机场的科研论文信息分层抽取方法,利用分隔符、换行符、行首字符等格式信息,结合条件随机场的特征函数,将文本切分成文本行、块或单个的词等恰当的层次,再采用L-BFGS算法学习模型参数并进行特定文本域的抽取。实验结果表明,该方法的抽取性能优于基于词或块的条件随机场模型的信息抽取方法。
张玉芳莫凌琳熊忠阳耿晓斐
关键词:信息抽取条件随机场
针对非均匀数据集的DBSCAN过滤式改进算法被引量:11
2009年
针对在数据分布不均匀时,由于DBSCAN使用统一的全局变量,使得聚类的效果差,提出了一种基于过滤的DBSCAN算法。该算法的思想是:在调用传统的DBSCAN算法前,先对数据集进行预处理,针对所有点的k-dist数据进行一维聚类,自动计算出不同的Eps;然后再根据每个Eps分别调用传统的DBSCAN算法,从而找出非均匀数据集的各种聚类。实验结果表明,改进算法对密度不均匀的数据能够有效聚类。
熊忠阳吴林敏张玉芳
关键词:聚类DBSCAN数据挖掘
结合编辑距离和Google距离的语义标注方法被引量:10
2010年
提出了一种在领域本体指导下对网页进行语义标注的方法。该方法利用编辑距离和Google距离从词语的语法和语义两方面综合度量词汇与本体概念之间的语义相关度,从而在网页与本体之间建立映射关系。此外,对网页进行语义标注后,利用标注结果对本体进行有效扩充,使本体更趋于领域化。实验结果表明该方法是行之有效的。
张玉芳艾东梅黄涛熊忠阳
关键词:语义网本体语义标注
基于密度的kNN分类器训练样本裁剪方法的改进被引量:13
2010年
在文本分类中,训练集的分布状态会直接影响k-近邻(kNN)分类器的效率和准确率。通过分析基于密度的kNN文本分类器训练样本的裁剪方法,发现它存在两大不足:一是裁剪之后的均匀状态只是以ε为半径的球形区域意义上的均匀状态,而非最理想的均匀状态即两两样本之间的距离相等;二是未对低密度区域的样本做任何处理,裁剪之后仍存在大量不均匀的区域。针对这两处不足,提出了以下两点改进:一是优化了裁剪策略,使裁剪之后的训练集更趋于理想的均匀状态;二是实现了对低密度区域样本的补充。通过实验对比,改进后的方法在稳定性和准确率方面都有明显提高。
熊忠阳杨营辉张玉芳
关键词:文本分类K-近邻
基于上下文的领域本体概念和关系的提取被引量:14
2010年
目前本体学习的研究重点在于概念及关系的提取,概念提取领域一致度与领域相关度相结合的方法取得了比较好的效果,而关系提取则主要采用基于关联规则的方法。这种本体概念、关系学习方法由于只考虑词频,提取结果准确性欠缺。针对这种缺陷,在统计的基础上考虑了语义因素,利用词汇上下文计算概念的语义相似度并将其应用到概念与关系提取中。实验结果表明,词汇上下文与传统统计相结合的方法能够有效改进概念和关系提取的准确度。
张玉芳杨芬熊忠阳陈小莉
关键词:本体学习上下文语义相似度
基于AFSVM-MIL算法的图像标注
2011年
通常情况下关键字只标注在图像上,而多示例(MIL)检索的需要将关键字下沉到区域。针对这个问题,在模糊支持向量机算法(FSVM)的基础上提出了一种改进的自适应模糊支持向量机多示例学习算法(AFS-VM-MIL算法),在多示例学习的框架下把区域级的图像标注变成了一种有监督的学习。该方法利用AFSVM-MIL对训练集进行分类,结合包之间的相似度进行广义集合运算,可以有效地将关键字进行下沉,从而达到减少人工标注工作量的目的。实验结果表明,该方法有效且性能优于其他方法。
邓剑勋熊忠阳曾代敏
关键词:图像标注多示例学习
图像多分类主动学习方法被引量:2
2010年
以决策速度快的决策导向非循环图支持向量机(Decision DirectedAcyclic Graph Support Vector Machine)为基准分类器,结合主动学习的思想,提出了一种图像多分类主动学习方法。这种方法是一种半自动的图像语义分类方法,可以将图像分成多个语义类别。该方法在最近边界主动选择方法的基础上,提出一种基于质疑度的主动选择策略。这种策略将SVMactive中提出的最近邻SVM分类面选择的反馈样例策略延伸到多分类中,通过区别对待奇异样例和容易错分样例,减少了噪声数据对分类器的干扰,提高了分类的精度。
刘君熊忠阳王银辉
关键词:支持向量机
基于本体的个性化搜索引擎模型
对于当前基于关键词检索的搜索引擎,其准确率较低,返回数据量太大,使得用户难以选取。对此,提出了一种基于本体的个性化搜索引擎模型,通过对文档中概念的提取,确定其所属领域本体,以此归类,并建立文档-概念匹配系数作为索引。搜索...
张玉芳陈运启熊忠阳
关键词:本体搜索引擎个性化
文献传递
基于扩展语义网的知识资源组织技术研究被引量:3
2008年
采用知识点的方式组织知识资源,有利于知识的获取、分享、分配和存取。但是传统的树型结构对知识的整体关系描述能力不足,不利于分布式环境下对知识资源的查找和定位。语义网是一种可以详细描述本体间复杂关系并具有天然分布式特性的技术。然而一般的语义网本身不是按照知识点的方式进行组建。本文对语义网进行扩展,使其适用于描述基于知识点组织的知识资源。通过应用案例,按照知识点进行扩展的语义网可以有效地描述知识资源间的相互关系,便于知识的理解和利用,并且对知识的查找和定位也变得更加方便。
冯永李华吴中福钟将叶春晓
关键词:知识资源知识点分布式环境
基于EMD的融合特征快速多示例人脸识别算法被引量:8
2012年
在基于五官模版技术的人脸识别中,因光照、角度及缺少整体性考虑等情况,易产生异常示例,影响了算法精度。而适合多示例检索的EMD距离寻优路径较长,导致在人脸识别中应用受限。为此提出一种基于EMD距离的快速融合特征多示例人脸识别算法(IIFEMD-MIL)。针对异常点的问题,通过引入结合整体特征的融合多示例技术以及距离阀值,从而减少异常示例的产生并对超过阈值的示例予以平滑处理;针对寻优路径长的问题,将人脸五官之三结合整体示例为模版构建四示例的一一匹配,并进一步提出了融合快速EMD-MIL框架,缩短了寻优遍历路径。在ORL和MIT图像集上进行的比对实验表明,该算法执行效率和分类准确性优于其他同类算法。
邓剑勋熊忠阳曾代敏
关键词:人脸识别
共2页<12>
聚类工具0