您的位置: 专家智库 > >

国家自然科学基金(70803048)

作品数:10 被引量:75H指数:6
相关作者:化柏林郑彦宁刘一宁丁君军邓擘更多>>
相关机构:中国科学技术信息研究所北京理工大学更多>>
发文基金:国家自然科学基金更多>>
相关领域:文化科学自动化与计算机技术更多>>

文献类型

  • 10篇中文期刊文章

领域

  • 6篇文化科学
  • 4篇自动化与计算...

主题

  • 10篇抽取
  • 7篇知识抽取
  • 5篇信息抽取
  • 4篇学术定义
  • 3篇学术
  • 2篇语言处理
  • 2篇属性抽取
  • 2篇自然语言
  • 2篇自然语言处理
  • 2篇相似度
  • 1篇学术概念
  • 1篇页面
  • 1篇页面结构
  • 1篇知识发现
  • 1篇知识工程
  • 1篇知识获取
  • 1篇实验室
  • 1篇情报
  • 1篇情报学
  • 1篇相关概念辨析

机构

  • 10篇中国科学技术...
  • 1篇北京理工大学

作者

  • 7篇化柏林
  • 7篇郑彦宁
  • 3篇刘一宁
  • 2篇邓擘
  • 2篇丁君军
  • 1篇傅继彬
  • 1篇张新民

传媒

  • 4篇情报理论与实...
  • 2篇情报科学
  • 1篇现代图书情报...
  • 1篇情报探索
  • 1篇计算机与数字...
  • 1篇计算机科学

年份

  • 6篇2011
  • 2篇2010
  • 2篇2009
10 条 记 录,以下是 1-10
排序方式:
学术定义抽取研究综述被引量:2
2011年
从学术定义抽取过程中需要涉及到的抽取语种、抽取文本类型、抽取目的、抽取方法、抽取结果评价等5个方面,评述定义抽取的研究现状,指出存在的不足并提出改进意见。
刘一宁
关键词:学术定义自然语言处理知识抽取
从知识抽取相关概念辨析看知识抽取的特点和发展趋势被引量:16
2010年
通过知识抽取与知识获取、信息抽取、知识发现等概念之间的概念辨析确定知识抽取的研究范畴。知识抽取以学术文献为抽取对象,以总结学术文献的特征规律为特色,构建以知识元为存储单位的知识库,必将会给图书情报学的发展带来新的机遇与活力。
化柏林张新民
关键词:知识抽取知识发现信息抽取知识获取知识工程
使用种子抽取实体关系模式被引量:2
2009年
识别句子中实体关系是信息抽取的重要技术。研究了汉语实体关系模式的自动获取技术。在基于种子方法的思想上,结合汉语在语义表达上的多样性特征,使用机器学习方法来自动发现新模式。实验表明,该方法在人工干预很少的情况下,能较为准确的发现新模式,且可以在不同抽取领域内快速移植。因此该方法对于汉语实体关系识别具有一定价值。
邓擘郑彦宁
关键词:信息抽取相似度
汉语实体关系模式的自动获取研究被引量:3
2010年
中文信息抽取系统中实体关系模式的自动获取对于整个系统具有重要意义。在bootstrap方法的基础上,根据汉语在形式表达上的多样性特点,使用统计学习技术来自动获取新模式。实验表明,该方法在人工干预很少的情况下,能够快速查找新模式,且新模式的获取不受应用领域限制。因此该方法对于提高信息抽取系统的性能是有效的。
邓擘郑彦宁傅继彬
关键词:信息抽取相似度
基于规则的高校实验室Web信息抽取的系统设计与实现被引量:2
2009年
在充分调研高校实验室信息的基础上,针对总结的实验室信息的规律与特征,制定适合信息抽取的实验室信息描述规则,利用规则进行实验室信息的抽取。设计一个针对高校实验室信息的信息抽取系统labIE,并详细论述labIE的体系结构与技术架构,着重论述网页表格判断规则的设计与特征谓词的构造方法。
化柏林郭江
关键词:信息抽取WEB页面结构
国内外属性抽取研究综述被引量:9
2011年
论述了属性抽取,对国内外属性抽取的相关研究进行了分析,并且对属性抽取的研究热点、属性抽取的对象、属性抽取的方法和属性抽取的结果评测形式等进行了展开论述,力求反映国内外属性抽取研究的现状,并为今后的属性抽取相关研究提供参考。
丁君军郑彦宁化柏林
关键词:属性抽取信息抽取知识抽取
句子级知识抽取在情报学中的应用分析被引量:16
2011年
通过比较句子级知识抽取与词语级知识抽取的差异性,分析句子级知识抽取在情报学中的意义,表现在四类典型应用系统:学术抄袭检测系统、参考文献自动标注系统、文献自动综述系统、知识库构建系统。分析了知识抽取的难点与关键技术,针对难点与关键技术提出了知识抽取的3个转向:抽取对象转向以学术文献为主;抽取技术转向以内容结构分析为主;抽取目标转向以构建知识元数据库为主。
郑彦宁化柏林
关键词:知识抽取情报学
针对学术定义的抽取规则构建方法研究被引量:9
2011年
学术定义是学术研究中一种基础性的知识。科技文献中蕴含着丰富的定义,对定义进行自动抽取是知识抽取的一种应用。这些定义具有一定的特征与规律,利用这些特征与规律形成规则对定义进行抽取是常见的方法。定义抽取中最重要的工作是规则构建。文章通过对定义语句的结构方式和分类进行研究,提出了一种基于多重规则的学术定义抽取规则构建方案。该方案通过构建模式规则、句法规则以及加权词规则,构建学术定义抽取所需要的多重规则。
化柏林刘一宁郑彦宁
关键词:学术定义知识抽取
基于规则的学术概念属性抽取被引量:25
2011年
学术文献作为科研成果的结晶,蕴含着丰富的知识,属性抽取作为知识抽取的一种应用,是把不同学术文献中对于某一学术概念的属性描述集中起来,用来构建属性描述知识库。本文通过人工构建规则的方法,形成了属性抽取的九大类描述规则,并对属性描述进行了数量关系和情感信息方面的分析,然后对学术概念属性抽取系统进行设计和实现,并对《情报学报》2007年和2008年的文章进行抽取实验,对系统抽取的结果和人工标记的结果进行了测评,并进行了实验结果的分析。
丁君军郑彦宁化柏林
关键词:知识抽取学术定义
学术定义抽取系统实现及实验分析被引量:7
2011年
设计了一种定义抽取系统,通过混合使用模式规则、语法规则和词频统计以达到定义抽取的目的。详细介绍了系统中的各项关键技术,包括分词技术、抽取规则导入技术、句子抽取技术和加权词处理技术。并选取《情报学报》2007—2008年的235篇论文全文作为实验数据,通过与人工抽取结果进行对比分析,测试了抽取系统的抽全率与抽准率。
刘一宁郑彦宁化柏林
关键词:学术定义知识抽取自然语言处理
共1页<1>
聚类工具0