教育部人文社会科学研究基金(09YJC870015)
- 作品数:9 被引量:55H指数:4
- 相关作者:何琳杜慧平侯汉清朱晓霞更多>>
- 相关机构:南京农业大学上海师范大学南京大学更多>>
- 发文基金:教育部人文社会科学研究基金中央高校基本科研业务费专项资金更多>>
- 相关领域:文化科学自动化与计算机技术语言文字更多>>
- 网络环境中领域叙词表自动编制方案与关键技术研究被引量:4
- 2011年
- 提出了一套适用于网络环境中信息资源组织用领域叙词表自动编制方案,系统地阐述了自动编制过程中的步骤,并介绍了其中的关键技术,包括词表收词选词原则与方法,等同关系、等级关系和相关关系的自动识别方法和技术。最后指出,只有不断地维护和更新才能保证词表具有永久的生命力。
- 杜慧平朱晓霞何琳
- 关键词:网络环境叙词表信息抽取信息组织
- 基于多策略的领域本体术语抽取研究被引量:1
- 2013年
- 术语的抽取是领域本体构建的基础工作,决定了本体构建的质量。获取的术语除了要求有准确的短语识别率,还要求有较高的术语领域度。本文试图研究一种不依赖于背景语料的术语领域度筛选方法。本文的主要工作集中在两个方面:一是通过统计和规则相结合的方法从领域语料中抽取候选术语(短语),二是提出了通过候选术语的分布度、活跃度以及主题度进行计算的多策略术语抽取方法,并通过实验进行了验证和分析。实验结果表明,在小规模航空航天领域语料库上进行验证性实验后发现,在不大量增加计算时间复杂度的情况下,能够有效提高领域术语抽取的质量,获得令人较满意的结果。
- 何琳
- 关键词:术语抽取
- 领域本体评价研究被引量:9
- 2010年
- 本体评价的任务是评价本体在特定环境或应用的质量,本体评估对于语义网以及其他语义相关技术的推广非常重要,目前对本体评价的研究还很少。本文对目前的本体评价现状做了总结,对评价策略和技术做了评价和分析,同时指出目前本体评价中存在的问题和进一步的解决方案。
- 何琳
- 关键词:本体评价
- 基于多策略的领域本体术语抽取研究被引量:16
- 2012年
- 术语的抽取是领域本体构建的基础工作,决定了本体构建的质量。获取的术语除了要求有准确的短语识别率,还要求有较高的术语领域度。本文试图研究一种不依赖于背景语料的术语领域度筛选方法。本文的主要工作集中在两个方面:一是通过统计和规则相结合的方法从领域语料中抽取候选术语(短语),二是提出了通过候选术语的分布度、活跃度以及主题度进行计算的多策略术语抽取方法,并通过实验进行了验证和分析。实验结果表明,在小规模航空航天领域语料库上进行验证性实验后发现,在不大量增加计算时间复杂度的情况下,能够有效提高领域术语抽取的质量,获得令人较满意的结果。
- 何琳
- 关键词:术语抽取
- 《中国图书馆分类法》在网络环境中的适应性改造研究被引量:10
- 2010年
- 分类法在网络信息资源组织中有其无可替代的优势,以《中国图书馆分类法》(简称《中图法》)为代表的图书分类法是一个完整的、严谨的知识分类体系,同时有着广泛和深厚的用户基础。从国际化、智能化、社会化等几个角度探讨以《中图法》为代表的传统分类法如何能够适应网络环境中信息组织的要求,以期为今后《中图法》的修订和改造提供一些建议。
- 何琳侯汉清
- 关键词:图书分类法《中国图书馆分类法》网络信息检索
- 层累制分类表的SKOS化转换研究评介被引量:3
- 2011年
- 介绍分类表在数据共享格式描述中的研究进展,重点分析其在数据描述格式转换中面临的难点以及可能的解决措施,在此基础上展望未来的研究方向,以期为国内分类表用于数据交换服务提供参考。
- 何琳杜慧平
- 关键词:SKOS体系结构OWL
- 概念等级关系自动识别研究被引量:2
- 2010年
- 明确了信息检索用概念等级关系的具体类型,概括了概念等级关系自动识别的应用领域,详细介绍了常见的概念等级关系自动识别方法并分析其优点和不足之处,最后建议实际操作中需综合使用多种方法以取得等级关系识别的最佳效果。
- 杜慧平
- 关键词:叙词表本体语义关系抽取
- 基于知识组织资源仓库的领域本体构建研究被引量:3
- 2011年
- 传统的知识组织资源为本体构建提供了良好的术语基础和丰富的语义关系,本文提出了一种将传统知识组织资源进行集成的方式构建本体,初步提出了通用分类体系的构建策略、叙词表资源整合的方案以及叙词表关系细分的方法,并对构建过程中的几个关键问题进行了讨论。
- 何琳
- 关键词:本体构建分类表叙词表
- 概念等级关系自动识别研究被引量:8
- 2011年
- 界定了信息检索用概念等级关系的涵义,明确了其包含的属种、实例和整部三种子关系类型并阐明概念等级关系自动识别研究在信息组织和信息检索领域的五种应用途径,详细介绍了常见的概念等级关系自动识别方法,包括基于同现统计的识别方法、基于句法模式匹配的识别方法、分布相似度计算方法、基于在线维基百科篇章结构的识别方法、基于词典定义的识别方法,并分析它们的优点和不足之处。最后建议中文等级关系的自动识别,可以借鉴以上方法,利用中文现有语料如《同义词词林》和汉语构词特点,综合使用多种方法以取得等级关系识别的最佳效果。
- 杜慧平
- 关键词:叙词表本体语义关系抽取