您的位置: 专家智库 > >

国家社会科学基金(05BTQ021)

作品数:11 被引量:117H指数:6
相关作者:侯汉清杜慧平仲云云刘华梅黄建年更多>>
相关机构:南京农业大学上海师范大学国家图书馆更多>>
发文基金:国家社会科学基金国家社会公益研究专项计划南京农业大学SRT基金更多>>
相关领域:文化科学自动化与计算机技术更多>>

文献类型

  • 8篇中文期刊文章

领域

  • 6篇文化科学
  • 3篇自动化与计算...

主题

  • 3篇叙词
  • 3篇叙词表
  • 2篇主题词表
  • 2篇互操作
  • 2篇词表
  • 1篇登录
  • 1篇电子政务
  • 1篇电子政务主题...
  • 1篇杜威十进分类...
  • 1篇叙词表编制
  • 1篇映射
  • 1篇政务
  • 1篇中国分类主题...
  • 1篇中国图书
  • 1篇中国图书馆分...
  • 1篇十进分类法
  • 1篇停用词
  • 1篇图书
  • 1篇图书分类
  • 1篇图书分类法

机构

  • 8篇南京农业大学

作者

  • 8篇侯汉清
  • 3篇杜慧平
  • 1篇仲云云
  • 1篇曹艳
  • 1篇刘竟
  • 1篇戴剑波
  • 1篇何琳
  • 1篇刘华梅
  • 1篇黄建年
  • 1篇刘俊
  • 1篇李华
  • 1篇杨俊梅

传媒

  • 2篇图书馆理论与...
  • 2篇中国索引
  • 1篇情报科学
  • 1篇情报学报
  • 1篇情报理论与实...
  • 1篇国家图书馆学...

年份

  • 2篇2008
  • 3篇2007
  • 3篇2006
11 条 记 录,以下是 1-8
排序方式:
简便易行的机编词表软件——MultiTes被引量:4
2007年
在实际使用的基础上,本文介绍一种国外流行的、简便易用的机编词表软件——MultiTes 2005 Pro。作者详述了该软件的主要功能、结构、界面和使用方法,并进行了简要的评价。
杨俊梅刘俊侯汉清
关键词:叙词表编制
《中国分类主题词表》(第二版)评介被引量:6
2006年
从规模和性能上对《中国分类主题词表》新旧两个版本进行了测评和比较,分析了新版词表的优点和不足,并提出一些改进建议。参考文献8。表7。
侯汉清李华
关键词:《中国分类主题词表》
Tag分类基本问题探究被引量:28
2008年
作为Web2.0技术的核心,Tag的应用越来越广泛,Tag的分类功能也越来越受重视,但是对于Tag分类的探讨依然付之阙如。作为一种新型的分类方法,Tag的来源多种多样,既有直接来源,也有间接来源。Tag分类采用了3种技法,分别是自由分类、自动归类、自动聚类,它可以应用于背景资料的阅读、分类订阅、邮件过滤、文件管理等领域,目前正对多次分类、交叉分类和动态链接等多个问题探索和研究。
黄建年侯汉清
关键词:标签
电子政务主题词表的自动构建研究
2008年
电子政务主题词表是电子政务信息的组织和检索的重要语义工具。传统手工编制叙词表的方法耗费大量人力、物力,成本高、历时长,已不再适用于网络环境。本文拟以共青团电子政务词表为例,探讨用计算机自动构建叙词表的方法。主要技术要点包括:利用N-gram方法进行选词、结合Dice测度、相似度算法、模式匹配等多种技术来自动识别词汇的等同、等级和相关关系。最后评测了自动构建的电子政务主题词表的性能。
仲云云侯汉清杜慧平
关键词:电子政务叙词表
文献分类法自动映射系统的构建——以《中国图书馆分类法》与《杜威十进分类法》为例被引量:20
2006年
实现文献分类法之间的互操作是信息组织和检索的迫切需要。目前在国内外大多数分类法之间互操作研究项目中,基本上是采用人工判断的方法来建立类目映射关系。笔者认为,《中国图书馆分类法》(CLC)和《杜威十进分类法}(DDC)的类目表达的整体概念可以分解成多个概念因素,整体相似可以建立在部分相似的基础上,可通过计算类目概念因素的相似度得到类目整体概念之间的相似度。在CLC与DDC自动映射系统中,类目表达的概念可以分解成类名词、注释词、下位词、上位词,根据相似值最大原则对概念因素进行配对,通过配对概念的加权,实现类目之间相似度的自动计算。根据类目相似值、类目对应概念因素(即对应词)的差额、相等概念因素(即等价词)的类别3个参数制订了详细的类目映射规则。本文还介绍了CLC与DDC自动映射系统的结构、功能和使用。
戴剑波侯汉清
关键词:图书分类法互操作中国图书馆分类法杜威十进分类法
基于词表和N-gram算法的新词识别实验被引量:8
2007年
目前未登录词问题仍然很大程度上影响着自动标引和信息检索的效率。本文提出了一种选择期刊论文的题名和摘要作为训练语料,利用N-gram算法切分和停用词典等过滤筛选的非专名的新词识别方法。该方法主要分为两步:先进行N元切分,保存关键词候选集并统计词频;然后进行一系列的过滤,主要有词频阈值限定、前停后停词典过滤、相邻词比较、子父串比较、抽词词典和过滤词典的过滤,最后进行人工判别。对实验结果的测评表明这一方法是简便易行的。训练语料可以不用全文,只用题名和摘要;在新词识别上,摘要可以代替题名。
曹艳杜慧平刘竟侯汉清
关键词:未登录词新词识别
领域本体的半自动构建方法研究被引量:18
2007年
人机协作的半自动构建本体是目前较为理想的模式。借鉴软件工程中的领域建模、图书馆学中的分类学和本体学习的方法论,由领域专家给出领域的上层知识模式,通过机器学习技术从领域语料库中学习等级关系和相关关系为知识工程师提供参考,将专家的自顶向下和机器学习的自底向上的结果结合起来构建本体。半自动构建领域本体的关键技术在于领域概念的获取和组织,用共现统计算法、关联规则算法、隐含语义索引、Hopfield联想算法获取相关关系,用聚类算法、字面成族、模式匹配获取等级关系,从而完成领域类模型的构建。
何琳杜慧平侯汉清
关键词:本体
近十年情报检索语言互操作研究进展被引量:12
2006年
词表的兼容互换问题成为信息领域的一个研究热点。本文回顾了国内外近10年来情报检索语言互操作的研究状况,重点介绍了国外HILT、Renardus、HEREIN、CAMed、UMLS、Unfamiliar Metadata等几个研究项目,并总结了实现情报检索语言互操作的几种方法。
刘华梅侯汉清
关键词:情报检索语言互操作分类表叙词表映射
共1页<1>
聚类工具0