吴泽宜
- 作品数:9 被引量:5H指数:1
- 供职机构:中国农业科学院科技文献信息中心农业信息研究所更多>>
- 相关领域:文化科学自动化与计算机技术更多>>
- 编制《农业科学叙词表》与建立叙词库系统的研究
- 方陆明江照夏松云许世淑王彩华邹新玉朱履宽蔡素清施孝遵杨贵祥顾有融吴泽宜张世珩唐桂礼刘淑珍
- 采用先进的叙词语言和分类主题一体化技术与理论;词库管理系统与编表系统的建立,采用关系数据库范式设计、Prototype(原型)软件开发和结构化设计等技术。主要技术指标:1.学科覆盖面广。包涵45个学科,240个专业;2....
- 关键词:
- 关键词:叙词表数据库
- 中国农业情报文献目录综合数据库的检索途径及其检索功能
- 吴泽宜
- 关键词:数据库综合数据库
- 确定中文农业核心期刊的几种方法
- 1992年
- 所谓核心期刊就是引文率高、文摘率高、应用流通率高的期刊。确定核心期刊的方法与期刊的性质、馆藏特点、专业范围和用户的素质有很大关系。在我国,对外文核心期刊的研究比较广泛,《世界图书B辑》
- 吴泽宜
- 关键词:农业
- 中国农业文献综合数据库的机辅标引与索引技术
- 1991年
- 标引是对文献进行主题分析,从自然语言转换成规范化检索语言的过程,即对主题分析结果赋予检索标识的过程。标引的实质是赋予文献检索标识,并用其作为存贮和查询的依据,即检索语言。二次文献通过标引获得的检索标识,必须根据检索要求合理编排,才能具备检索功能,使之成为检索工具。这种处理技术,称为索引技术。标引技术和索引技术与数据库的结构和检索途径的布局及建库条件有密切关系。中国农业文献综合数据库,简称综合库。它的标引标识共分8种,即主题词、功能符、分类号。
- 吴泽宜
- 关键词:农业数据库标引索引
- 中文农业科技文献自动标引系统SDIC/CASDAIS被引量:4
- 1995年
- 本文介绍了一个中文农业文献自动标引系统SDIC/CASDAIS,它集自动主题标引与自动分类标引于一体,采用主题词表、预匹配词表和停用词表相结合的词典法方案,匹配中采取正向增字跳字最长匹配的算法,末二字回溯,制订大量规则以降低错标。该系统可完成主题标引和分类标引,能处理农业文献中常见的缩略语和科技术语不规范现象,具备动态构词功能。SDIC/CASDAIS系统采用特征词析取方法处理不包含在词表中的品种、物质名称和地名等关键词,其自由词判定规则还可以判别标题的部分自由词,通过词频统计可作为更新词表的依据。SDIC/CASDAIS系统的标引速度为3000条标题/小时,平均标引深度略大于4,主题标引精度98%,分类标引基本吻合率80%。
- 王继华王怀惠吴泽宜
- 关键词:农业文献自动标引系统文献标引
- 中文农业科技文献自动标引技术与实践
- 1997年
- 本文介绍了中文农业科技文献自动标引系统,它基于主题词、分类号、范畴代码和网罗词四位一体化词表,在文献标题句法分析的基础上,归纳出7个元标题模式,并应用其模式、主题词表、预匹配词表和停用词表进行预处理和分步匹配,综合采用了正向增字最长匹配算法、结合增字、跳字规则,前后缀扩充规则,模式匹配规则,末二字回溯算法以及自由词和特征词提取技术。系统分词准确率达到95%以上,具有词表维护自由词词频统计、显示浏览标引结果和标引测试等功能。具有主题词、分类号、范畴代码、网罗词以及自由词和特征词一体化自动标引功能。经过四个数据库数万篇文献的实际标引,标引速度达到4000篇/小时(题名)和3000篇/小时(题名加文摘,标引深度达到4.4(题名)和6.7(题名加文摘)个主题词和自由词,各项标引准确率达95%以上,标引环境为AST486/33微机。
- 王怀惠王继华吴泽宜苏晓鸳张彤
- 关键词:自动标引分词技术农业文献数据库
- 中国农林文献数据库建库技术
- 1991年
- 吴泽宜王怀惠
- 关键词:农业林业数据库
- 中国农林文献数据库的分类标引方法被引量:1
- 1995年
- 中国农林文献数据库的分类标引方法吴泽宜(中国农科院科技文献信息中心北京100081)分类标引是根据主题分析的结果,对信息赋予分类标识的过程。分类标引用的检索语言称分类语言。分类语言包括等级体系分类语言(体系分类法)和分析综合分类语言(组配分类法)两种...
- 吴泽宜
- 关键词:农业林业数据库图书分类
- 中文农业科技文献自动标引系统
- 王怀惠王继华吴泽宜苏晓鹭张彤
- 为实现自动标引而构造了主题、分类、范畴代码和网罗词四位一体的多功能计算机自动标引用的主题词表以及范畴代码与网罗词的对照关系表,并采取了有效的汉语分词技术。1.引入句法概念,归纳出7个元标题模式应用元标题句型把待标引的题目...
- 关键词:
- 关键词:中文文献自动标引系统数据库标引