您的位置: 专家智库 > >

徐红姣

作品数:33 被引量:107H指数:6
供职机构:中国科学技术信息研究所更多>>
发文基金:国家社会科学基金中国博士后科学基金中国科学技术信息研究所预研基金项目更多>>
相关领域:文化科学自动化与计算机技术语言文字社会学更多>>

文献类型

  • 29篇期刊文章
  • 3篇专利
  • 1篇会议论文

领域

  • 21篇文化科学
  • 9篇自动化与计算...
  • 4篇语言文字
  • 1篇社会学

主题

  • 6篇翻译
  • 5篇多语
  • 5篇查询
  • 4篇信息检索
  • 4篇语言
  • 4篇跨语言信息检...
  • 4篇词典
  • 3篇对齐
  • 3篇译词
  • 3篇知识发现
  • 3篇数据分析
  • 3篇自动标引
  • 3篇跨语言检索
  • 3篇机器翻译
  • 3篇翻译词典
  • 3篇标引
  • 3篇查询翻译
  • 3篇大数据
  • 2篇多语言
  • 2篇语料

机构

  • 33篇中国科学技术...
  • 3篇北京市科学技...
  • 3篇《学报》编辑...
  • 1篇北京大学
  • 1篇中国机械工业...
  • 1篇河北地质大学

作者

  • 33篇徐红姣
  • 15篇高影繁
  • 12篇王惠临
  • 11篇曾文
  • 8篇张均胜
  • 6篇何彦青
  • 4篇屈鹏
  • 4篇李颖
  • 3篇张运良
  • 3篇车尧
  • 3篇李辉
  • 3篇王莉军
  • 3篇刘志辉
  • 3篇许德山
  • 2篇刘敏
  • 1篇刘丹
  • 1篇张满年
  • 1篇于薇
  • 1篇桂婕
  • 1篇石崇德

传媒

  • 7篇情报理论与实...
  • 6篇图书情报工作
  • 4篇情报学报
  • 3篇数字图书馆论...
  • 3篇情报工程
  • 2篇情报科学
  • 1篇情报杂志
  • 1篇中国编辑
  • 1篇出版科学
  • 1篇情报学进展

年份

  • 3篇2023
  • 1篇2022
  • 3篇2019
  • 3篇2018
  • 1篇2017
  • 2篇2016
  • 2篇2015
  • 6篇2014
  • 2篇2013
  • 1篇2012
  • 7篇2011
  • 2篇2010
33 条 记 录,以下是 1-10
排序方式:
多语主题词表及其应用研究被引量:1
2013年
对多语言信息进行语义层面的精确描述,为用户提供准确的跨语言信息资源,是当前多语言信息服务中必须面临和解决的实际问题。多语言主题词表正是解决这一问题的有效工具资源之一。文章首先介绍了国外三个常用多语言主题词表,然后对多语言主题词表在多语言信息自动标引和多语言信息检索两个领域中的应用情况进行了分析,说明多语言主题词表在多语言信息服务领域的潜在应用价值。
徐红姣张均胜王惠临
表格处理方法、装置、设备及计算机可读存储介质
本申请实施例提供了一种表格处理方法、装置、设备及存储介质,包括:获取可携带文档格式PDF文件中至少一个表格的线条集合和文本集合;根据线条集合,确定至少一个表格的行距单元格集合和实线行距单元格集合;根据行距单元格集合和实线...
许德山何彦青吴振峰徐红姣兰天潘优刘志辉董诚
海量数据的组织与管理方法研究被引量:3
2016年
随着信息技术的发展,需要存储和传播的信息数据量越来越大,数据的种类和形式越来越丰富,数据资源呈现规模大、多源性、多语言等特点,使得海量数据资源的组织和管理面临极大的挑战。本文分析和阐述海量数据资源在组织与管理等方面的问题和方法,并介绍在相关领域的研究工作和体会。
曾文李颖韩红旗张运良徐红姣翟娟华
关键词:海量数据数据资源词表
基于跨语言文本分类的多语资源组织方法研究
跨语言文本分类技术是指在不需人工干预的情况下将现有的自动文本分类系统由单语言扩展到两种或多种语言。当机构或组织的文档管理部门日益依赖自动文本分类时,跨语言文本分类技术能为其解决多语种文档的归类组织问题提供支持。本文以国家...
高影繁徐红姣张均胜王惠临
关键词:快速分类算法
基于过滤与权重平滑策略的自动标引方法研究被引量:1
2014年
文章提出一种基于过滤和权重平滑策略的标引词自动抽取方法,该方法采用可变停用词作为文档分隔手段,采用词性、词频、词语位置等信息作为标引词过滤的手段,采用合理的权重倾向策略保证了标引词抽取在词组和单词中的均衡。方法综合利用了词性标注等自然语言处理领域的研究成果和统计学信息,不依赖词汇在文档集中的分布规律,可以直接从单篇文档抽取标引词,在待标引文档篇幅受限的情况下具有良好的运行性能。
高影繁徐红姣杜枫
关键词:自动标引
多语叙词表构建方法研究与实践被引量:3
2014年
多语叙词表是实现多语言信息组织和检索,满足日益增长的多语言信息需求的重要工具资源。首先介绍多语叙词表构建的研究现状和3种主要构建方法,并对基于翻译构建多语叙词表的方法及该方法的不足进行分析,然后从汉化方法、汉语词汇的选取原则、叙词表辅助汉化平台的构建及汉化结果评价4个方面对英语EI叙词表和日语JST叙词表的汉化工作进行介绍,最后探讨下一步的研究工作。
徐红姣高影繁张均胜屈鹏曾文
基于机器翻译的专利术语翻译获取方法研究被引量:2
2014年
鉴于专利术语的翻译要求高度的准确性和专业性,而专利术语的自动获取翻译对于机器翻译、词典自动编纂、跨语言信息检索等自然语言处理具有重要的实用价值,从双语的专利摘要中分别抽取术语,之后融合多术语识别方法,采用规则翻译和统计机器翻译来动态地辅助词汇化方法进行术语对齐,以期尽可能多地在双语的专利文献中获取准确的专利术语翻译对。在专利文摘中进行实验验证的结果是:专利术语翻译对的准确率达到80%。
何彦青刘建辉屈鹏李颖徐红姣
关键词:机器翻译
一种基于短文本相似度计算的主观题自动阅卷方法被引量:12
2014年
文本主观题自动阅卷的关键是提高考生答案文本和试题标准答案文本之间相似度计算结果的准确率。参考文本试题人工阅卷方法,提出一种结合人工制定文本相似标准、词语集合及词语次序和同义词的短文本相似度计算方法,设计并实现相应文本主观题阅卷系统。建立试题人工评分标准库,并在387道银行培训领域真实考题数据集上进行自动阅卷与人工阅卷结果对比实验。结果显示,文本试题自动阅卷结果与人工阅卷结果相比,完全相同的达到58%,准确率达到80%左右。
张均胜石崇德徐红姣高影繁何彦青
关键词:相似度主观题自动阅卷
基于平行语料的查询翻译词典改进方法研究被引量:2
2011年
面对基于双语词典的跨语言检索查询翻译方法中固有的一对多等翻译模糊问题,已有研究成果存在对于非组合型复合词无法进行准确翻译、双语词典和其他翻译资源联合使用引入较大计算开销等弊端。为建立英汉双向跨语言检索实用性系统,在现有的一部包含若干科技词汇和短语的双语科技词典的基础上,着重研究如何引入平行语料来改进已有的双语词典问题。目标是生成一部基于句对齐平行语料的科技类双语概率词典,为跨语言检索查询翻译消歧提供实时性支持。
高影繁徐红姣王惠临
关键词:查询翻译
多语言科技语料库建设研究
2015年
多语言科技语料库建设的重要意义在于它能够服务于多语言科技文献信息的组织、科技文献的自动翻译,以及科技文献的情报分析等。科技语料库的建设采用的主要技术方法是运用自然语言处理和计算机处理技术实现语料的采集、自动加工和处理。本文介绍多语言科技语料库建设方面的相关研究工作,主要涉及多语言词表、平行语料的获取与处理,及多语言语法资源的建设等方面的工作成果。研究工作的不足之处在于语料库的数据资源和语法资源的质量和规模有待于提高和完善。
曾文张均胜徐红姣李颖刘敏屈鹏刘丹
关键词:多语言语料库
共4页<1234>
聚类工具0