谢靖
- 作品数:7 被引量:36H指数:4
- 供职机构:中国科学院国家科学图书馆更多>>
- 发文基金:中国科学院知识创新工程重要方向项目“十一五”国家科技支撑计划中国科学院科研项目更多>>
- 相关领域:文化科学自动化与计算机技术文学金属学及工艺更多>>
- 面向网络科技监测的分布式定向资源精确采集研究和应用
- 本文在分析研究现有开源采集系统的基础上,调研不同类型的开源采集系统,综合应用开源框架,根据网络科技监测对信息采集实时性和准确性的要求,设计开发分布式定向资源精确采集的应用系统,重点介绍了系统的框架结构和系统功能实现。
- 谢靖曲云鹏刘建华
- 面向网络科技监测的分布式定向资源精确采集研究和应用被引量:3
- 2011年
- 在分析研究现有开源信息采集系统的基础上,综合应用开源框架,以开源爬虫Crawler4j为基础,设计开发基于开源框架的分布式定向资源采集系统,实现对网络信息实时精确的采集,以满足网络监测系统的及时性和准确性的要求。主要介绍系统的结构设计和功能实现,并详细阐述精确采集的方法和技术路线。
- 谢靖曲云鹏刘建华
- 关键词:分布式
- 开放资源的再利用模式研究被引量:10
- 2013年
- 总结主要的资助机构、出版社和开放仓储对开放资源的再利用许可和限制规定,分析主要开放获取期刊和开放仓储资源提供的技术接口方式,最后提出开放资源的6种开放资源的再利用服务模式:开放资源的集成检索服务、开放资源之间的关联服务、开放资源的使用统计服务、学术引用网络分析服务、语义丰富后数据的开放利用服务、开放资源专题聚合成的虚拟开放期刊服务。
- 黄永文张建勇谢靖刘春江王思丽韩红
- 关键词:开放获取政策再利用模式
- 基于规则的网络文本资源标题快速自动识别方法被引量:5
- 2011年
- 选取网络文本资源的标题识别作为切入点,除考虑多数研究关注的文本的格式信息(如字体)、位置信息等特征外,加入对标题与网页正文内容的相关度的考虑,利用科技监测项目采集到的大量历史数据作为统计分析的基础,从候选标题的可能来源和特征方面,构建基于规则的网络文本资源标题快速识别方法,并给出该方法的时间效率和识别准确率测评结果。
- 刘建华张智雄谢靖邹益民
- 网络科技信息自动监测服务系统的建设被引量:13
- 2013年
- 监测科技领域的变化情况,洞察科技领域的发展态势是文献情报机构的一项重要任务。在国家科技支撑计划项目和中国科学院项目的支持下,国家科学图书馆开发了适用于领域监测的"网络科技自动监测系统",这一系统的建设目标是帮助战略情报研究团队全面及时地跟踪监测特定领域内一些重要科研机构发布的网络信息资源,通过信息的采集、知识抽取、信息分析等技术,有效揭示目标科研机构在战略规划、研究布局、重要研究进展等方面的重要动态信息,深入反映领域内的科技创新态势。这一系统已在相关的战略情报研究团队中实际应用,取得了很好的服务效果。论文研究了网络科技信息自动监测系统的建设思路、技术框架和具体的系统实现情况,并对应用效果进行了总结分析。
- 张智雄刘建华邹益民谢靖钱力王颖
- 关键词:自动监测系统战略情报研究
- 集成化可视化的知识检索服务平台建设被引量:6
- 2013年
- 本文总结中国科学院用户的主要信息需求,并从数字资源的统一发现、数字资源的关联化和对象化组织、基于知识组织体系的相关性检索技术以及可视化的检索和展示技术方面分析国外相关研究概况,提出集成化可视化知识检索服务平台的体系框架,最后介绍集成化可视化知识检索服务平台的功能实现。
- 黄永文张智雄吴振新谢靖
- 关键词:知识检索可视化检索
- 基于规则的网络文本资源标题快速自动识别方法
- 本文选取网络文本资源的标题识别作为切入点,除考虑多数研究关注的文本的格式信息(如字体)、位置信息等特征外,加入对标题与网页正文内容的相关度的考虑,利用科技监测项目采集到的大量历史数据作为统计分析的基础,从候选标题的可能来...
- 刘建华张智雄谢靖邹益民