程齐凯
- 作品数:66 被引量:691H指数:16
- 供职机构:武汉大学信息管理学院更多>>
- 发文基金:国家自然科学基金教育部人文社会科学重点研究基地度重大研究项目中国博士后科学基金更多>>
- 相关领域:文化科学自动化与计算机技术语言文字政治法律更多>>
- 智能情报技术:内涵、边界与体系
- 2025年
- 情报工作正经历着从传统模式向智能化模式的深刻转型。从早期的智能检索到当前的大模型驱动的智能情报理解,情报技术已逐步从“智能+情报”和“智能for情报”等演化为“智能即情报”和“情报即智能”的新模式。本文详细探讨了智能情报技术的概念、技术边界及其体系建构,提出了面向数智时代的智能情报技术体系架构,涵盖了全源科技情报协同感知与融合技术、智能情报认知理解技术、智能情报监测预警技术、竞争情报智能分析技术和科技情报驱动的智能循证决策技术。该体系全面覆盖情报工作的各个流程,旨在通过体系建构助力提升情报工作和情报研究的智能化水平,服务科技情报事业的智能化转型,支撑我国高水平科技自立自强。本文不仅对智能情报技术的发展具有重要的理论价值,也为实际应用提供了明确的技术路径和实施框架。
- 姚长青程齐凯王莉军刘家伟
- 关键词:人工智能情报技术
- 智能科学家——科技信息创新引领的下一代科研范式被引量:17
- 2020年
- 科技创新是国家发展与民族复兴的强大引擎。提高科技创新能力必须透彻理解科研活动本身,包括科学研究发展规律、科技竞争形式特点、科研人员行为方式、科研成果传播影响等。科技信息是大量科研活动信息的承载和记录,科技信息的智能挖掘服务可以有效支撑科研创新能力研究。文章提出"智能科学家"的理念,首先分析了科研范式的演变与发展趋势,然后探讨了科技信息引领下的辅助科研创新、协助科研创新、自主科研创新三阶段构想,最终实现"智能科学家"的目标,最后介绍了"智能科学家"需要依托的若干关键技术方向。
- 罗威罗准辰雷帅程齐凯陆伟张瑾韩涛冯岩松韩先培冯冲张均胜刘志辉乔林波李东升许儒红陈敬一
- 关键词:科研范式领域知识
- 基于词汇功能识别的科研文献分析系统设计与实现被引量:11
- 2017年
- [目的 /意义]从学术文本词汇功能的角度出发,考虑科研文献中词汇的语义功能,设计和实现一个基于词汇功能识别的科研文献分析系统,在一定程度上弥补现有科研文献分析系统的不足之处。[方法 /过程]首先阐述学术文本词汇功能的定义及其识别研究的现状进展;在此基础上,对系统思路、功能模块进行设计;最后,选取1994-2013年CNKI中计算机领域的文献作为数据来源,实现一个基于词汇功能识别的科研文献分析系统CS-LAS。[结果 /结论]CS-LAS可以满足科研工作者更为细粒度的信息需求,对于传统学术数据库的检索结果有一定的优化,同时实现对某一学科的研究热点和研究趋势的合理把握和可视化呈现。
- 李信程齐凯刘兴帮
- 关键词:计算机领域
- 基于引用共词网络的领域基础词汇发现研究被引量:8
- 2019年
- 【目的】从学术文献中发现领域基础词汇,为把握学科知识结构和发展脉络提供支持。【方法】将引文网络引入到共词分析中,构造关键词之间的引用共词网络,采用PageRank算法对候选词汇重要性进行排名,基于约11万篇计算机领域文献集进行实证研究。【结果】从定性和定量的角度与词频法和共词分析法进行对比,结果表明本文方法效果较好,能更好地拟合专家人工筛选结果,盲选实验的平均准确度达72.6%。【局限】仅以计算机领域为例进行实验。【结论】本研究提出一种融合引用共词网络和Page Rank算法的领域基础词汇发现策略,能够提高领域基础词汇发现的效率和质量。
- 程齐凯王佳敏陆伟
- 关键词:基础词汇PAGERANK共词分析
- 基于查询扩展的有限数据源数据获取方法
- 本发明公开了一种基于查询扩展的有限数据源数据获取方法,本发明通过查询扩展技术执行多次查询以获取尽可能多的记录,可以有效地避开返回记录数的限制;以最少的查询次数穷尽此类数据源中的相关文档,本发明通过多次查询直至穷尽有限数据...
- 陆伟乐兴虎程齐凯
- 文献传递
- 一种PDF文件向OFD文件转化的方法
- 本发明公开了一种PDF文件向OFD文件转化的方法,首先输入PDF文件;然后利用机器视觉技术对PDF文件进行版面分析,得到版面的内容分布,再解析PDF文件数据,获得该文件中的所有元素的对象,以及对象信息;然后将对象与版面分...
- 陆伟于丰畅程齐凯
- 文献传递
- 学术文本的结构功能识别——功能框架及基于章节标题的识别被引量:53
- 2014年
- 当前学术文本挖掘研究大多数是采用基于词汇、窗口、全文的方法,往往忽略了学术文本的内在结构,导致了很多歧义性问题。本文针对当前研究不足,提出一种研究性论文的结构功能框架,对学术文本的章节功能和逻辑结构进行了定义。在此基础上本文从三个不同层次(基于章节标题、基于章节内容和标题、基于段落)论述了结构功能的自动分类问题,并从第一个层次(基于章节标题)采用词表与序列标注相结合的方法进行了结构功能的自动分类实验,取得了令人满意的效果。
- 陆伟黄永程齐凯
- 关键词:文本挖掘
- 基于几何对象聚类的学术文献图表定位研究被引量:5
- 2021年
- 【目的】解决学术文献图表定位中低召回率问题。【方法】提取学术文献PDF文件中的几何对象,从编码分析和图片理解两种视角获取图表范围的先验信息,使用K-means聚类算法对几何对象进行合并,并用启发式算法重构图表文字内容,以此确定文献中的图表位置。【结果】在实验数据集上,本文算法定位的准确率为0.915,召回率为0.918,与当前先进的算法准确率相近,且召回率提高0.193,相对提升达到26.6%。【局限】复杂排版和文档符号的不规范使用,会给算法造成一定误差。聚类K值确定和干扰文字过滤算法尚有提升空间。【结论】算法不依赖特定的排版方式,充分利用了PDF学术文献的视觉和编码特点,有效地提高学术文献图表定位的召回率。
- 于丰畅程齐凯陆伟
- 关键词:学术文献聚类
- 学术文本的结构功能识别——基于段落的识别被引量:39
- 2016年
- 学术文本的结构功能识别是学术文本章节层次的文本分类问题,其本质就是识别章节的结构功能。本文将基于段落的学术文本结构功能识别分为两个子问题:段落位置识别及基于段落投票的章节结构功能识别。在自动构建的大规模数据集上的实验结果表明,虽然基于段落的结构功能识别效果不如基于章节整体内容的识别,但仍然取得了不错的效果。本文结合实验结果着重分析了影响基于段落的识别效果的两个重要因素:段落长度及章节中段落数量,并在最后对学术文本结构功能识别的三个层次做了总结,指出了拟进一步探讨的问题和方向。
- 黄永陆伟程齐凯桂思思
- 关键词:文本分类文本挖掘
- 档案学合著网络研究被引量:8
- 2009年
- 笔者收集了包含CNKI定义的13种档案学核心期刊在内的17种档案学期刊从1998年到2007年间的发文数据,并在此基础上对档案学领域的合著网络进行研究:测度档案学合著网络的一般指数,总结档案学科研团体的分布情况,分析档案学学者的合著规律,并对档案学学者分层化的现象进行了简单探讨。
- 程齐凯
- 关键词:合著网络信息计量UCINET