吴素研
- 作品数:5 被引量:25H指数:3
- 供职机构:北京市科学技术情报研究所更多>>
- 发文基金:北京市财政局项目北京市科技新星计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 大规模科技文献深度解析和检索平台构建被引量:5
- 2020年
- [目的/意义]在信息检索、科技论文评价和知识结构演化方面,引文分析都起着至关重要的作用。随着格式化全文数据库的出现,引文分析迈入了4.0时代--全文引文分析阶段。但是,目前还没有中文的格式化全文数据库,这极大地制约了全文引文分析在我国科技文献中的研究和应用。[方法/过程]在本文中我们提出建立高效的中文全文引文分析依赖的数据集和检索平台的方法,主要包括:1)提出了基于规则和SVM分类方法的论文元数据和引用提取方法;2)提出基于Spark平台的实现高效引文内容分析标准化数据集生成方法;3)提出建立引用内容的科技文献检索平台。[结果/结论]引文内容分析标准化数据集的建立将全面提升全文引文分析在我国科技领域中的研究效能,提高科技文献查找精度。
- 吴素研吴江瑞李文波
- 关键词:信息抽取信息检索SPARK
- 电子政务中基于词频分析法的热点发现被引量:1
- 2018年
- 针对电子政务中心人大建议和政协提案的文本特点,以及考虑到实际应用系统的负载压力,提出了基于词频分析法的建议和提案热点分析方法。该方法通过对建议和提案题目进行分析,采用N-gram分词方法,并通过停用词典去常用词后计算词频得出初步热点词,再利用词的长度和出现频次去掉类似词,通过建立的知识库进行相似热点词的合并,最后借用知识图谱的方法对热点词之间的关系进行关联。该方法在实际的系统应用中,验证了可用性和适用性。
- 吴素研吴江瑞李文波
- 关键词:电子政务
- 基于组合对称密钥带加密数字签名方法的研究被引量:5
- 2009年
- 提出了组合对称算法,并利用对称密钥技术完成内网保密数据的传递和数字签名。该方案采用在硬件中存储"密钥种子"矩阵和利用组合对称密钥生成算法随机组合生成对称密钥,并完成数字签名。与传统对称密钥系统相比,该方法具有每次生成的对称密钥一次一变不重复,能够实现对称密钥更新管理,由算法自动完成,免人工维护。与传统的非对称加密数字签名系统相比,具有加解密速度快,密钥管理简单的特点。
- 吴素研李瑛胡祥义杜丽萍
- 关键词:数字签名硬件一次一密
- 基于组合对称密钥的机密数据存储和传输研究
- 针对内网办公中机密数据需要安全和高速加解密的特点,本文提出了基于组合对称密钥的机密数据存储和传输方案。其中组合对称密钥的加密方法与以往对称加密相比,具有加密密钥一次一变和密钥免维护的优点;与传统的非对称加密相比,具有加解...
- 吴素研徐冠宁胡祥义李文波
- 关键词:机密数据
- 文献传递
- 科技情报大数据业务平台设计被引量:14
- 2018年
- [目的 /意义]本文分析了目前大数据时代科技情报工作面临的问题和机遇,针对情报服务领域大数据服务模式进行了分析。[方法/过程]该论文结合信息技术领域的虚拟化技术、云平台技术、高性能技术和人工智能技术,设计了科技情报大数据业务平台架构,详细阐述了硬件层、虚拟层、支撑层和业务层主要功能和所需技术;并对大数据处理首要任务存储进行了探索,搭建了基于hadoop和hbase的大数据存储平台。[结果/结论]本文提出的大数据情报业务平台从整体架构进行了设计,并实现了存储模块,下一步实现分析和可视化部门,可以为情报的收集和处理提供大数据支撑服务。
- 吴素研吕志坚吴江瑞李文波
- 关键词:科技情报大数据HADOOPHBASE