张晓丹
- 作品数:21 被引量:100H指数:6
- 供职机构:中国科学技术信息研究所更多>>
- 发文基金:国家科技支撑计划国家自然科学基金中国科学技术信息研究所预研基金项目更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 开放获取在NSTL系统中的实现与服务模式研究被引量:2
- 2013年
- 开放获取资源是一种非常重要的学术资源,开放获取平台是获得开放资源的有效途径。文章通过对DOAJ、JST等国际上较权威的开放获取平台资源进行分析,得出了目前开放获取资源存在的信息增长与信息获取之间的矛盾的结论。如何利用和整合国际上著名的开放获取资源为国内用户服务是目前研究的主要问题。文章针对国内科研用户对开放获取资源整合的需求进行了研究,并将研究结果应用在国家科技图书文献中心(NSTL)平台上。
- 张晓丹王莉梁冰
- 关键词:资源整合NSTL
- 网页自动分类不确定性问题的贝叶斯网络解法被引量:3
- 2011年
- 针对网页自动分类中存在的类边界模糊、语料不均匀等引起的分类不确定性问题,提出了贝叶斯网络自动分类融合模型和融合算法,该模型和算法基于网页上多种信息进行融合,并采用不同的与处理方法分别对多种信息进行处理,将处理后的信息输入到贝叶斯网络融合中心进行融合推理,得到最终的分类结果。同时,为了降低贝叶斯网络推理时间复杂度,提出了改进的贝叶斯网络图推理算法。实验结果表明,改进后的融合模型和融合算法能有效解决网页自动分类中的不确定性问题,并能提高网页自动分类的准确率和查全率。
- 张晓丹乔晓东梁冰
- 关键词:贝叶斯网络网页自动分类贝叶斯推理信息融合
- 一种文件自动分类系统
- 本实用新型涉及一种文件自动分类系统,属于数据挖掘技术领域。包括:输入模块、信息抽取模块、文本预处理模块、图像预处理模块、视频预处理模块、音频预处理模块、文本分类模块、图像分类模块、视频分类模块、音频分类模块、融合模块、输...
- 张晓丹乔晓东姚长青朱礼军
- 文献传递
- 一种基于情景感知的文献推荐方法
- 本发明涉及一种基于情景感知的文献推荐方法,属于大数据挖掘与应用技术领域。首先获取文献检索平台科研用户的行为日志,并对日志数据进行分析,得到用户的检索基本步骤。然后对单个用户的会话流程按照检索的基本步骤进行切分,选择需要激...
- 张晓丹刘耀
- 一种文件自动分类方法
- 本发明涉及一种文件自动分类方法,属于数据挖掘领域,适用于资源自动归类、网络内容监管、垃圾邮件过滤、数字图书馆等。本发明方法首先抽取文件中的文本信息、图像信息、视频信息、音频信息,然后对这四类信息分别采用不同的分类方法进行...
- 张晓丹乔晓东姚长青朱礼军
- 文献传递
- 一种文件自动分类系统
- 本发明涉及一种文件自动分类系统,属于数据挖掘领域。本发明提供的文件自动分类系统包括:输入模块、信息抽取模块、文本预处理模块、图像预处理模块、视频预处理模块、音频预处理模块、文本分类模块、图像分类模块、视频分类模块、音频分...
- 张晓丹乔晓东朱礼军梁冰
- 文献传递
- 改进的图神经网络文本分类模型应用研究——以NSTL科技期刊文献分类为例被引量:14
- 2021年
- [目的/意义]随着互联网数字资源的剧增,如何从海量数据中挖掘出有价值的信息成为数据挖掘领域研究的热点问题。文本大数据分类是这一领域的关键问题之一。随着深度学习的发展,使得基于深度学习的文本大数据分类成为可能。[方法/过程]针对近年来出现的图神经网络文本分类效率低的问题,提出改进的方法。利用文本、句子及关键词构建拓扑关系图和拓扑关系矩阵,利用马尔科夫链采样算法对每一层的节点进行采样,再利用多级降维方法实现特征降维,最后采用归纳式推理的方式实现文本分类。[结果/结论]为了测试该文所提方法的性能,利用常用的公用语料库和自行构建的NSTL科技期刊文献语料库对本文提出的方法进行实验,与当前常用的文本分类模型进行准确率和推理时间的比较。实验结果表明,所提出的方法可在保证文本及文献大数据分类准确率的前提下,有效提高分类的效率。
- 张晓丹
- 关键词:文本分类
- 基于领域本体的文献智能检索模型研究被引量:8
- 2013年
- 针对文献检索的智能化发展趋势,提出基于领域本体的文献检索模型,对领域本体构建、语义标注计算和概念相似度计算进行研究,并把模型进行了实际应用。通过实验表明,基于领域本体的文献检索系统在检索结果上由于传统的检索方式,检索效率也有一定提高,具有研究的价值和意义。
- 孟红伟张志平张晓丹
- 关键词:领域本体语义标注概念相似度
- 网页自动分类融合模型研究
- 2011年
- 为了提高网页自动分类的准确率,基于信息融合的模型理论,提出了一种通用的网页自动分类模型和融合算法。该模型根据完成功能的不同分为四个层次:信息抽取层、数据预处理层、特征层和决策层,其中特征层是针对网页上不同种类的媒体信息采用不同的分类方法进行分类,并将分类结果分别输入决策层和与该特征层算法相关的其他的特征层。决策层是处理特征层的分类结果,并推导出最终的网页分类融合结果,并将该模型和算法进行了实现。实验表明,文章提出的融合模型和算法可以有效地改进网页自动分类准确率。
- 张晓丹梁冰王丽白海燕吕世炅肖晶
- 关键词:网页自动分类信息融合信息检索
- 使用D3.js的知识组织系统Web动态交互可视化功能实现被引量:19
- 2013年
- 从知识组织系统节点、边及相关知识展示的可视化需求出发,结合国内外技术进展和国内知识组织系统服务现状,以D3.js类库为基础进行知识组织系统Web动态交互可视化实现。在实现过程中重点解决动态交互方面的关键问题,并用具体的知识组织系统数据验证D3.js应用于知识组织系统Web动态交互可视化的可行性和简便性。
- 张运良张兆锋张晓丹许德山
- 关键词:可视化知识组织系统动态交互