国家自然科学基金(71203208)
- 作品数:17 被引量:138H指数:6
- 相关作者:张运良乔晓东曾建勋魏来许德山更多>>
- 相关机构:中国科学技术信息研究所东北师范大学北京印刷学院更多>>
- 发文基金:国家自然科学基金国家科技支撑计划教育部人文社会科学研究基金更多>>
- 相关领域:文化科学自动化与计算机技术语言文字更多>>
- 基于复杂网络的知识组织系统概念社区发现被引量:2
- 2014年
- 将复杂网络的理论引入到知识组织系统的表示中,抽取知识组织系统中的概念及概念间的关系,构建复杂网络。利用Walktrap社区发现算法,发现复杂网络中的概念社区,以助于用户输入种子概念时,仅返回对应的社区。利用种子概念返回社区的准确性对社区发现的结果进行评价,论证该方法的有效性。本研究将以中国科学技术信息研究所已有的新能源汽车领域汉语科技词系统为例进行社区发现研究,发现该方法快速有效。
- 殷希红乔晓东张运良
- 关键词:复杂网络知识组织系统
- 基于术语翻译信息的同义关系快速构建方法研究被引量:4
- 2013年
- 提出一种利用翻译词对信息快速构建知识组织系统中术语之间同义关系的方法:利用单词条的翻译数量、翻译共现强度等作为基本输入,通过简单布尔判断、条件互信息或向量空间模型余弦相似度来计算术语之间的相似度,进而发现并构建同义关系;采用准确率和丰富率来评价构建效果,通过在新能源汽车领域进行实验,发现该方法不但速度快,而且在翻译信息比较丰富的条件下,对于中文同义关系构建有较好效果。
- 张运良乔晓东朱礼军李楠
- 关键词:知识组织系统汉语科技词系统同义关系
- 专利发明人与申请人之间的合作关系研究被引量:7
- 2016年
- 专利合作作为科学合作研究中的重要组成部分,已成为技术领域中不可或缺的理论分析手段,而发明人与申请人作为专利中的关键主体,其关系也影响着专利合作的发展,本文根据《中华人民共和国专利法》对发明人与申请人的规定,探讨了发明人与申请人的合作类型,并从关系维度、认知维度和结构维度上分析了发明人与申请人的多维合作方式。利用数据挖掘技术领域的专利数据进行实证研究,进一步分析了其在识别某技术领域中核心或具有桥梁作用的发明人和申请人、发现合作紧密的研发群体,甄别具有同等实力或具有竞争优势的组织机构等方面的实践意义。
- 魏来高霏霏
- 关键词:社会网络分析群落分析
- 科技文献术语的自动抽取技术研究与分析被引量:16
- 2014年
- 【目的】为提高科技文献信息的组织和检索效率,从解决科技文献术语抽取这一基础研究问题入手,提出一种基于科技文献术语特点和统计计算相结合的科技文献术语自动抽取方法。【方法】核心技术是结合科技文献术语的语言特点,以及术语在文献中的词语组合强度和出现位置等统计计算信息,构建科技文献术语自动抽取算法。【结果】实验测试结果表明,获取的科技文献术语词语的平均准确率可以达到51.2%。【局限】在统计计算算法和数据处理方面,还需进一步改进算法和提高数据质量。【结论】提出的基于科技文献术语特点和统计计算相结合的科技文献术语自动抽取方法是有效的。
- 曾文徐硕张运良翟娟华
- 关键词:自动抽取
- 利用多策略模糊综合评判的术语关系识别方法研究被引量:1
- 2015年
- 利用多策略模糊综合评判的方法进行术语关系识别,首先采用多种相似度计算方法计算术语的相似度,然后利用连续属性离散化方法确定关系类别及阈值区间的划分,利用样本分布概率确定区间对类别的隶属度,利用粒子群算法和交叉验证法确定因素权重,最后利用模糊综合评判方法将所有相似度计算方法的计算结果进行融合处理,实现术语关系的识别。本研究将以中国科学技术信息研究所已有的新能源汽车领域汉语科技词系统中的术语作为测试集,用准确率、召回率和F值对关系识别的结果进行评价,论证该方法的有效性。
- 殷希红乔晓东张运良
- 关键词:模糊综合评判相似度
- 基于摘要文本的专利快速自动分类方法被引量:13
- 2016年
- 随着我国专利申请数量的迅猛发展,对受理专利实现快速分类的需求也越来越迫切。作为专业性知识极强的科技文献,专利自动分类的正确率远高于普通文本的分类效果。基于专利摘要进行快速自动分类的方法,充分考虑专利类别的层次结构特性,建立不同层次的类别特征中心向量,采用经典的类中心向量分类算法实现专利的快速自动分类。实验结果表明:该方法在专利不同层次上的分类效果明显,时效性大大提高,能够满足专利快速分类的实际需求。
- 缪建明贾广威张运良
- 关键词:文本分类
- 利用粒子群和模糊综合评判的模糊分类方法被引量:2
- 2015年
- 【目的】解决传统分类存在硬性划分和部分分类方法只能处理离散型数据的问题。【方法】利用模糊综合评价方法实现对具有连续属性样本的模糊分类,得到样本对于类别的软化分。划分过程中使用连续属性离散化方法对属性区间进行划分,使用粒子群算法获取各属性的最优权重分配,最终结果为样本对各个类别的隶属度。【结果】可以有效地实现对样本类别的软化分,并且达到较高的准确率。【局限】对于属性值过于集中的属性不易进行区间划分。【结论】基于粒子群和模糊综合评判的模糊分类方法是有效可行的。
- 殷希红乔晓东张运良李国双
- 关键词:模糊综合评判连续属性离散化
- 电动汽车领域词系统快速构建研究
- 2014年
- 利用已有的知识组织系统和语料库等既有资源构建相关领域词系统,能够减少劳动量和难度,通过种子词以及词汇社区检测技术来利用已有的新能源汽车词系统,经频率分析和聚类技术来发现新的代表性词条的方法,快速构建了电动汽车领域词系统,并初步证明其可行性。
- 张运良许德山殷希红
- 关键词:电动汽车知识组织系统汉语科技词系统科技信息资源
- 利用术语定义的汉语同义词发现被引量:4
- 2014年
- 【目的】借鉴Lesk词义消歧思想,提出并实现一种利用术语定义来发现汉语同义词的方法。【方法】将新能源汽车领域汉语科技词系统中的术语及其定义作为测试集,首先对术语定义做分词和词性标注,并进行人工校对,然后抽取出动词和名词词性的实词,再根据两个术语定义中相同的实词数量及位置信息计算术语的相似度,最后根据相似度和给定的阈值得到同义词关系的推荐。【结果】利用准确率、召回率、F值对同义词发现效果进行评价,论证该方法的有效性,结果表明该方法可以达到较高的准确率,但是召回率比较低。【局限】该同义词发现方法不能剔除反义关系和相关关系的术语对,造成召回率较低。【结论】该方法较为简便快捷有效,并且可达到较高准确率,但召回率有待提高。
- 殷希红乔晓东张运良
- 关键词:相似度算法
- 大数据时代的情报学变革被引量:67
- 2015年
- 大数据在情报学领域的发展与应用,给情报学研究与实践带来巨大的挑战。传统情报学面临着更加复杂的数据网络、多样化的数据分析方法、精准化的用户需求及有针对性的结果呈现。本文通过研究大数据在各个领域尤其是知识领域的发展现状,分析了大数据环境下情报学面临的挑战与机遇,提出了大数据范式下情报学变革的体系框架,并从信息资源内容构成、信息组织方式、情报分析方法及服务功能拓展四个方面诠释了大数据环境下情报学新的核心内涵。
- 曾建勋魏来
- 关键词:大数据情报学