吴志祥
- 作品数:9 被引量:66H指数:6
- 供职机构:南京大学更多>>
- 发文基金:国家社会科学基金江苏省“333”工程基金项目江苏省自然科学基金更多>>
- 相关领域:文化科学自动化与计算机技术经济管理更多>>
- 中文专利术语层次关系解析研究被引量:7
- 2017年
- 对非结构化专利文本中的领域术语进行抽取以及语义关系的解析是挖掘蕴藏在专利文献中的丰富知识,并进行深入应用的前提。本文在领域专利术语有效抽取的基础上,探讨并实现较大规模术语层次关系的解析,构建了含有层次关系的领域知识本体。着重研究了基于位置加权的术语语义空间构建方法,基于主成分分析降维技术进行术语分布可视化以辅助聚类类目的确定方法以及术语层次关系结构中非重复性类目标签的抽取方法。本文工作尽可能实现了较大规模中文专利术语层次关系解析的自动化进行,为术语非层次关系解析以及基于术语语义关系解析的深入应用打下基础。
- 吴志祥王昊王密平
- 关键词:位置加权本体学习
- 中文专利术语语义关系解析研究——以钢铁治金领域为例
- 专利文献资源是我国经济发展与经济安全的战略性资源,专利文献中蕴藏着丰富的科学技术信息。对专利文献进行多样化研究分析,一直是图书情报学科重要的研究领域和研究热点。从总的研究趋势来看,深入专利文本,对专利内容进行多角度、深层...
- 吴志祥
- 关键词:本体学习奇异值分解
- 我国学位论文利用现状分析被引量:9
- 2015年
- 文章通过统计中国知网数据库以及国家统计局相关数据,对比分析了2009~2013年我国学位论文的产出与收录情况。通过分析不同高校、不同学科环境下学位论文的引用、下载等数据,阐述了我国学位论文目前的开放使用程度对其利用的影响。从而指出我国今后应在学位论文资源共享服务的组织模式、技术支撑和管理体制上不断变革,不断完善。
- 蒋伟伟吴志祥
- 关键词:学位论文文献计量学
- 国际顶级学术期刊《Nature》的发展轨迹及启示被引量:25
- 2015年
- 国际顶级学术期刊《Nature》146年的发展轨迹,诠释了学术期刊厚积薄发的发展规律。持之以恒和与时俱进是《Nature》宝贵而优秀的基因。文章以定性和定量的方式,从文献计量学的视角、人文的视角和国际化的视角三个层面分析和研究《Nature》的发展轨迹,并与我国一流学术期刊《科学通报》进行对比分析,在此基础上提出了一些针对我国学术期刊发展的启示和建议。
- 吴志祥苏新宁
- 关键词:《NATURE》文献计量学
- 基于奇异值分解的专利术语层次关系解析研究被引量:6
- 2017年
- 奇异值分解是矩阵分析中常用的分解技术,在高维数据的降维、去噪方面有着广泛的应用。本文将矩阵的奇异值分解技术应用到领域专利术语的层次关系解析中,其核心思想是术语语义空间的深度转换,旨在用某种潜在特征代替文档作为属性来表示术语。具体研究包括,基于位置加权的原始术语-文档语义空间的构建方法、基于奇异值分解的术语特征抽取方法、基于术语-特征语义空间的术语层次关系解析方法。本文对论述的理论方法进行了实证研究,证实了该方法的可行性和有效性,并在此基础上实现较大规模的钢铁冶金领域专利术语层次关系解析,将解析结果纳入到本体学习理论体系中,实现该领域专利术语的知识本体化与可视化。
- 吴志祥王昊王雪颖祁磊苏新宁
- 关键词:本体学习
- 我国体育人文社会学引用概况分析被引量:1
- 2014年
- 我们以《中文社会科学引文索引》(CSSCI)为数据源,统计分析2002年-2011年我国体育人文社会学引用文献的语种和文献类型,从定量的角度考察我国体育人文社会学的开放性和成长性特征。通过对比分析,考察体育人文社会学的发展状况和学科地位。以期为后续研究提供参考。
- 吴志祥王子朴梁金辉
- 关键词:引文分析引文语种CSSCI
- 2007-2011年我国图书情报领域本体研究论文计量分析被引量:6
- 2015年
- 以CNKI收录的图书情报领域19种核心期刊为范围,收集2007-2011五年内有关本体研究论文的题录信息。运用传统的文献统计方法,从论文数量、论文期刊分布、基金支持、发文单位、作者合作、核心作者等多个角度分析图书情报领域本体研究现状;运用社会网络分析方法和工具,对本体研究论文的关键词进行共词分析,从高频关键词、网络中心性、关键词聚类等角度,探讨本体领域的研究重点和研究方向。
- 吴志祥王昊姜霖
- 关键词:图书情报领域本体统计分析社会网络分析
- 苏南新农村信用建设研究——以吴江市为个案
- 本文是在新农村建设背景下,在借鉴前人研究成果的基础上,对我国农村,特别是对苏南农村信用建设问题的成因、表现形式及实现路径进行了系统的分析和探讨。本文运用新制度经济学、公共管理理论以及金融学、社会学、历史学等理论,采用经验...
- 吴志祥
- 基于CRFs的冶金领域中文专利术语抽取研究被引量:13
- 2016年
- 【目的】探讨冶金领域中文专利术语抽取模型的最优条件,用于有效地抽取冶金领域专利术语。【方法】使用尚不完善的核心语料库,在无需人工标引的情况下,采用条件随机场(CRFs)构建字角色标注的冶金领域中文专利术语识别模型。详细说明模型的构建过程,同时重点对比CFRs的各个因素(特征组合、字长窗口等)对识别效果的影响。【结果】实验结果表明字序列、级别特征、领域特征、温度特征的组合在字长窗口为3,c等于1,f等于1时,准确率达到94.26%,召回率达到94.37%,F1值达到94.5%。【局限】核心词典欠完善,使得部分词语标注不够准确;未与其他方法作详细比较,未详细说明CRFs的可靠性。【结论】CRFs在适当的角色和特征以及特征模板的组合下能较好地识别出冶金领域的中文专利术语。
- 王密平王昊邓三鸿吴志祥
- 关键词:条件随机场术语抽取