教育部人文社会科学研究基金(07JA870006) 作品数:20 被引量:307 H指数:7 相关作者: 成颖 孙建军 郑彦宁 潘云涛 李宝强 更多>> 相关机构: 南京大学 中国科学技术信息研究所 青岛理工大学 更多>> 发文基金: 教育部人文社会科学研究基金 国家社会科学基金 江苏省普通高校研究生科研创新计划项目 更多>> 相关领域: 文化科学 自动化与计算机技术 更多>>
基于相关性判据的学术信息检索系统成功模型实证分析 被引量:4 2011年 围绕面向相关性判据的学术信息检索系统成功模型(AIRSSM),采用结构方程模型进行实证分析。研究结果显示在学术信息检索系统的分析与设计中需要关注三个方面:(1)系统质量与信息质量导向;(2)均衡考虑系统质量的各影响因素;(3)权威性、完整性、实时性以及有效性不可或缺。 成颖关键词:结构方程模型 面向学术新人的相关性判据研究—基于本科课程论文的内容分析 被引量:3 2011年 本文探讨了两个问题:其一是学术新人的相关性判据,其二是影响用户相关性判断的文献特征。在4个年级学生相关性判据文本的基础上,运用内容分析法解析出了包括传播特征、文献内容、情境、文献使用、系统特征、愉悦感知、文献质量、文献总体以及文献特征等9类相关性判据;针对第二个问题,解析出了包括参考文献、出版单位、出版时间、关键词、基金、篇幅、全文、题名、文献格式、文摘、语种、文献类型、来源期刊、作者以及机构等在内的15个文献特征。论文结合每类判据提出了针对学术信息检索系统的改进意见。 成颖关键词:学术新人 网络舆情监测及预警指标体系研究综述 被引量:42 2011年 网络舆情监测与预警日益受到政府部门和企事业单位的重视。现有的网络舆情监测与预警指标体系分别从传播学、公共管理以及信息科学的角度对网络舆情的传播特性、主题特征、内容价值等方面进行了揭示,提炼出了网络舆情的大部分监测点。不过深入的分析也发现部分指标体系存在缺乏深度、难以评估,指标体系不完整,缺乏受众倾向等关键要素等问题。 王青 成颖 巢乃鹏关键词:网络舆情 指标体系 预警 基于相关性判据的学术信息检索系统成功模型建构 被引量:7 2011年 基于相关性判据研究成果、学术信息检索系统特征调研成果、信息系统成功模型(ISSM)以及TEDS模型构建面向相关性判据的学术信息检索系统成功模型,对模型中的关系进行简要分析,并提出研究假设。 成颖情报学研究反思——从信息与情报的概念视角思考 被引量:8 2011年 首先辨析了信息与情报的概念,指出从情报学科研究需要出发,对情报的理解要遵从约定俗成的看法以及信息应从三层次来理解;接着从信息与情报的翻译问题反思造成当前情报学与信息科学之间的研究界限混淆现状的原因,并提出解决的可行途径。 成颖 孙建军 柯青关键词:情报学 信息科学 情报 面向性别差异与任务复杂性的相关性判据研究 被引量:5 2011年 通过194名研究对象相关性判断文本的内容分析,探讨任务复杂性与性别对相关性判据选择的影响。通过spearman相关系数检验发现,任务复杂性对相关性判据的选择存在显著影响;而性别仅仅对文献总体、作者和文献类型三类判据的选择存在影响,总体而言影响甚微。该结论提示检索系统的分析和设计需要考虑任务复杂性的影响,而无需考虑性别的差异。 成颖关键词:判据 性别 一种基于引用上下文和引文网络的相关反馈算法 被引量:3 2012年 相关反馈是一种根据用户或系统的相关性判断重构初始检索提问的方法,已被证明可以有效地改进检索效果。具体到学术文献,其引用关系表征了文献内容上的相关性,因而可以为相关反馈提供有价值的辅助信息。本文提出了一种基于引用上下文、文献同被引和文献耦合的相关反馈改进算法。该算法的基本思想包括:利用学术文献的引用上下文信息扩充词包模型(bags of words)进行文本表示;在相关文献判断阶段利用相关文献在引文网络中与其他文献的同被引强度和耦合强度扩充相关文献集合;结合基于聚类的相关反馈思想抽取查询扩展项。实验证明该算法提高了相关反馈效果。此外,相关分析的结果表明文献同被引以及文献耦合强度与文献内容相似度具有显著的相关性。 吴夙慧 成颖 郑彦宁 潘云涛关键词:聚类 基于N元语法的英文学术文献聚类标签抽取算法 被引量:4 2011年 提出一种基于N元语法的英文学术文献聚类标签抽取算法,该算法利用N元语法在大规模语料库上进行先期学习生成领域短语词表,再通过K-means算法进行聚类,从聚簇中抽取N元语法项计算TFIDF值,对出现在词表中的特征项赋以更高的权值,以得分最高的特征项作为聚类标签。实验结果表明,该算法能获得更好的实验效果。同时,在抽取聚类标签时提出一种改进的TFIDF权重计算,在评价标签质量时提出一种新的标签评价方法R@N方法。 吴夙慧 成颖 郑彦宁 潘云涛关键词:N元语法 文本聚类中文本表示和相似度计算研究综述 被引量:23 2012年 围绕文本聚类中的文本表示和相似度计算两个基本的问题,对目前学界提出的文本表示方法和相似度计算方法进行了分类和较为全面的综述,将文本表示模型分为向量空间模型、语言模型、后缀树模型、本体等,相似度计算方法分为基于向量空间模型的相似度计算,基于短语的相似度计算方法和基于本体的相似度计算方法。 吴夙慧 成颖 郑彦宁 潘云涛关键词:文本聚类 文本表示 相似度计算 基于关联理论的信息检索相关性研究——信息生产、标引 被引量:8 2010年 文摘:在Saracevic以及Harter研究的基础上,提出了将语言学中的关联理论作为相关性研究的理论基础,并利用关联理论具体阐释了信息检索交互模型中的信息生产以及信息标引两项工作。 成颖 孙建军 李宝强关键词:信息检索