王文娟
- 作品数:3 被引量:40H指数:3
- 供职机构:中国科学院大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:文化科学社会学经济管理更多>>
- 基于就业市场需求的我国情报人才培养探讨被引量:12
- 2017年
- [目的/意义]研究当前就业市场对情报的需求情况,探讨情报学研究生的就业方向,为情报学人才培养机构及研究生提供应对策略和建议。[方法/过程]使用爬虫技术获取中文招聘网站中与情报有关的招聘信息,采用文本处理和统计分析方法从企业维度和职位信息维度对当前就业市场中关于情报和情报学专业的需求进行对比分析。[结果/结论]发现我国就业市场中各行各业存在大量的情报需求,对情报学的认知偏低,与情报学研究生就业范围的局限形成明显对比。[局限]数据获取样本范围为三大综合性招聘网站,时间跨度为两个月,后续研究应当增加研究的样本。
- 王文娟马建霞
- 关键词:情报学招聘广告文本挖掘
- 引文文本分类与实现方法研究综述被引量:16
- 2016年
- [目的 /意义]对引文文本分类的标准、实现方法和应用进行梳理,分析存在的问题,提出可改进的方向。[方法/过程]总结目前引文文本分类的几个重要角度,如基于引用功能、基于情感倾向、基于引文影响力等,对引文文本分类的实现方法进行比较,分析其优缺点。[结果 /结论]目前引文文本没有统一的分类标准和实现方法,引文文本的获取较为困难,计算机分类算法准确率较低,中文引文文本分析文献少。未来研究思路和方向应该是:统一文本分类的标准,提高引文文本计算机处理技术的准确性,扩大应用范围。
- 王文娟马建霞陈春张凌波
- 关键词:引文分析
- 基于LDA的科研项目主题挖掘与演化分析——以NSF海洋酸化研究为例被引量:12
- 2017年
- [目的/意义]基于当前对科研项目的研究主要以数据统计和计量分析为主,以NSF资助的海洋酸化相关研究的项目数据为例,从项目主题的角度研究科研立项的重点和演化,并对未来投入趋势加以预测。[方法/过程]使用LDA主题模型对该研究的主题进行分析,计算主题强度分析演化过程,统计NSF申请书项目与支撑发表的核心论文主题强度之间的相关性,进而分析NSF海洋酸化项目的主题发展趋势。[结果/结论]发现LDA模型可以很好的发现海洋酸化的主要研究主题,且NSF资助的科研项目与支撑发表论文的主题演化规律具有一致性。使用的方法对科研资助机构资助的项目从主题的角度进行分析,研究国家科研机构资助项目的主题布局和变化趋势,对国家科技部门或机构的项目发展部署和规划具有一定的参考和支撑作用。
- 王文娟马建霞
- 关键词:LDA海洋酸化