教育部人文社会科学研究基金(11YJC870001)
- 作品数:5 被引量:22H指数:4
- 相关作者:安新颖李勇赵迎光钱庆洪娜更多>>
- 相关机构:中国医学科学院北京协和医学院更多>>
- 发文基金:教育部人文社会科学研究基金国家科技支撑计划国家自然科学基金更多>>
- 相关领域:医药卫生自动化与计算机技术文化科学更多>>
- 研究前沿识别方法探析被引量:5
- 2015年
- 总结研究前沿的识别方法,包括基于文献计量学的识别方法和基于计算机的自动、半自动化方法,指出各自的优缺点,提出研究前沿识别应利用语义网络等工具向更深的粒度、更高的准确度方向发展。
- 宫小翠赵迎光安新颖
- 关键词:文献计量学LDA网络主题
- 基于文本挖掘的乳腺癌相关蛋白研究前沿探析
- 1前言科学领域的发展都伴随着前沿知识的产生、发展、成熟、平稳、衰退。从浩瀚的知识海洋中识别前沿知识发现其演化规律可以帮助科研人员及时、准确的发现研究领域潜在的知识,帮助决策人员发现有发展潜力的知识,制定相应的策略。研究前...
- 宫小翠赵迎光安新颖
- 文献传递
- 中文非相关文献知识发现系统CmedLBKD构建被引量:5
- 2012年
- 针对现有非相关文献知识发现系统存在的问题,开展主题概念抽取、概念修剪和排序算法等关键技术问题的研究,构建中文非相关文献知识发现系统CmedLBKD,采用Swanson提出的经典假设"偏头痛"和"镁"验证CmedLBKD系统的有效性,同时提出了系统存在的问题及将来发展的方向。
- 钱庆洪娜李勇安新颖
- 关键词:非相关文献知识发现信息系统知识挖掘
- 基于LDA的主题演化研究被引量:6
- 2013年
- 通过监测主题在不同时间窗口内的变化趋势进行主题演化分析,在各时间窗口中分别建立LDA模型,采用Gibbs抽样方法求解LDA模型中的潜在变量,利用Kullback-Leibler距离来衡量主题之间的相似度,利用改进的Z-Score方法计算主题随时间的偏移程度以反映其演化情况。
- 李勇安新颖
- 关键词:主题模型
- 一种基于生命周期理论的文献热点发现方法——以肿瘤领域为例被引量:4
- 2012年
- 针对文献热点发现方法存在的指标单一、高频常用词过滤效果不明显等问题,将TDT领域的生命周期理论和TF*PDF方法应用到文献热点发现中,通过跟踪词在时间上的变化率来发现热点词,并确定热点出现的具体时间。实验结果表明,该方法能够有效过滤掉高频常用词,对各时间窗内的研究热点有较高的识别率。
- 赵迎光安新颖李勇贾晓峰
- 关键词:生命周期理论文本挖掘
- 基于双聚类方法的乳腺癌相关酶研究前沿被引量:2
- 2016年
- 以2009-2011年和2012-2014年Pub Med收录的乳腺癌相关酶研究的文献为数据源,利用TDA进行数据清洗、实体抽取和构建共词矩阵;利用g CLUTO进行双聚类,形成类团,识别研究前沿热点;利用相关算法识别出类团的演化关系。
- 宫小翠赵迎光安新颖
- 关键词:乳腺癌