王秉卿
- 作品数:5 被引量:3H指数:1
- 供职机构:复旦大学更多>>
- 发文基金:国家自然科学基金国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术语言文字文化科学更多>>
- 机器学习的查询扩展在博客检索中的应用被引量:1
- 2008年
- 该文介绍一种新的查询扩展方法,该方法结合了查询扩展技术和机器学习理论。通过机器学习的方法挑选出查询扩展词,以此提高检索结果的性能。对于输入的查询项,首先通过伪反馈技术生成候选扩展词集合,然后使用支持向量机对输入的候选词评分,挑选得分较高的候选词和原始查询项组成一个新的查询项。由于训练这个支持向量机的训练数据较难获得,我们利用评测会议的检索结果和检索工具自动地生成训练数据。这套查询扩展方法的优点在于通过对训练语料的学习,能够对候选扩展词作出更合理的选择。在TREC评测会议组织的观点检索任务中,相对于不采用任何扩展技术的基准系统,该方法提高了MAP指标33.1%。
- 王秉卿张奇吴立德黄萱菁
- 关键词:计算机应用中文信息处理信息检索查询扩展
- 机器学习的查询扩展在博客检索中的应用
- 本文介绍一种新的查询扩展方法。该方法将查询扩展工作纳入机器学习的框架下,首先伪反馈将生成原始查询项的候选扩展词集合,然后一个支持向量机将对这些候选词进行排序,形成一个优化的查询项,以此来提高最终检索结果的性能。由于此类方...
- 王秉卿张奇吴立德黄萱菁
- 关键词:文字处理信息检索数理语言学
- 文献传递
- 基于机器学习的查询优化研究
- 揭示用户的检索需求是文本检索中重要的研究课题。当前有诸多问题函待解决,例如有些查询“词不达义”,致使相关文档因为和查询词不匹配所以无法被检索出来;有时,多个查询词之间需要“分清主次”,这样就需要系统给各个查询词赋予权重,...
- 王秉卿
- 关键词:查询优化线性分类器
- 基于线性模型的查询扩展方法
- 查询反馈是通过分析反馈文档来更改原始查询项。检索词在检索公式中的权重直接影响检索结果的质量,但是缺乏可靠的依据来设置检索词权重。本文将检索看作是一个二分类问题,在线性模型的框架下,把检索词的权重设置转化为线性分类模型中的...
- 王秉卿黄萱菁
- 关键词:语言模型
- 文献传递
- 基于线性模型的查询扩展方法
- 查询反馈是通过分析反馈文档来更改原始查询项。检索词在检索公式中的权重直接影响检索结果的质量,但是缺乏可靠的依据来设置检索词权重。本文将检索看作是一个二分类问题,在线性模型的框架下,把检索词的权重设置转化为线性分类模型中的...
- 王秉卿黄萱菁
- 文献传递