您的位置: 专家智库 > >

王秉卿

作品数:5 被引量:3H指数:1
供职机构:复旦大学更多>>
发文基金:国家自然科学基金国家教育部博士点基金更多>>
相关领域:自动化与计算机技术语言文字文化科学更多>>

文献类型

  • 3篇会议论文
  • 1篇期刊文章
  • 1篇学位论文

领域

  • 4篇自动化与计算...
  • 1篇文化科学
  • 1篇语言文字

主题

  • 5篇查询
  • 2篇信息检索
  • 2篇查询扩展
  • 1篇信息处理
  • 1篇语言模型
  • 1篇语言学
  • 1篇数理语言学
  • 1篇中文
  • 1篇中文信息
  • 1篇中文信息处理
  • 1篇字处理
  • 1篇文字处理
  • 1篇线性分类器
  • 1篇聚类
  • 1篇计算机
  • 1篇计算机应用
  • 1篇分类器
  • 1篇查询优化

机构

  • 5篇复旦大学

作者

  • 5篇王秉卿
  • 4篇黄萱菁
  • 2篇张奇
  • 2篇吴立德

传媒

  • 1篇中文信息学报
  • 1篇第四届全国学...
  • 1篇第五届全国信...

年份

  • 1篇2012
  • 2篇2009
  • 2篇2008
5 条 记 录,以下是 1-5
排序方式:
机器学习的查询扩展在博客检索中的应用被引量:1
2008年
该文介绍一种新的查询扩展方法,该方法结合了查询扩展技术和机器学习理论。通过机器学习的方法挑选出查询扩展词,以此提高检索结果的性能。对于输入的查询项,首先通过伪反馈技术生成候选扩展词集合,然后使用支持向量机对输入的候选词评分,挑选得分较高的候选词和原始查询项组成一个新的查询项。由于训练这个支持向量机的训练数据较难获得,我们利用评测会议的检索结果和检索工具自动地生成训练数据。这套查询扩展方法的优点在于通过对训练语料的学习,能够对候选扩展词作出更合理的选择。在TREC评测会议组织的观点检索任务中,相对于不采用任何扩展技术的基准系统,该方法提高了MAP指标33.1%。
王秉卿张奇吴立德黄萱菁
关键词:计算机应用中文信息处理信息检索查询扩展
机器学习的查询扩展在博客检索中的应用
本文介绍一种新的查询扩展方法。该方法将查询扩展工作纳入机器学习的框架下,首先伪反馈将生成原始查询项的候选扩展词集合,然后一个支持向量机将对这些候选词进行排序,形成一个优化的查询项,以此来提高最终检索结果的性能。由于此类方...
王秉卿张奇吴立德黄萱菁
关键词:文字处理信息检索数理语言学
文献传递
基于机器学习的查询优化研究
揭示用户的检索需求是文本检索中重要的研究课题。当前有诸多问题函待解决,例如有些查询“词不达义”,致使相关文档因为和查询词不匹配所以无法被检索出来;有时,多个查询词之间需要“分清主次”,这样就需要系统给各个查询词赋予权重,...
王秉卿
关键词:查询优化线性分类器
基于线性模型的查询扩展方法
查询反馈是通过分析反馈文档来更改原始查询项。检索词在检索公式中的权重直接影响检索结果的质量,但是缺乏可靠的依据来设置检索词权重。本文将检索看作是一个二分类问题,在线性模型的框架下,把检索词的权重设置转化为线性分类模型中的...
王秉卿黄萱菁
关键词:语言模型
文献传递
基于线性模型的查询扩展方法
查询反馈是通过分析反馈文档来更改原始查询项。检索词在检索公式中的权重直接影响检索结果的质量,但是缺乏可靠的依据来设置检索词权重。本文将检索看作是一个二分类问题,在线性模型的框架下,把检索词的权重设置转化为线性分类模型中的...
王秉卿黄萱菁
文献传递
共1页<1>
聚类工具0