您的位置: 专家智库 > >

彭学平

作品数:5 被引量:21H指数:2
供职机构:北京理工大学更多>>
发文基金:教育部“新世纪优秀人才支持计划”国家自然科学基金更多>>
相关领域:自动化与计算机技术理学更多>>

文献类型

  • 2篇期刊文章
  • 2篇专利
  • 1篇学位论文

领域

  • 3篇自动化与计算...
  • 1篇理学

主题

  • 2篇点击
  • 2篇点击流
  • 2篇语义相关
  • 2篇语义相关度
  • 2篇日志
  • 2篇去重
  • 2篇去重算法
  • 2篇网页
  • 2篇网页去重
  • 2篇网页去重算法
  • 2篇相关度
  • 2篇相关度计算
  • 2篇近似网页
  • 2篇交互能力
  • 2篇查询
  • 2篇查询日志
  • 2篇查询语义
  • 1篇电子病例
  • 1篇医院信息
  • 1篇医院信息化

机构

  • 5篇北京理工大学
  • 2篇北京航天飞行...

作者

  • 5篇彭学平
  • 4篇牛振东
  • 2篇曹玉娟
  • 2篇黄胜
  • 1篇江鹏
  • 1篇赵堃

传媒

  • 1篇软件学报
  • 1篇中国索引

年份

  • 1篇2013
  • 2篇2011
  • 1篇2009
  • 1篇2006
5 条 记 录,以下是 1-5
排序方式:
一种基于查询语义和点击流数据的查询建议方法
本发明涉及一种基于查询语义和点击流数据的查询建议方法,包括以下步骤:一、对收集的查询日志数据进行预处理;二、对用户输入的查询数据进行分词、过滤停用词的预处理;三、将用户查询数据串与查询日志库中日志信息逐条进行相似度计算;...
彭学平牛振东黄胜
文献传递
一种基于查询语义和点击流数据的查询建议方法
本发明涉及一种基于查询语义和点击流数据的查询建议方法,包括以下步骤:一、对收集的查询日志数据进行预处理;二、对用户输入的查询数据进行分词、过滤停用词的预处理;三、将用户查询数据串与查询日志库中日志信息逐条进行相似度计算;...
彭学平牛振东黄胜
基于HL7的医院信息化系统平台研究与实现
彭学平
关键词:HL7电子病例PACSLIS
一个基于特征向量的近似网页去重算法被引量:6
2009年
在搜索引擎的检索结果页面中,用户经常会得到内容相似的重复页面,它们中大多是由于网站之间转载造成的。为提高检索效率和用户满意度,提出一种基于特征向量的大规模中文近似网页检测算法DDW(Detect near—Duplicate Web Pages)。试验证明,比起其他网页去重算法(I—Match),DDW具有很好的抵抗噪声的能力及近似线性的时间和空间复杂度,在大规模实验中获得良好测试结果。
曹玉娟牛振东彭学平江鹏
关键词:网页去重算法特征向量近似网页支持向量机
基于概念和语义网络的近似网页检测算法被引量:15
2011年
在搜索引擎的检索结果页面中,用户经常会得到内容近似的网页.为了提高检索整体性能和用户满意度,提出了一种基于概念和语义网络的近似网页检测算法DWDCS(near-duplicate webpages detection based on concept and semantic network).改进了经典基于小世界理论提取文档关键词的算法.首先对文档概念进行抽取和归并,不但解决了"表达差异"问题,而且有效降低了语义网络的复杂度;从网络结构的几何特征对其进行分析,同时利用网页的语法和结构信息构建特征向量进行文档相似度的计算,由于无须使用语料库,使得算法天生具有领域无关的优点.实验结果表明,与经典的网页去重算法(I-Match)和单纯依赖词汇共现小世界模型的算法相比,DWDCS具有很好的抵抗噪声的能力,在大规模实验中获得了准确率>90%和召回率>85%的良好测试结果.良好的时空间复杂度及算法性能不依赖于语料库的优点,使其在大规模网页去重实际应用中获得了良好的效果.
曹玉娟牛振东赵堃彭学平
关键词:网页去重算法小世界网络近似网页均方差
共1页<1>
聚类工具0