您的位置: 专家智库 > >

潘志舟

作品数:2 被引量:1H指数:1
供职机构:安徽科技学院理学院更多>>
发文基金:安徽省高等学校优秀青年人才基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 2篇引擎
  • 2篇搜索
  • 2篇搜索引擎
  • 2篇索引
  • 2篇爬虫
  • 2篇中文
  • 2篇中文搜索
  • 2篇中文搜索引擎
  • 2篇网络
  • 2篇网络爬虫
  • 1篇元搜索
  • 1篇元搜索引擎
  • 1篇可扩展
  • 1篇可扩展网络
  • 1篇扩展网络

机构

  • 2篇安徽科技学院

作者

  • 2篇赵靖
  • 2篇潘志舟
  • 1篇程振
  • 1篇钱吕见
  • 1篇梅芳婷

传媒

  • 1篇安阳师范学院...
  • 1篇安徽科技学院...

年份

  • 2篇2012
2 条 记 录,以下是 1-2
排序方式:
基于多中文搜索引擎的可扩展网络混合爬虫被引量:1
2012年
由于现在Web上的信息量变得越来越大,单个的搜索引擎不可能包括整个网络的信息资源,网络爬虫的能力,索引数据库的大小,系统维护开销等,都限制了一个搜索引擎的查全率。因此,设计一个统一的搜索引擎查询界面,并能快速智能合并查询结果是一个挑战。针对现有单个引擎搜索的限制,提出了基于行块的正文摘要提取方法和基于词频的相似度模型实现了一个可扩展的多WEB源的网络爬虫,将现各搜索引擎上的网页信息进行抽取,过滤、去重、排序、信息重组,可以获得更全面更符合人们需要的、个性化的数据结果。系统的测试结果表明我们的方法是比较有效的。
潘志舟赵靖
关键词:元搜索引擎网络爬虫搜索引擎
多中文搜索引擎的联合网络爬虫及LUCENCE实现
2012年
由于现在Web上的信息量变得越来越大,单个的搜索引擎不可能包括整个网络的轨迹,网络爬虫的能力,索引数据库的大小,系统维护开销等,都限制了一个搜索引擎的查全率。因此,用户必须尝试用所有搜索引擎去找出他所要的信息。最坏的是每个引擎互相覆盖,用户会重复发现一条信息。针对现有单个引擎搜索的限制,论文提出了针对多Web源的网络爬虫的实现,将现有搜索引擎上的网页信息进行抽取,过滤、去重、排序,进行信息重组,可以获得更全面更符合人们需要的、个性化的数据结果。
赵靖潘志舟梅芳婷程振钱吕见
关键词:网络爬虫搜索引擎
共1页<1>
聚类工具0