您的位置: 专家智库 > >

杨舟

作品数:5 被引量:9H指数:1
供职机构:苏州大学计算机科学与技术学院智能化信息处理技术研究所更多>>
发文基金:国家自然科学基金江苏省基础研究计划江苏省重大科技支撑与自主创新项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 5篇中文期刊文章

领域

  • 5篇自动化与计算...

主题

  • 2篇信息抽取
  • 2篇WEB
  • 2篇DEEP
  • 2篇DEEP_W...
  • 2篇抽取
  • 1篇信息集成
  • 1篇增量式
  • 1篇数据抽取
  • 1篇数据源
  • 1篇数据源选择
  • 1篇随机场
  • 1篇条件随机场
  • 1篇爬虫
  • 1篇取模
  • 1篇自动标注方法
  • 1篇领域本体
  • 1篇本体
  • 1篇TF-IDF
  • 1篇WEB信息
  • 1篇WEB信息抽...

机构

  • 5篇苏州大学
  • 4篇江苏省现代企...

作者

  • 5篇崔志明
  • 5篇杨舟
  • 5篇卓林
  • 5篇赵朋朋
  • 3篇岳亮

传媒

  • 3篇苏州大学学报...
  • 2篇计算机工程

年份

  • 4篇2011
  • 1篇2010
5 条 记 录,以下是 1-5
排序方式:
Deep Web爬虫的一种增量式更新策略被引量:1
2011年
为了在网络及计算机硬件等资源有限的前提下,最大限度地保证本地副本的"新鲜"程度,往往需要为Deep Web爬虫定制一个重爬机制。为了满足这种需求,提出了一种基于采样的增量式Deep Web更新方法,使用贪心策略分配爬虫资源,以最大限地的提高资源利用率。经实验验证,该方法取得了比较优异的结果。
卓林杨舟岳亮赵朋朋崔志明
关键词:DEEPWEB
一种基于领域本体的Deep Web数据自动标注方法
2011年
为了准确全面地对Deep Web查询结果页面的数据进行语义标注,将领域本体作为Web数据库所应遵循的全局模式引入到语义标注的研究中,通过建立起接口模式、结果模式与本体间的映射来实现数据的自动语义标注。针对多个不同领域的Web数据库进行实验测试,证明了该方法是有效的。
杨舟岳亮卓林赵朋朋崔志明
关键词:DEEPWEB本体
基于二维混合条件随机场的Web记录抽取模型
2011年
提出一种基于混合二维条件随机场的Web记录抽取模型,以克服线性链条件随机场不能充分利用Web实体间二维依赖关系的缺点,且训练条件随机场模型时无需大量手工标注的样本数据。对当当网上的742个数据记录进行抽取,对比同等情况下的其他模型。实验结果表明,混合二维条件随机场模型在抽取TDS数据集时展现了更优越的性能。
卓林杨舟赵朋朋崔志明
关键词:条件随机场信息抽取
一种针对商品数据记录的自动抽取方法被引量:8
2010年
提出一种针对电子商务网站商品列表页数据记录的自动抽取方法。该方法根据商品记录的特点,通过商品记录中商品的文本、图片以及布局等节点类型信息计算节点对应的值,依据节点值的相似度对节点进行分组,再从不同分组中过滤出包含数据记录节点的集合,从而抽取整个页面的数据记录。实验结果证明该方法有效且抽取效率较高。
杨舟卓林赵朋朋崔志明
关键词:WEB信息抽取数据抽取信息集成
一种面向Deep Web集成服务的查询结果动态排序方法
2011年
Deep Web集成服务的快速发展,方便了用户对Deep Web信息检索需求。如何提高查询结果的排序效果,将最接近用户查询的结果显示给用户,逐渐成为研究重点。提出了一种综合评判方法,从数据源质量、查询相关度以及查询响应反馈三个方面,综合计算出查询结果的评价分值,并用于查询结果排序,具有较好的可行性和有效性。
岳亮杨舟卓林赵朋朋崔志明
关键词:数据源选择TF-IDF
共1页<1>
聚类工具0