您的位置: 专家智库 > >

杨丽华

作品数:2 被引量:4H指数:1
供职机构:河北大学数学与计算机学院更多>>
发文基金:河北省教育厅科学技术研究计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 2篇领域知识
  • 2篇DEEP_W...
  • 1篇正则
  • 1篇正则表达式
  • 1篇启发式规则
  • 1篇接口
  • 1篇DEEP
  • 1篇查询
  • 1篇查询接口
  • 1篇抽取

机构

  • 2篇河北大学

作者

  • 2篇杨丽华
  • 1篇袁方
  • 1篇王煜
  • 1篇姚增利

传媒

  • 1篇河北大学学报...
  • 1篇电脑知识与技...

年份

  • 2篇2010
2 条 记 录,以下是 1-2
排序方式:
基于启发式规则的Deep Web接口发现被引量:4
2010年
为了有效地利用Deep Web资源,Deep Web数据集成成为当前研究的热点之一.能否高效地发现Deep Web站点是Deep Web数据集成的基础和关键.在此,提出了一种Deep Web接口发现方法,包括基于领域知识来确定合适的查询提交词和用启发式规则发现领域内Deep Web接口.实验结果表明,该方法达到了较高的准确率和召回率,具有良好的可行性和实用性.
杨丽华袁方姚增利王煜
关键词:领域知识启发式规则DEEP
基于规则的Deep Web查询接口的抽取
2010年
以网上书店为例,基于所发现的DeepWeb数据源,针对其查询接口,提出了一种基于领域知识的DeepWeb接口抽取方法,该方法采用正则表达式的规则提取查询接口,包括与控件相邻的文本语义词汇的提取和控件的提取,然而部分查询接口抽取出的文本语义信息比较繁琐,需借助页面中的字体颜色等特征,过滤非需要的信息,达到文中的目标。该方法获得了较好的结果,具有良好的可行性和实用性。
杨丽华
关键词:领域知识正则表达式
共1页<1>
聚类工具0