杨丽华
- 作品数:2 被引量:4H指数:1
- 供职机构:河北大学数学与计算机学院更多>>
- 发文基金:河北省教育厅科学技术研究计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于启发式规则的Deep Web接口发现被引量:4
- 2010年
- 为了有效地利用Deep Web资源,Deep Web数据集成成为当前研究的热点之一.能否高效地发现Deep Web站点是Deep Web数据集成的基础和关键.在此,提出了一种Deep Web接口发现方法,包括基于领域知识来确定合适的查询提交词和用启发式规则发现领域内Deep Web接口.实验结果表明,该方法达到了较高的准确率和召回率,具有良好的可行性和实用性.
- 杨丽华袁方姚增利王煜
- 关键词:领域知识启发式规则DEEP
- 基于规则的Deep Web查询接口的抽取
- 2010年
- 以网上书店为例,基于所发现的DeepWeb数据源,针对其查询接口,提出了一种基于领域知识的DeepWeb接口抽取方法,该方法采用正则表达式的规则提取查询接口,包括与控件相邻的文本语义词汇的提取和控件的提取,然而部分查询接口抽取出的文本语义信息比较繁琐,需借助页面中的字体颜色等特征,过滤非需要的信息,达到文中的目标。该方法获得了较好的结果,具有良好的可行性和实用性。
- 杨丽华
- 关键词:领域知识正则表达式