仲华
- 作品数:4 被引量:33H指数:3
- 供职机构:苏州大学计算机科学与技术学院智能化信息处理技术研究所更多>>
- 发文基金:教育部科学技术研究重点项目江苏省高技术研究计划项目国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种高效的Deep Web内容获取技术被引量:4
- 2008年
- 近几年,对Deep Web的研究和实践,尤其在商业领域已经有了一定实质性的成果。但在对网络数据库内容获取上仍处于起步阶段。就Deep Web数据库内容的获取展开研究,设计一种属性值图的方法,从图形角度对数据库内容遍历,最终获取DeepWeb内容。通过实验验证,证明该方法能有效地获取的大量Deep Web内容,用户可通过搜索引擎更方便快捷地查找,大大提高了索引的覆盖率和效率。
- 仲华崔志明
- 关键词:DEEPWEB网络数据库
- 关于中国Deep Web的规模、分布和结构被引量:22
- 2007年
- 随着Web数据库的广泛应用,Web正在加速的"深化",大量的高质量的信息隐藏在Deep Web中.基于IP采样的方法,对1,000,000个IP样本进行了分析统计,揭示了2006年初中国Deep Web的规模、分布和结构.主要结论包括有:1中国Deep Web查询接口往往位于站点浅层,94.6%的Deep Web查询接口出现在站点的前3层;2中国Deep Web大约有24,000个站点,28,000个Web数据库和74,000个查询接口;3中国Deep Web大部分是非结构化的,其中64%是非结构化的Web数据库;4中国Deep Web分布于多种不同的主题领域;5目前主要的中文搜索引擎已覆盖国内Deep Web大约二分之一的页面.
- 赵朋朋崔志明高岭仲华
- 关键词:DEEPWEBWEB数据库查询接口
- Deep Web模式获取技术研究与应用
- Internet快速地发展,见证了网络信息正在以前所未有的速率增长,其中很大一部分信息被“深藏”于各种各样的网络在线数据库中,用户只能通过向接口提交查询来获取信息,这类信息被称为Deep Web。Deep Web是一个新...
- 仲华
- 关键词:数据抽取垂直搜索数据集成
- 文献传递
- 基于XML的信息抽取和多层向量空间技术研究被引量:4
- 2007年
- 在分析了传统索引技术的缺陷的基础上,提出了一种基于XML架构信息抽取的多层向量空间的模型,重点阐述了如何建立一个基于XML的Web信息抽取平台,从构造知识库、网页优化和信息抽取这三方面进行研究,并阐述了基于XML的多层向量空间模型及其形成。通过这种技术不仅使网页内容得到了清晰的剖析和抽取,更能大大提高对Web网页文档检索效率和准确率。目的在于寻求一种更为高效简洁的检索方法。
- 仲华崔志明
- 关键词:XML架构信息抽取