2025年2月11日
星期二
|
欢迎来到滨州市图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
关冕
作品数:
2
被引量:5
H指数:2
供职机构:
山东大学计算机科学与技术学院
更多>>
发文基金:
山东省自然科学基金
山东省科技攻关计划
国家自然科学基金
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
马军
山东大学计算机科学与技术学院
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
期刊文章
1篇
学位论文
领域
2篇
自动化与计算...
主题
2篇
信息抽取
2篇
结构化数据
2篇
WEB论坛
2篇
WEB挖掘
2篇
抽取
1篇
基于实例学习
1篇
WEB信息
1篇
WEB信息抽...
1篇
抽取方法
机构
2篇
山东大学
作者
2篇
关冕
1篇
马军
传媒
1篇
山东大学学报...
年份
2篇
2010
共
2
条 记 录,以下是 1-2
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
针对Web论坛的一种结构化数据自动抽取方法
被引量:2
2010年
由于网页布局设计的复杂性和用户发表帖子的灵活性,从论坛网页中抽取结构化的数据是一项未能很好解决并非常具有挑战性的任务。本文提出了一种从任意的论坛站点中自动抽取结构化数据的通用解决方案,通过分析网页结构发现列表页和帖子页中的数据记录,并利用一组产生式规则从发现的数据记录中抽取结构化的数据。实验结果表明该方法在抽取论坛数据记录方面明显优于已有的方法,对论坛帖子的标题、作者、发表时间和内容文本块等元数据的抽取达到了较高的准确率。
关冕
马军
关键词:
结构化数据
信息抽取
WEB挖掘
Web论坛结构化数据抽取技术研究
随着国际互联网的日益普及和迅猛发展,论坛已成为网络上一个重要的数据源。它为人们提供了大量的关于各种题材的非常有价值的知识和信息。因此,近些年来越来越多的研究工作利用从论坛中抽取出来的信息建立各种网络应用。为了有效利用论坛...
关冕
关键词:
WEB信息抽取
结构化数据
基于实例学习
WEB挖掘
文献传递
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张