您的位置: 专家智库 > >

天津市科技发展战略研究计划项目(07JCZDJC067007)

作品数:2 被引量:6H指数:2
相关作者:史庆伟鲍虎赵政更多>>
相关机构:天津大学更多>>
发文基金:天津市科技发展战略研究计划项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 1篇信息抽取
  • 1篇置信度
  • 1篇条件随机域
  • 1篇拟牛顿法
  • 1篇牛顿法
  • 1篇文本挖掘
  • 1篇聚类
  • 1篇聚类方法
  • 1篇类方
  • 1篇关联规则
  • 1篇WEB
  • 1篇WEB信息
  • 1篇WEB信息抽...
  • 1篇层次聚类
  • 1篇层次聚类方法
  • 1篇抽取

机构

  • 2篇天津大学

作者

  • 2篇赵政
  • 2篇鲍虎
  • 2篇史庆伟

传媒

  • 2篇辽宁工程技术...

年份

  • 2篇2007
2 条 记 录,以下是 1-2
排序方式:
基于条件随机域的Web信息抽取被引量:4
2007年
为了获取隐藏在Internet中的信息,基于条件随机域模型(CRF),提出了一种Web信息抽取的方法。该方法对网页样本中的每一行加注标签,确定文本特征,建立条件随机域模型,采用拟牛顿迭代方法对样本进行训练,参照学习得到的条件概率分布模型,实现网页搜索结果的抽取。与HMM模型相比,CRF模型支持网页文本的语言特征,抽取准确率高。实验结果表明,使用CRF模型的抽取准确率达到90%以上,高于使用HMM模型的抽取准确率。
史庆伟赵政鲍虎
关键词:条件随机域信息抽取拟牛顿法
基于全置信度关联分析的web层次聚类方法被引量:2
2007年
为了便于用户浏览网页信息,基于全置信度关联分析,提出了一种网页层次聚类的方法。该方法采用向量空间模型表示网页文档,将文档看成事务,文档的词汇视为事务中的项,根据关联挖掘算法发现文档之间的强关联规则产生基本类,然后利用图划分的算法完成网页文档的层次聚类。在关联规则产生过程中采用全置信度量发现强关联模式,规则的产生不受支持度阈值设置的影响,即使支持度阈值设置为零,也能发现强关联模式,有效地消除了弱相关的交叉支持模式。
史庆伟赵政鲍虎
关键词:关联规则层次聚类文本挖掘
共1页<1>
聚类工具0