朱海丰
- 作品数:3 被引量:5H指数:2
- 供职机构:河南工业大学更多>>
- 发文基金:郑州市科技攻关计划项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于链接信息的网页分类算法被引量:1
- 2012年
- 为了提高网页文本分类的准确性.克服传统的文本分类算法易受网页中虚假、错误信息的影响.提出一种基于链接信息的网页分类算法.通过对K近邻方法的改进.利用当前网页与其父网页的链接信息对网页实沲分类,用空间向量表示待分类网页的父链接信息。在训练集合中找到K篇与该网页链接信息向量最相似的网页,计算该网页所属的类别,通过实验与传统文本分类算法进行了对比,验证了该方法的有效性.
- 秦杰闫付亮朱海丰司群谢蕙
- 关键词:网页分类
- 基于Lucene与JSF的搜索引擎被引量:2
- 2008年
- Lucene是一个开源的全文搜索引擎工具,利用Lucene的API可以较为方便的创建一个全文搜索引擎。JSF(JavaServer Faces)是一种用于构建Web应用程序的新标准Java框架。它提供了一种以组件为中心来开发Web程序的方法,从而简化了开发。本文将Lucene和JSF结合起来实现搜索引擎。
- 朱海丰秦杰
- 关键词:LUCENEJSF搜索引擎索引
- 基于本体的元搜索引擎4级结果处理算法被引量:2
- 2010年
- 提出一种基于本体的元搜索引擎4级结果处理算法.该算法结合用户的兴趣本体库,计算网页特征与本体库概念的语义相关度,把无相关性或相关性低的网页信息进行过滤.通过验证表明,该算法可以有效地加大无关信息的过滤量,提高了搜索引擎查询结果的相关性.
- 秦杰王春云谢蕙朱海丰
- 关键词:元搜索引擎本体用户模型