李树友
- 作品数:2 被引量:3H指数:1
- 供职机构:辽宁工业大学数理科学系更多>>
- 发文基金:辽宁省教育厅高等学校科学研究项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 语义相似的PageRank改进算法被引量:3
- 2009年
- PageRank算法是一种用于网页排序的算法,它利用网页间的相互引用关系评价网页的重要性。但由于它只考虑网页与网页之间的链接结构,忽略了网页与主题的相关性,容易造成主题漂移现象。在分析了原PageRank算法基础上,给出了一种基于语义相似度的PageRank改进算法。该算法能够按照网页结构和网页主要内容计算出网页的PageRank值,既不会增加算法的时空复杂度,又极大地减少了"主题漂移"现象,从而提高查询效率和质量。
- 何明周军李树友
- 关键词:PAGERANK算法主题漂移语义相似度
- 基于相似度量矩阵HITS的改进算法
- 2010年
- HITS算法是基于超链接结构的搜索引擎算法,但它对超链接不加以区分,容易产生"主题漂移"现象.改进后的HITS算法在原算法的基础上,提出了相似度量的迭代方法.该方法是将网页超链接结构信息、文本信息、联合引用信息结合成一个相似度量权重矩阵,通过权重矩阵来归一HITS算法每次产生的Authority、Hub值.在查询效率和质量方面,改进的HITS算法更优,也减少了"主题漂移"现象的发生.
- 何明周军纪周鹏李树友
- 关键词:HITS算法主题漂移相似度量