您的位置: 专家智库 > >

冯海波

作品数:2 被引量:1H指数:1
供职机构:中国石油大学(北京)更多>>
发文基金:国家科技重大专项更多>>
相关领域:自动化与计算机技术经济管理更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...
  • 1篇经济管理

主题

  • 1篇于字
  • 1篇指纹
  • 1篇数据库
  • 1篇数据库系统
  • 1篇数字指纹
  • 1篇网页
  • 1篇网页消重
  • 1篇向量
  • 1篇机器码
  • 1篇分布式
  • 1篇分布式数据
  • 1篇分布式数据库
  • 1篇分布式数据库...
  • 1篇MD5
  • 1篇MONGOD...

机构

  • 2篇中国石油大学...
  • 1篇中国石油天然...

作者

  • 2篇李洪奇
  • 2篇冯海波
  • 1篇张海勇
  • 1篇张伟

传媒

  • 1篇计算机工程与...
  • 1篇中国管理信息...

年份

  • 1篇2017
  • 1篇2014
2 条 记 录,以下是 1-2
排序方式:
基于MongoDB的特殊测井分布式数据库系统被引量:1
2014年
本文提出了一种基于MongoDB的分布式数据库系统来解决存储系统对于稳定性、可靠性、高效性、易扩展性的需求。MongoDB是一种介于关系数据库和非关系数据库之间,面向文档存储类型的分布式文件存储数据库。在油田测井数据磁带文件存储管理系统中的实际运行测试结果表明,该系统表现稳定、高效,可以很好地完成原始测井数据维护工作。
张海勇冯海波李洪奇
关键词:MONGODB分布式
基于字集特征向量的网页消重改进算法
2017年
基于MD5算法计算数字指纹的网页消重算法简单而高效,在网页消重领域应用比较广泛。但是由于MD5算法是一种严格的信息加密算法,在文章内容变动很少的情况下得出的指纹结果完全不同,导致基于这种算法的网页消重技术召回率不是很高。提出了两种基于字集特征向量的网页消重改进算法,把文章内容映射到字集空间中去,计算字集空间距离来判断文章是否相似。提出的算法具有良好的泛化能力,段落中存在的调整语序和增删改个别字不会影响到对相似段落的识别,大大提高了网页消重算法的召回率。实验结果表明,算法的时间复杂度为O(n),空间复杂度为O(1),适合应用于大规模网页消重。
李洪奇冯海波张伟杨中国宋伟城
关键词:网页消重数字指纹MD5
共1页<1>
聚类工具0