您的位置: 专家智库 > >

曹文洁

作品数:27 被引量:21H指数:3
供职机构:北京锐安科技有限公司更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 24篇专利
  • 3篇期刊文章

领域

  • 9篇自动化与计算...

主题

  • 16篇存储介质
  • 14篇电子设备
  • 6篇数据集
  • 5篇用户
  • 3篇映射
  • 3篇元数据
  • 3篇数据集成
  • 3篇自动化
  • 3篇查询
  • 2篇多线程
  • 2篇血缘
  • 2篇血缘关系
  • 2篇用户操作
  • 2篇数据处理
  • 2篇数据处理方法
  • 2篇数据管理
  • 2篇数据管理方法
  • 2篇数据集中
  • 2篇数据技术
  • 2篇数据应用

机构

  • 27篇北京锐安科技...

作者

  • 27篇曹文洁
  • 8篇万月亮
  • 2篇谢永恒
  • 1篇周汉川
  • 1篇兰烨
  • 1篇陶小龙
  • 1篇刘金晶
  • 1篇王宇翔
  • 1篇刘金晶

传媒

  • 3篇软件导刊

年份

  • 8篇2024
  • 9篇2023
  • 2篇2022
  • 4篇2021
  • 1篇2018
  • 2篇2017
  • 1篇2016
27 条 记 录,以下是 1-10
排序方式:
大数据环境下的数据质量管理策略被引量:15
2017年
信息时代,数据已经慢慢成为一种资产,数据质量成为决定资产优劣的一个重要方面。随着大数据的发展,越来越丰富的数据给数据质量的提升带来了新的挑战和困难。提出一种数据质量策略,从建立数据质量评价体系、落实质量信息的采集分析与监控、建立持续改进的工作机制和完善元数据管理4个方面,多方位优化改进,最终形成一套完善的质量管理体系,为信息系统提供高质量的数据支持。
刘金晶曹文洁
关键词:信息系统数据质量大数据ETL元数据
数据血缘关系展示方法、装置、电子设备及存储介质
本发明实施例公开了一种数据血缘关系展示方法、装置、电子设备及存储介质。该方法包括:响应于用户操作,确定目标数据;在检测到所述目标数据存在血缘关系时,确定与所述目标数据具有血缘关系的血缘数据;根据所述目标数据以及所述血缘数...
强宇程强冯宇波曹文洁
文献传递
一种数据处理方法、装置、设备及存储介质
本发明实施例公开了一种数据处理方法、装置、设备及存储介质,通过根据所获取来源数据集结合预确定的数据映射关系,确定所述来源数据集在元数据集合中对应的元数据;根据所述元数据,提取所述来源数据集中的实体对象、关系和事件;根据所...
曹文洁程强冯宇波
基于本体论的多源异构数据集成方法研究被引量:4
2018年
大数据时代信息呈指数级爆炸式增长,不同的数据采集、处理和存储方式使得这些海量数据具有来源复杂、结构异构的特点,难以共享和互操作。传统的数据集成方式已经不能适应企业获取信息、使用信息需求。为解决多源异构的数据集成效率和质量问题,基于本体论概念和语言,借鉴本体识别和表达方式,设计了一种领域内表达数据属性与关系的元模型。基于该元模型,对领域内数据建立相应的模型并形成规则,规范和约束了多源异构数据集成过程和质量,提高了数据集成的效率和数据利用率。
刘金晶曹文洁
关键词:异构数据集成本体
一种面向安全领域的身份识别与关联方法被引量:3
2016年
大数据蕴藏的巨大商机引发了大数据产业化浪潮,互联网数据以其庞大的数据和简单的获得方式成为了首要分析目标。得益于互联网大数据的发展,安全领域的侦查手段从传统的事后侦查和重点监控,发展到可以进行预防性分析,在某种程度上可避免危害发生。使用互联网数据进行产业化挖掘面临着两个基本问题:多源数据的解析、清洗与整合;互联网身份的实体识别。结合具体安全服务,给出了一种普适的基于Map Reduce的互联网大数据去冗降噪的统计方法,可大幅降低数据存储空间,并在此基础上流程化地完成互联网虚拟身份识别模型。它能够量化互联网用户身份关系的可靠性和关联稳定性,并结合R语言给出了可视化展示。
刘中淼王宇翔陶小龙曹文洁
关键词:身份识别HADOOP
数据分析任务的生成方法、装置、电子设备及介质
本发明提供了一种数据分析任务的生成方法、装置、电子设备及介质,涉及信息技术领域,包括:基于数据分析需求配置分析步骤组件;其中,分析步骤组件包括输入组件、输出组件和至少一个处理组件,输入组件用于配置数据分析需求的数据源,输...
张超曹文洁万月亮
自动化仿真测试数据的方法及装置
本发明提供了一种自动化仿真测试数据的方法及装置,在DMZ区,先从真实数据集中获取待脱敏数据,再对待脱敏数据进行脱敏并基于脱敏后数据建立原始测试数据集,之后从原始测试数据集中获取目标场景对应的目标测试数据并生成第一仿真数据...
李丁丁程强曹文洁
数据处理方法、装置、电子设备和存储介质
本申请实施例提供一种数据处理方法、装置、电子设备和存储介质,通过基于当前计算任务所需的系列数据集中至少两个数据集的大小,对系列数据集进行分批,得到预设数量的子系列数据集,子系列数据集中不同数据集的大小相近,采用多线程同步...
刘昕程强冯宇波曹文洁
一种数据管理方法、服务系统、终端及存储介质
本发明公开了一种数据管理方法、服务系统、终端及存储介质,由包括数据查询平台、权限控制平台以及资源信息平台的数据服务系统执行,该方法包括:数据查询平台根据用户发送的数据查询请求,确定所述用户对应权限分类标识;所述数据查询平...
杨哲谢永恒程强冯宇波曹文洁
文献传递
一种数据交换方法、装置、设备、系统及存储介质
本发明公开了一种数据交换方法、装置、设备、系统及存储介质。该方法包括:接收数据交换请求;根据所述数据交换请求,基于全双工通信协议获取目标设备的数据并将所述数据写入对应的消息主题;将所述消息主题中的数据发送至所述数据交换请...
何其春曹文洁万月亮
共3页<123>
聚类工具0