搜索到239篇“ 海量数据挖掘“的相关文章
- 一种基于DMA模型的海量数据挖掘系统
- 本发明涉及数据处理技术领域,具体涉及一种基于DMA模型的海量数据挖掘系统,包括:采集模块,用于采集数据源实时产生的数据内容;预处理模块,用于接收采集模块运行采集到的数据内容,对数据内容进行预处理;储存模块,用于接收预处理...
- 赖光郎黄连生
- 林业海量数据挖掘与分析:方法与应用
- 2025年
- 该文探讨了在大数据时代背景下如何利用数据挖掘与分析技术,对林业领域的海量数据进行有效地处理与应用。文章首先阐述了林业海量数据的特点及面临的挑战,然后重点介绍了几种常用的数据挖掘与分析方法,包括关联规则挖掘、决策树和聚类分析等。接着,文章结合实际案例讨论了这些方法在林业资源调查、森林灾害预警和生态系统监测等方面的应用。最后,文章展望了林业海量数据挖掘与分析技术的发展趋势,并提出了进一步研究的方向。
- 张弦
- 关键词:林业海量数据数据挖掘数据分析
- 基于海量数据挖掘的信息系统业务授权审计分析
- 2024年
- 阐述基于海量数据的内外网交互联络审计,采用数据挖掘技术和网络监测方法,对组织机构间的数据交互进行分析和评估。有效的内外网交互联络审计,可以提高信息安全和减少潜在的风险。
- 章达英
- 关键词:数据挖掘网络监测
- 基于海量数据挖掘的精准教学效果实证研究
- 2023年
- 以Speexx线上学习平台为基础,以精准教学实践为研究对象,深入挖掘海量的教学行为数据,分析精准教学模式对学生英语能力的提高程度。并从实证研究的角度,挖掘学习时长与口语水平,学习时长与学生成绩,扩展练习与学生成绩之间的相关性,从而验证了这种智能化的精准教学模式相比传统英语教学更具优势,能进一步提升英语教学的精准化程度。
- 王艾
- 关键词:海量数据挖掘
- 基于海量数据挖掘的配网单相接地故障自动定位方法被引量:4
- 2023年
- 配网单相接地故障发生后,提出了基于海量数据挖掘的配网单相接地故障自动定位方法。根据配网的接线结构和故障原理,设置单相接地故障的评判依据。利用海量数据挖掘技术,从电压和电流两个方面自动收集配网运行数据。针对存在单相接地故障的配网,启动故障定位程序,通过故障选线、测距等步骤,得出可视化的配网单相接地故障自动定位结果。通过实测得出结论:在低压、中压及高压环境下,优化设计故障定位方法的选线错误率和测距误差均低于预设值,即优化设计的定位方法具有良好的定位精度。
- 余建想
- 关键词:海量数据挖掘配电网故障单相接地故障故障定位
- 综采工作面海量数据挖掘分析平台设计被引量:3
- 2023年
- 当前综采工作面海量数据采集的实时性和完整性差、异常数据清洗耗时大、数据挖掘时延大,导致综采数据利用率低,无法辅助管理层实时下发决策指令。针对上述问题,设计了一种综采工作面海量数据挖掘分析平台。该平台由数据源层、数据采集存储层、数据挖掘层和前端应用层组成。数据源层由工作面各类硬件设备提供原始数据;数据采集存储层使用OPC UA网关实时采集井下传感器监测信息,再通过MQTT协议和RESTful接口将数据存入InfluxDB存储引擎;数据挖掘层利用Hive数据引擎和Yarn资源管理器筛选数据采集过程中受工作现场干扰形成的异常数据,解决因网络延时导致的数据局部采集顺序紊乱问题,并利用Spark分布式挖掘引擎挖掘工作面设备群海量工况数据的潜在价值,提高数据挖掘模型的运行速度;前端应用层利用可视化组件与后端数据库关联,再通过AJAX技术与后端数据实时交互,实现模型挖掘结果和各类监测数据的可视化展示。测试结果表明,该平台能够充分保证数据采集的实时性与完整性,清洗效率较单机MySQL查询引擎提升5倍,挖掘效率较单机Python挖掘引擎提升4倍。
- 王宏伟杨焜付翔李进贾思锋
- 关键词:综采工作面海量数据数据挖掘数据存储数据清洗数据可视化
- 改进的k最邻近算法在海量数据挖掘中的应用被引量:13
- 2021年
- 为了提高数据挖掘的效率与准确性,将k最邻近算法与样本均衡策略相结合,在海量数据挖掘中进行应用;首先对样本集文本进行分析,找出样本领域的密集分布区域,对样本密集区域进行有效裁剪优化,实现样本分布均衡,然后对经过样本均衡处理的数据样本执行传统k最邻近算法,根据权重获得分类结果,最后对不同k值的k最邻近算法进行实例仿真。结果表明,在相同的数据样本环境中,相比于其他分类算法,采用改进的k最邻近算法的分类准确度和分类效率更高。
- 黄文秀唐超尘唐超尘神显豪
- 关键词:数据挖掘
- 粗糙集理论下的海量数据挖掘算法被引量:2
- 2020年
- 文章对于传统挖掘算法在数据量级方面的不足之处,提出依托粗糙集原理的海量数据挖掘算法,重点探究基于动态聚类的两步离散化算法,如果算法满足大数据处理要求后,通过并行计算提升所用算法执行效率。在此基础上,选取实例证实算法可行性,测试结果表明,改进算法有利于处理海量数据,并解决海量数据处理带来的效率问题。
- 刘福刚
- 关键词:粗糙集理论海量数据
- 基于云计算技术下海量数据挖掘的实现研究被引量:3
- 2020年
- 由于信息技术的快速发展,信息量在持续增多,借助数据挖掘可以从海量数据中挖掘出有价值的信息,信息资源实现了更有价值的应用.如何从海量数据中高效挖掘有价值的资源,属于信息技术要解决的关键问题.云计算技术支持下的数据挖掘实现了资源的优化配置,体现出实用性、虚拟性的特点,可以保证数据挖掘的高效、精准.因此,有必要构建云计算技术下的数据挖掘模式,保证数据挖掘具有更高的精准度,并实现挖掘成本的降低.
- 何欣
- 关键词:云计算技术数据挖掘
- 基于Agent的分布式海量数据挖掘系统
- 本发明公开了一种基于Agent的分布式海量数据挖掘系统,该系统包括:用户层、系统控制层、数据挖掘层及数据源层;其中,所述用户层负责提供用户与系统交互的接口,主要完成用户身份的验证、用户输入的采集、挖掘的过程以及最终结果的...
- 周峻松徐继峰祁建明陈墩金
相关作者
- 赵华茗

- 作品数:20被引量:142H指数:7
- 供职机构:中国科学院文献情报中心
- 研究主题:虚拟技术 细粒度 开源 云计算 HADOOP
- 魏墨济

- 作品数:53被引量:54H指数:4
- 供职机构:山东省科学院
- 研究主题:大数据 文档 词频 文档分类 网站
- 朱世伟

- 作品数:77被引量:223H指数:9
- 供职机构:山东省科学院
- 研究主题:大数据 文档 MAPREDUCE 词频 文档分类
- 房红征

- 作品数:113被引量:161H指数:7
- 供职机构:北京航天测控技术有限公司
- 研究主题:航天器 健康管理 故障诊断 故障预测 卫星
- 董云帆

- 作品数:8被引量:7H指数:1
- 供职机构:北京航天测控技术有限公司
- 研究主题:健康管理 大数据 错误率 备份数据 飞控系统