中国科学院院长基金(A050414)
- 作品数:4 被引量:43H指数:4
- 相关作者:赵怀慈李一凡花海洋常艳莉王磊更多>>
- 相关机构:中国科学院更多>>
- 发文基金:中国科学院院长基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于银行数据仓库的ETL系统的设计与实现被引量:18
- 2006年
- ETL技术是创建数据仓库的关键。本文以银行数据仓库项目为背景,设计实现了数据的ETL系统,该系统具有良好的人机交互方式。系统采用时钟触发机制实现了数据的自动抽取过程;使用配置文件增强了系统的灵活性;通过对日志的细化实现了系统的快速恢复;针对海量数据的特点,在数据载入过程中优化了系统性能,提高了系统的运行效率。
- 常艳莉李一凡赵怀慈
- 关键词:银行海量数据日志
- 聚类算法在银行客户细分中的应用被引量:6
- 2008年
- 针对聚类算法在金融领域广泛应用的实际情况,基于银行客户数据集,对DBSCAN,K-means和X-means 3种聚类算法在执行效率、可扩展性、异常点检测能力等方面进行对比分析,并提出将X-means算法应用于银行业客户细分。利用X-means算法建立了一套银行客户细分模型,为银行决策者提供科学的决策支持。
- 花海洋赵怀慈
- 关键词:聚类K-MEANS算法客户细分
- 基于分布式数据仓库技术的ETL系统的研究与应用被引量:10
- 2006年
- ETL系统是构建和维护数据仓库的基本构件,由于要处理海量数据和访问各种异构数据源,如何同时具有高效的数据处理能力和通用的数据源访问能力是值得研究的问题。本文针对某银行数据仓库项目的实际需求,提出了基于分布式数据仓库的ETL系统,并使用了XML技术实现异构数据源的通用接口访问方式。系统运行表明该解决方案具有好的使用效果。
- 花海洋李一凡赵怀慈
- 关键词:ETL
- 银联数据仓库系统中ETL的设计和实现被引量:10
- 2007年
- 针对银联数据的特点,设计实现了银联数据仓库ETL系统。该系统采用模块化的设计方式,增强了系统的可控性和灵活性。元数据模块使ETL系统能够灵活地适应银联业务逻辑的频繁变化;调度模块采用线程池技术,改进了以往多线程技术,提高了数据抽取的效率和系统资源的使用率;日志、监控信息及通知模块解决了系统出错快速恢复的问题。测试表明该ETL系统很好地满足了银联的需求。
- 王磊李一凡赵怀慈
- 关键词:ETL元数据调度银联