Spark+ClickHouse实战企业级数据仓库,进军大厂必备(完整版19章))

#1

1

分享一套Spark+ClickHouse大数据课程——《Spark+ClickHouse实战企业级数据仓库,进军大厂必备》,课程一共19章,提供源码+软件下载!

《Spark+ClickHouse实战企业级数据仓库,进军大厂必备》课程结合ClickHouse+Spark 这一对数据处理的“黄金搭档”,选取“大数据量企业数据仓库“这一典型场景,实战大数据量下数仓的建模、设计与调优等实用技巧,快速掌握ClickHouse+Spark核心技能,为晋级大数据架构师铺路!课程结合热门技术,实战企业级数仓项目,轻松掌握高薪数据工程师必备技能。课程通过更贴近生产实践的案例,掌握多种实用方案,满足复杂业务需求。课程遵照数仓分层模型,实战数据处理的各个环节,构建实用技术体系。

第1章 从0到1搭建项目开发环境,快速上手大数据开发
第2章 项目关键技术准备,学习通用的数据处理技术
第3章 项目数据准备,操练基于Spark的数据开发与优化
第4章 初识OLAP数仓架构
第5章 详解数据仓库基础理论,掌握数据仓库的实施流程
第6章 【项目实战第一篇】项目业务流程与ODS层数据同步
第7章 快速上手OLAP分析引擎ClickHouse
第8章 基于Spark源码自定义ClickHouse外部数据源,简化数据写入流程
第9章 数仓高级之维度模型设计
第10章 【项目实战第二篇】构建项目公共维度层
第11章 ClickHouse的MergeTree系列引擎原理、实践与优化
第12章 数仓高级之事实表模型设计
第13章 【项目实战第三篇】数据清洗加工,构建项目数据明细层
第14章 构建ClickHouse分布式集群,掌握分布式环境的数据查询、写入优化方案
第15章 【项目实战第四篇】负载均衡与高可用方案实践,自定义Spark写本地分片表策略
第16章 【项目实战第五篇】如何选择合适的维度表存储方案
第17章 【项目实战第六篇】数据汇总层与应用查询优化
第18章 【项目实战第七篇】基于轻量级BI工具的数据展示与可视化监控
第19章 数仓管理之调度系统DolphinScheduler 3.x