封面
版权页
O'Reilly Media Inc.介绍
本书赞誉
前言
第1章 大数据——超越喧嚣
1.1 什么是大数据
1.2 弹性数据基础设施的挑战
1.3 云计算基础
1.3.1 云计算术语
1.3.2 云的价值主张
1.4 云数据湖架构
1.4.1 本地数据仓库解决方案的限制
1.4.2 什么是云数据湖架构
1.4.3 云数据湖架构的优势
1.5 开启云数据湖之旅
1.6 总结
第2章 云上的大数据架构
2.1 为什么Klodars公司要迁移到云
2.2 云数据湖架构基础
- APP免费
2.2.1 浅谈数据的多样性
- APP免费
2.2.2 云数据湖存储
- APP免费
2.2.3 大数据分析引擎
- APP免费
2.2.4 云数据仓库
- APP免费
2.3 现代数据仓库架构
- APP免费
2.3.1 参考架构
- APP免费
2.3.2 现代数据仓库架构的用例
- APP免费
2.3.3 现代数据仓库架构的优势和挑战
- APP免费
2.4 数据湖仓一体架构
- APP免费
2.4.1 参考架构
- APP免费
2.4.2 数据湖仓一体架构的用例
- APP免费
2.4.3 数据湖仓一体架构的优势和挑战
- APP免费
2.4.4 数据仓库和非结构化数据
- APP免费
2.5 数据网格
- APP免费
2.5.1 参考架构
- APP免费
2.5.2 数据网格架构的用例
- APP免费
2.5.3 数据网格架构的优势和挑战
- APP免费
2.6 什么是适合的架构
- APP免费
2.6.1 了解客户
- APP免费
2.6.2 了解业务驱动因素
- APP免费
2.6.3 考虑增长和未来场景
- APP免费
2.6.4 设计注意事项
- APP免费
2.6.5 混合方法
- APP免费
2.7 总结
- APP免费
第3章 数据湖的设计注意事项
- APP免费
3.1 设置云数据湖基础设施
- APP免费
3.1.1 确定目标
- APP免费
3.1.2 规划架构和可交付成果
- APP免费
3.1.3 云数据湖实施
- APP免费
3.1.4 发布和运行
- APP免费
3.2 在数据湖中组织数据
- APP免费
3.2.1 数据生命中的一天
- APP免费
3.2.2 数据湖区
- APP免费
3.2.3 组织机制
- APP免费
3.3 数据治理简介
- APP免费
3.3.1 数据治理的参与者
- APP免费
3.3.2 数据分类
- APP免费
3.3.3 元数据管理、数据目录和数据共享
- APP免费
3.3.4 数据访问管理
- APP免费
3.3.5 数据质量和可观测性
- APP免费
3.3.6 Klodars公司的数据治理
- APP免费
3.3.7 数据治理总结
- APP免费
3.4 管理数据湖成本
- APP免费
3.4.1 揭秘云上的数据湖成本
- APP免费
3.4.2 数据湖成本策略
- APP免费
3.5 总结
- APP免费
第4章 可扩展的数据湖
- APP免费
4.1 可扩展性探秘
- APP免费
4.1.1 什么是可扩展性
- APP免费
4.1.2 日常生活中的规模
- APP免费
4.1.3 数据湖架构中的可扩展性
- APP免费
4.2 数据湖处理系统的内部
- APP免费
4.2.1 内部数据复制
- APP免费
4.2.2 内部ELT/ETL处理
- APP免费
4.2.3 关于其他交互式查询的说明
- APP免费
4.3 可扩展数据湖解决方案的注意事项
- APP免费
4.3.1 选择合适的云产品
- APP免费
4.3.2 峰值容量规划
- APP免费
4.3.3 数据格式和作业配置文件
- APP免费
4.4 总结
- APP免费
第5章 优化云数据湖架构以提高性能
- APP免费
5.1 度量性能的基础知识
- APP免费
5.1.1 性能的目标和指标
- APP免费
5.1.2 度量性能
- APP免费
5.1.3 优化以提高性能
- APP免费
5.2 云数据湖性能
- APP免费
5.2.1 SLA、SLO和SLI
- APP免费
5.2.2 示例:Klodars公司如何管理其SLA、SLO和SLI
- APP免费
5.3 性能驱动因素
- APP免费
5.3.1 复制作业的性能驱动因素
- APP免费
5.3.2 Spark作业的性能驱动因素
- APP免费
5.4 性能调优的优化原则和技术
- APP免费
5.4.1 数据格式
- APP免费
5.4.2 数据组织和分区
- APP免费
5.4.3 在Apache Spark上选择正确的配置
- APP免费
5.5 减少数据传输开销
- APP免费
5.6 优质产品和性能
- APP免费
5.6.1 大型虚拟机案例
- APP免费
5.6.2 闪存案例
- APP免费
5.7 总结
- APP免费
第6章 深入了解数据格式
- APP免费
6.1 为什么我们需要这些开放数据格式
- APP免费
6.1.1 为什么我们需要存储表格数据
- APP免费
6.1.2 为什么在云数据湖中存储表格数据是一个问题
- APP免费
6.2 Delta Lake
- APP免费
6.2.1 为什么开发Delta Lake
- APP免费
6.2.2 Delta Lake如何工作
- APP免费
6.2.3 什么时候使用Delta Lake
- APP免费
6.3 Apache Iceberg
- APP免费
6.3.1 为什么开发Apache Iceberg
- APP免费
6.3.2 Apache Iceberg是如何工作的
- APP免费
6.3.3 什么时候使用Apache Iceberg
- APP免费
6.4 Apache Hudi
- APP免费
6.4.1 为什么孵化Apache Hudi
- APP免费
6.4.2 Apache Hudi如何工作
- APP免费
6.4.3 什么时候使用Apache Hudi
- APP免费
6.5 总结
- APP免费
第7章 架构的决策框架
- APP免费
7.1 云数据湖评估
- APP免费
7.2 云数据湖评估分析
- APP免费
7.2.1 从零开始
- APP免费
7.2.2 将现有数据湖或数据仓库迁移到云
- APP免费
7.2.3 改进现有的云数据湖
- APP免费
7.3 决策框架的第1阶段:评估
- APP免费
7.3.1 了解客户需求
- APP免费
7.3.2 了解改进的机会
- APP免费
7.3.3 了解业务驱动因素
- APP免费
7.3.4 确定需求的优先级来完成评估阶段
- APP免费
7.4 决策框架的第2阶段:定义
- APP免费
7.4.1 确定云数据湖的设计选择
- APP免费
7.4.2 规划云数据湖项目可交付成果
- APP免费
7.5 决策框架的第3阶段:实施
- APP免费
7.6 决策框架的第4阶段:操作
- APP免费
7.7 总结
- APP免费
第8章 数据启迪未来的六大经验
- APP免费
8.1 第1课:关注云数据湖的工作方式和时间,而不是“如果”和“为什么”
- APP免费
8.2 第2课:权力越大,责任越大——数据也不例外
- APP免费
8.3 第3课:客户引领技术,而不是技术引领客户
- APP免费
8.4 第4课:改变是不可避免的,所以要做好准备
- APP免费
8.5 第5课:建立同理心,分清轻重缓急
- APP免费
8.6 第6课:巨大的影响不会在一夜之间发生
- APP免费
8.7 总结
- APP免费
附录 云数据湖决策框架模板
- APP免费
作者简介
- APP免费
封面简介
- APP免费
推荐阅读
- APP免费
封底
更新时间:2024-11-22 15:59:06