封面
版权信息
版权
内容提要
前言
为什么写这本书
本书与专栏的区别
如何阅读本书
本书主要内容
致谢
第1章 认识全链路压测
1.1 全链路压测概述
1.1.1 互联网服务的容量保障
1.1.2 全链路压测的概念
1.1.3 全链路压测的价值
1.1.4 全链路压测的特点
1.2 全链路压测的演进之路
1.2.1 基线容量测试
1.2.2 集群缩放压测
1.2.3 流量回放
1.2.4 单链路压测
1.3 全链路压测的发展前景
1.4 本章小结
第2章 全链路压测的技术实现
2.1 压测数据隔离
2.1.1 逻辑隔离
2.1.2 物理隔离
2.1.3 影子库与影子表
2.1.4 逻辑隔离与物理隔离的对比
2.2 中间件改造和应用服务改造
2.2.1 中间件改造
2.2.2 应用服务改造
2.3 压测模型构建
2.3.1 线上日志回放
2.3.2 链路聚合技术
2.3.3 新场景的压测模型构建
2.3.4 全链路压测的服务范围
2.4 压测流量构造
2.4.1 压测流量构造的成本权衡
2.4.2 压测流量构造工具的技术选型
2.5 容量指标监控
2.5.1 资源类指标
2.5.2 应用类指标
2.5.3 网络类指标
2.5.4 链路类指标
2.5.5 中间件指标
2.5.6 压测端指标
2.5.7 舆情指标
2.5.8 容量指标监控原则
2.6 全链路压测的实施流程
2.6.1 压测方案设计
2.6.2 压测方案评审
2.6.3 压测准备
2.6.4 压测执行
2.6.5 结果反馈
2.6.6 持续跟进
2.7 本章小结
第3章 全链路压测的组织保障
3.1 全链路压测需要什么样的团队
3.1.1 运维驱动:GOC团队的建立和意义
3.1.2 测试驱动:是否需要独立的专项测试团队
3.1.3 谁对服务容量负责
3.2 全链路压测如何运营
3.2.1 Program机制
3.2.2 全链路压测SOP
3.2.3 常态化执行制度和容量问题分级规范
3.2.4 激励措施和竞争模式
3.3 中小型公司如何建设全链路压测
3.3.1 粗放式建设
3.3.2 善用云服务商的收费机制
3.3.3 用好开源工具
3.3.4 购买解决方案
3.4 本章小结
第4章 全链路压测的工具建设
4.1 优秀开源工具精粹
4.1.1 链路追踪工具
4.1.2 流量构造工具
4.1.3 容量监控工具
4.2 分布式压测平台建设
4.2.1 架构设计
4.2.2 压测状态流转
4.2.3 实时数据(热数据)
4.2.4 异步数据(冷数据)
4.2.5 吞吐量限制与动态调节
4.2.6 压测场景编排
4.2.7 监控模块
4.3 全链路压测管理平台建设
4.3.1 全链路压测管理平台功能概览
4.3.2 压测链路与模型管理
4.3.3 压测风险识别与结果跟进
4.4 无人值守全链路压测的技术实现
4.4.1 自适应压测策略
4.4.2 自动化风险管控
4.5 本章小结
第5章 微服务架构下的容量治理
5.1 微服务架构的特点和容量风险
5.1.1 微服务架构的特点
5.1.2 微服务架构的容量风险
5.2 容量指标分析实战
5.2.1 响应时间应关注平均值,还是分位线?
5.2.2 响应时间一定越短越好吗?
5.2.3 CPU利用率低,服务容量就一定没有问题吗?
5.2.4 “压不上去”了,就是服务容量达到瓶颈了吗?
5.2.5 容量指标只是偶尔“抖动”一下,要不要关注?
5.3 扩容:为服务增添“燃料”
5.3.1 扩容方案
5.3.2 扩容注意点
5.4 限流:让我“缓一缓”
5.4.1 限流策略
5.4.2 限流位置
5.5 降级:弃车保帅
5.5.1 降级实现
5.5.2 降级策略和要点
5.6 熔断:上游的服务,我们来保护你
5.7 容灾:我还有“一条命”
5.7.1 常见容灾手段
5.7.2 容灾衡量指标
5.7.3 两地三中心
5.7.4 异地多活
5.8 预案建设:提前准备,胸有成竹
5.8.1 认识预案
5.8.2 预案演练
5.9 本章小结
第6章 容量规划与容量预测
6.1 容量规划的本质
6.2 容量规划的系统化方法
6.2.1 容量测量
6.2.2 容量预测
6.2.3 资源部署
6.2.4 容量验证
6.3 智能化容量预测
6.3.1 智能化容量预测过程
6.3.2 相关度分析与服务画像
6.3.3 容量预测迭代与校准
6.3.4 警惕业务场景变化
6.4 浅谈排队论
6.4.1 排队论基础知识
6.4.2 排队论应用策略:排队模型与公式
6.4.3 排队论应用案例
6.5 本章小结
第7章 全链路压测实战案例
7.1 某大型企业“双11”大促活动容量保障案例
7.1.1 明确背景与目标
7.1.2 重点链路梳理
7.1.3 服务架构治理
7.1.4 大促流量预估
7.1.5 大促全链路压测
7.1.6 大促活动容量保障体系
7.1.7 案例总结
7.2 某创业公司全链路压测建设之路
7.2.1 全链路压测的建设背景
7.2.2 全链路压测的技术方案
7.2.3 全链路压测的管理方案
7.2.4 案例总结
7.3 某商业银行全链路压测实践案例
7.3.1 业务和技术背景
7.3.2 全链路压测的技术方案
7.3.3 全链路压测的实施效果
7.3.4 案例总结
7.4 全链路压测与混沌工程的融合案例
7.4.1 异常场景下的全链路压测
7.4.2 高负载下的故障模拟
7.4.3 全链路压测与攻防演练的融合
7.4.4 案例总结
7.5 本章小结
第8章 全链路压测快问快答
8.1 技术篇
8.1.1 统一基础设施是实施全链路压测的必要条件吗?
8.1.2 完全依赖开源工具能够实现全链路压测吗?
8.1.3 金融公司是否难以进行全链路压测?
8.1.4 业务迭代速度较快,如何降低全链路压测模型的更新成本?
8.1.5 业务技术团队认为通过限流足以规避容量风险,不需要进行服务优化,是这样吗?
8.1.6 如何做到全链路压测的常态化实施?
8.2 管理篇
8.2.1 我所在的公司没有任何容量保障基础,如何推动全链路压测的建设?
8.2.2 全链路压测适合自上而下推动,还是自下而上推动?
8.2.3 制定和推动全链路压测流程规范时阻力重重,该怎么办?
8.2.4 业务技术团队不认可全链路压测的结果,该怎么办?
8.2.5 “大厂”的全链路压测经验,能够复制到中小型企业吗?
8.3 职业发展篇
8.3.1 是什么契机让你开始从事全链路压测工作的?
8.3.2 你在实施全链路压测的过程中遇到的最大困难是什么?
8.3.3 从事全链路压测工作,能为我的职业发展带来什么帮助?
8.3.4 执行全链路压测非常辛苦,经常要熬夜,对此你有什么建议吗?
8.4 本章小结
更新时间:2024-05-24 17:38:13