SRE进阶实战
本课程清晰完整地讲解SRE(系统可靠性工程)的知识体系、方法体系、工程体系;讲清楚SRE工程的方法,如怎么样设计高可靠的系统、如何与产研、运维、质量等团队协作;会讲到如何快速发现故障、确定影响、定界定位找到根因;如何找到故障规律并建设预案能力快速修复故障;也会讲到保障能力、混沌工程、AIOps、可观测性等最新理念方法;从管理上如何做好方向规划、工作目标、团队转型、如何与高层取得共识等。
本课程会讲解和展示大量的实践案例,理论结合工程实践,方便理解和参考;本课程会开展工作坊和研讨环节。
SRE进阶实战
张观石
《SRE原理与实践:构建高可靠性互联网应用》作者。
拥有20年软件开发、架构、运维、SRE经验。曾在虎牙直播担任资深运维专家和架构师,历任项目研发负责人、SRE负责人、架构师,事故管理委员会委员、基础保障部架构师委员会委员。