课程主页: https://www.coursera.org/learn/developing-a-google-sre-culture
课程概述
在许多IT组织中,开发人员追求灵活性,而运营人员则关注稳定性,二者之间的激励并没有对齐。谷歌的站点可靠性工程(Site Reliability Engineering, SRE)是如何实现开发与运营之间的激励对齐,并进行关键任务的生产支持的。
采用SRE文化和技术实践可以促进业务与IT之间的协作。此课程将介绍谷歌SRE的关键实践以及IT和商业领袖所扮演的重要角色。
课程大纲
- 欢迎来到开发谷歌SRE文化
本模块提供课程概述。您将了解本课程对希望接受SRE文化的IT和商业领袖的好处,以及各模块涵盖的主题。 - DevOps、SRE及其存在的意义
本模块解释了DevOps哲学的组成部分,SRE如何产生,以及组织中可以和应该实践SRE的人。 - SLO及其后果
本模块涵盖SRE对组织的价值,以及减少组织孤岛和接受失败作为正常现象的技术和文化基础。主题包括无责备后期分析、服务水平目标(SLO)和错误预算等技术实践,以及无责备、心理安全、统一愿景、协作与沟通、知识共享等文化实践。 - 让明天比今天更好
持续的渐进测试和自动化在SRE文化中非常重要。本模块讲解了与实施渐进变化相关的持续集成、持续交付和金丝雀发布等技术概念。 - 调节工作负载
在本模块中,您将学习到与衡量一切(特别是可靠性和辛劳)相关的SRE实践以及监控的概念。 - 在您的组织中应用SRE
本模块讨论如何评估和理解您组织采用SRE原则、实践和文化的成熟度和准备状态。 - 最终评估
通过这次总结性测验测试您对谷歌SRE技术和文化实践的整体知识,必须获得80%的分数才能通过。
课程评价
《开发谷歌SRE文化》课程非常适合希望提升团队协作与提高生产稳定性的IT和商业领袖们。课程内容深入浅出,涵盖丰富的理论与实践,帮助学员理解在现代快节奏的技术环境中,如何更好地整合开发与运营的理念。
无论是对SRE有基础了解的学员,还是对于组织文化转型与SRE尚无经验的管理者,此课程都提供了实用的工具与框架,帮助将理论与实践相结合。通过完成课程,学员将能够在自己的组织中推动SRE文化的实施,促进团队的协作与成功。
课程主页: https://www.coursera.org/learn/developing-a-google-sre-culture