如果我们要保守估计,至少需要十五年的时间才能够成为一个专业人士。但是,我们需要注意的是,SRE这个领域本身还非常新,Google的SRE工程出版至今也还不到十年的时间。因此,我们需要给SRE领域一定的时间来成长和发展。当然,在国内,可观测性这个领域目前非常火热,甚至已经引起了人们的关注,但是我们需要注意的是,在这个领域取...
《Site Reliability Engineering: How Google Runs Production Systems》 《The Site Reliability Workbook: Practical Ways to Implement SRE》 《Building Secure and Reliable Systems: Best Practices for Designing, Implementing, and Maintaining Systems》 https://sre.google/ https://cloud.google.com/sre...
id=2371516[9] 频繁发布https://cloud.google.com/blog/products/devops-sre/using-the-four-keys-to-measure-your-devops-performance作者丨Adrienne Walcer 编译丨公众号:东风微鸣技术博客(ID:EWhisperCN)dbaplus社群欢迎广大技术人员投稿,投稿邮箱:editor@dbaplus.cn
https://cloud.google.com/blog/products/devops-sre/using-the-four-keys-to-measure-your-devops-performance 作者丨Adrienne Walcer 编译丨公众号:东风微鸣技术博客(ID:EWhisperCN) dbaplus社群欢迎广大技术人员投稿,投稿邮箱:editor@dbaplus.cn
SRE,Site Reliability Engineering,中文翻译为站点可靠性工程师,这个词诞生于谷歌内部。将这个词语展开来说:首先,SRE的关注点在于可靠性;其次,SRE中的"S"指的是google.com网站(站点)。简单的从这个词来看,SRE就是负责维护google.com运行可靠性的工程师,当然随着时
成为一名合格的 SRE 要成为一名优秀的 SRE,你需要具备以下几方面的技能:基础架构知识:理解计算机网络、操作系统、存储和数据库的基本原理。编程能力:熟练掌握至少一种编程语言,如 Python、Go 或 Java,并有能力编写脚本或工具来提高工作效率。云平台经验:熟悉云计算平台(如 AWS、Azure、Google Cloud)及其提供的...
SRE 中的“S”最开始指代的就是google.com的运维服务,因为SRE的第一个工作就是维持网站的正常运转。随着时间的推移,SRE 逐渐接管了 Google 内部绝大部分产品系统,包括 Google Cloud Platform 这类开发者平台,也包括内部的一些非网站类的基础设施系统,例如 Bigtable。
https://www.redhat.com/zh/topics/devops/what-is-sre 什么是 SRE?它和 DevOps 是怎么关联的?https://cloud.tencent.com/developer/article/1881362 谷歌的 SRE 是怎么来的?https://www.continuousdelivery20.com/blog/sre-how-google-come-up-with/...
2021 年 11 月:Google Cloud 中断的下游影响导致多个 GCP 产品中断。这也间接影响了许多非谷歌公司。 2022 年 12 月:与亚马逊搜索问题相对应的事件影响了全球至少 20% 的用户几乎一整天。 2023 年 1 月:最近,美国联邦航空管理局 (FAA) 由于定期维护失败导致 32,578 次航班延误,另有 409 次航班一起取消...
一键式部署-通过脚本将服务部署到Google Cloud Platform的工作。 负载生成器-在演示服务上模拟流量的组件。 三、Kubernetes的版本检查器 这是一个Kubernetes工具,可以帮助你查看集群中运行的镜像的版本。该工具还允许你在Grafana仪表板上,以表格查看镜像版本。