互聯(lián)網(wǎng)
深度學習
推薦課程
average > 0 ? $model->average . '分' : '10.0分' ?>

‘SLO兵法’實施 SRE 的藝術

Z.Liu

Natunix 架構師

精通DevOps的核心理念和相關實踐,價值觀和相關工具集;具有豐富的傳統(tǒng)企業(yè)數(shù)據(jù)中心管理經(jīng)驗,熟悉ITIL和敏捷等基礎方法論。
DevOps布道師,Exin首批國內(nèi)認證DevOps Master講師。從業(yè)近15年以來,積累了豐富的廠商經(jīng)驗和項目經(jīng)驗。紅帽RHCA認證和AWS架構師認證。諳熟企業(yè)數(shù)據(jù)中心的IT服務管理,經(jīng)歷過大型CMDB項目。目前致力于推廣DevOps理念和文化,幫助企業(yè)打造持續(xù)交付、微服務架構和容器技術組成的DevOps核心能力三角。通過培訓、研討等方式導入相關開發(fā)運維一體化的新型高效IT運營實踐,協(xié)助企業(yè)落地和實現(xiàn)DevOps。

精通DevOps的核心理念和相關實踐,價值觀和相關工具集;具有豐富的傳統(tǒng)企業(yè)數(shù)據(jù)中心管理經(jīng)驗,熟悉ITIL和敏捷等基礎方法論。 DevOps布道師,Exin首批國內(nèi)認證DevOps Master講師。從業(yè)近15年以來,積累了豐富的廠商經(jīng)驗和項目經(jīng)驗。紅帽RHCA認證和AWS架構師認證。諳熟企業(yè)數(shù)據(jù)中心的IT服務管理,經(jīng)歷過大型CMDB項目。目前致力于推廣DevOps理念和文化,幫助企業(yè)打造持續(xù)交付、微服務架構和容器技術組成的DevOps核心能力三角。通過培訓、研討等方式導入相關開發(fā)運維一體化的新型高效IT運營實踐,協(xié)助企業(yè)落地和實現(xiàn)DevOps。

課程費用

6800.00 /人

課程時長

1

成為教練

課程簡介

歡迎踏上《SLO兵法》的探索之旅,一場引領你進入Site Reliability Engineering(SRE)精髓的深度學習之旅。這門課程將為你揭示系統(tǒng)穩(wěn)定性的奧秘,為構建可靠、穩(wěn)定、安全的服務打開全新的思維之門。

為何選擇《SLO兵法》?
這不僅僅是一門課程,更是通往業(yè)務系統(tǒng)可靠性和可觀測性的鑰匙。對于所有希望在生產(chǎn)環(huán)境領域取得卓越業(yè)務戰(zhàn)績的你,《SLO兵法》將成為你事業(yè)道路上的重要里程碑。

目標收益

1.在組織中對SRE相關的核心理念基礎、SLO實踐流程達成高度一致和認同
2.詳細了解在組織中為業(yè)務系統(tǒng)制定 SLO的詳細實施的方式
3.徹底梳理SRE知識體系結構和最相關的重要技術實踐
4.對SLO的實施過程和相關案例做針對性的研討

培訓對象

1、DevOps工程師、SRE工程師
2、開發(fā)人員、應用架構師、服務交付經(jīng)理
3、產(chǎn)品經(jīng)理、項目經(jīng)理、一線運維經(jīng)理
4、敏捷教練,DevOps教練

課程大綱

第一模塊: 對齊 SRE 中與 SLO 相關的術語概念 1.SLI、SLO 概念解析:深入剖析 SLI(Service Level Indicator)和 SLO(Service Level Objective)的核心概念,確保學員對這兩個關鍵術語有清晰準確的理解。
2.SLO 與客戶體驗之間的關系:探討 SLO 與客戶體驗之間的緊密聯(lián)系,幫助學員建立起對服務質量目標與最終用戶體驗之間的敏感性
第二模塊: 業(yè)務系統(tǒng)為何需要 SLO ? 1.可靠性是應用系統(tǒng)的最重要特性:強調應用系統(tǒng)可靠性的至關重要地位,為學員樹立系統(tǒng)穩(wěn)定性管理的核心價值觀。
2.深入理解 SLO 目標數(shù)值的設定原則:深入研究 SLO 目標數(shù)值的設定流程,引導學員理解背后的原則與方法,以確保系統(tǒng)的運行水平符合組織的期望。
第三模塊: 使用錯誤預算 1.理解錯誤預算的概念和應用:解讀錯誤預算的概念,著重探究其與 SLO 密切的邏輯關系,幫助學員理解如何通過錯誤預算合理管理業(yè)務系統(tǒng)風險。
2.錯誤預算與運維操作和監(jiān)控告警的關系:深入研究如何運用錯誤預算進行運維操作的優(yōu)化,以及如何構建有效的 SLO 監(jiān)控告警規(guī)則,確保在業(yè)務系統(tǒng)發(fā)生關鍵異常時能夠準確、迅速的響應。
第四模塊: 實戰(zhàn)演練 - 實施SLO案例實戰(zhàn) 1.閱讀學員手冊:引導學員仔細閱讀學員手冊,以建立對實操案例的基本理解。
2.講解小組工作流程:解釋小組工作流程,確保學員能夠理解并分組準確執(zhí)行實際操作。
3.小組工作成果展示:學員展示他們在演練案例中所完成的成果,促進知識分享與團隊協(xié)作。
第五模塊:綜合答疑&總結 回答學員提出的問題,深化對課程內(nèi)容的理解,并進行全面總結,確保學員能夠充分領會并應用所學的關鍵概念。
第一模塊: 對齊 SRE 中與 SLO 相關的術語概念
1.SLI、SLO 概念解析:深入剖析 SLI(Service Level Indicator)和 SLO(Service Level Objective)的核心概念,確保學員對這兩個關鍵術語有清晰準確的理解。
2.SLO 與客戶體驗之間的關系:探討 SLO 與客戶體驗之間的緊密聯(lián)系,幫助學員建立起對服務質量目標與最終用戶體驗之間的敏感性
第二模塊: 業(yè)務系統(tǒng)為何需要 SLO ?
1.可靠性是應用系統(tǒng)的最重要特性:強調應用系統(tǒng)可靠性的至關重要地位,為學員樹立系統(tǒng)穩(wěn)定性管理的核心價值觀。
2.深入理解 SLO 目標數(shù)值的設定原則:深入研究 SLO 目標數(shù)值的設定流程,引導學員理解背后的原則與方法,以確保系統(tǒng)的運行水平符合組織的期望。
第三模塊: 使用錯誤預算
1.理解錯誤預算的概念和應用:解讀錯誤預算的概念,著重探究其與 SLO 密切的邏輯關系,幫助學員理解如何通過錯誤預算合理管理業(yè)務系統(tǒng)風險。
2.錯誤預算與運維操作和監(jiān)控告警的關系:深入研究如何運用錯誤預算進行運維操作的優(yōu)化,以及如何構建有效的 SLO 監(jiān)控告警規(guī)則,確保在業(yè)務系統(tǒng)發(fā)生關鍵異常時能夠準確、迅速的響應。
第四模塊: 實戰(zhàn)演練 - 實施SLO案例實戰(zhàn)
1.閱讀學員手冊:引導學員仔細閱讀學員手冊,以建立對實操案例的基本理解。
2.講解小組工作流程:解釋小組工作流程,確保學員能夠理解并分組準確執(zhí)行實際操作。
3.小組工作成果展示:學員展示他們在演練案例中所完成的成果,促進知識分享與團隊協(xié)作。
第五模塊:綜合答疑&總結
回答學員提出的問題,深化對課程內(nèi)容的理解,并進行全面總結,確保學員能夠充分領會并應用所學的關鍵概念。

活動詳情

提交需求