[Перевод] Проверяем реалистичность SLO и анализируем риски, как настоящие SRE-инженеры

Вторник, 15 Ноября 2022 г. 13:00 + в цитатник

Установка SLO (Service Level Objective, целевых уровней обслуживания) — одна из базовых задач SRE. По этим показателям удобно оценивать надежность службы. Противоположность SLO — бюджет на ошибки, то есть какой уровень ненадежности считать допустимым. Когда мы определим эти показатели и установим SLO, нужно проверить их реалистичность с учетом архитектуры приложения и рабочих практик. Мы точно сможем их достичь? На что, скорее всего, уйдёт наш бюджет на ошибки?

SRE-инженеры из Google отвечают на эти вопросы при выпуске нового сервиса, когда проводят PRR (Production Readiness Review — проверку готовности продукта). Мы анализируем риски не для того, чтобы изменить SLO. Скорее, мы хотим приоритизировать риски для сервиса, чтобы прикинуть, сможем ли мы достичь наших SLO с учетом изменений сервиса или без них. Кроме того, с помощью анализа мы определим самые важные риски. Определяя и снижая риски, мы повышаем надежность сервиса.

Прежде чем оценить и приоритизировать риски, нужно составить полный список того, чего стоит опасаться. В этой статье приводятся рекомендации для команд, которые будут определять потенциальные риски для приложения. Определив риски, вы сможете проанализировать их и расставить приоритеты.

https://habr.com/ru/post/699414/?utm_source=habrahabr&utm_medium=rss&utm_campaign=699414

<a href="https://www.liveinternet.ru/users/rss_habrahabr_of_lokoman/post496404282/">[РџРµСЂРµРІРѕРґ] РџСЂРѕРІРµСЂСЏРµРј СЂРµР°Р»РёСЃС‚РёС‡РЅРѕСЃС‚СЊ SLO Рё Р°РЅР°Р»РёР·РёСЂСѓРµРј СЂРёСЃРєРё, РєР°Рє РЅР°СЃС‚РѕСЏС‰РёРµ SRE-РёРЅР¶РµРЅРµСЂС‹</a><br/>РЈСЃС‚Р°РЅРѕРІРєР° SLO (Service Level Objective, С†РµР»РµРІС‹С… СѓСЂРѕРІРЅРµР№ РѕР±СЃР»СѓР¶РёРІР°РЅРёСЏ) вЂ” РѕРґРЅР° РёР· Р±Р°Р·РѕРІС‹С… Р·Р°РґР°С‡ SRE. РџРѕ СЌС‚РёРј РїРѕРєР°Р·Р°С‚РµР»СЏРј СѓРґРѕР±РЅРѕ РѕС†РµРЅРёРІР°С‚СЊ РЅР°РґРµР¶РЅРѕСЃС‚СЊ СЃР»СѓР¶Р±С‹. РџСЂРѕС‚РёРІРѕРїРѕР»РѕР¶РЅРѕСЃС‚СЊ SLO вЂ” Р±СЋРґР¶РµС‚ РЅР° РѕС€РёР±РєРё, С‚Рѕ РµСЃС‚СЊ РєР°РєРѕР№ СѓСЂРѕРІРµРЅСЊ РЅРµРЅР°РґРµР¶РЅРѕСЃС‚Рё СЃС‡РёС‚Р°С‚СЊ РґРѕРїСѓСЃС‚РёРјС‹Рј. РљРѕРіРґР° РјС‹ РѕРїСЂРµРґРµР»РёРј СЌС‚Рё РїРѕРєР°Р·Р°С‚РµР»Рё Рё СѓСЃС‚Р°РЅРѕРІРёРј SLO, РЅСѓР¶РЅРѕ РїСЂРѕРІРµСЂРёС‚СЊ РёС… СЂРµР°Р»РёСЃС‚РёС‡РЅРѕСЃС‚СЊ СЃ СѓС‡РµС‚РѕРј Р°СЂС…РёС‚РµРєС‚СѓСЂС‹ РїСЂРёР»РѕР¶РµРЅРёСЏ Рё СЂР°Р±РѕС‡РёС… РїСЂР°РєС‚РёРє. РњС‹ С‚РѕС‡РЅРѕ СЃРјРѕР¶РµРј РёС… РґРѕСЃС‚РёС‡СЊ? РќР° С‡С‚Рѕ, СЃРєРѕСЂРµРµ РІСЃРµРіРѕ, СѓР№РґС‘С‚ РЅР°С€ Р±СЋРґР¶РµС‚ РЅР° РѕС€РёР±РєРё?SRE-РёРЅР¶РµРЅРµСЂС‹ РёР· Google РѕС‚РІРµС‡Р°СЋС‚ РЅР° СЌС‚Рё РІРѕРїСЂРѕСЃС‹ РїСЂРё РІС‹РїСѓСЃРєРµ РЅРѕРІРѕРіРѕ СЃРµСЂРІРёСЃР°, РєРѕРіРґР° РїСЂРѕРІРѕРґСЏС‚ PRR (Production Readiness Review вЂ” РїСЂРѕРІРµСЂРєСѓ Рі... <a href="https://www.liveinternet.ru/users/rss_habrahabr_of_lokoman/post496404282/">Р§РёС‚Р°С‚СЊ РґР°Р»РµРµ...</a>

Комментировать

« Пред. запись — К дневнику — След. запись »

Страницы: [1] [Новые]

LiveInternetLiveInternet

-Поиск по дневнику

-Подписка по e-mail

-Статистика

[Перевод] Проверяем реалистичность SLO и анализируем риски, как настоящие SRE-инженеры