[Перевод] Проверки работоспособности и постепенная деградация распределенных систем

Понедельник, 17 Декабря 2018 г. 18:46 + в цитатник

Как всегда, спасибо Фреду Хеберту и Саргуну Дхиллону за то, что прочли черновик этой статьи и предложили нескольких бесценных советов.

В своем докладе о скорости Тамар Берковичи из Box подчеркнула важность проверок работоспособности при автоматическом аварийном переключении баз данных. В частности, она отметила, что мониторинг времени выполнения сквозных запросов, как метод определения работоспособности базы данных, — лучше, чем простое эхо-тестирование (пингирование).

... перебрасывая трафик на другую ноду (реплику), чтобы устранить бездействие, надо построить средства защиты от дребезга и других пограничных ситуаций. Это не сложно. Фокус при организации эффективной работы в том, чтобы знать, когда перевести базу данных в первую позицию, т.е. надо быть в состоянии правильно оценить работоспособность базы данных. Сейчас многие параметры, на которые мы привыкли обращать внимание, — например, загрузка процессора, время ожидания блокировки, частота ошибок, — являются вторичными сигналами. Ни один из этих параметров на самом деле не говорит о способности базы данных к обработке клиентского трафика. Поэтому, если используете их для принятия решения о переключении, можете получить как ложноположительные, так и ложноотрицательные результаты. Наше устройство проверки работоспособности фактически выполняет простые запросы к узлам базы данных и использует данные о выполненных и невыполненных запросах для более точной оценки работоспособности базы данных.

Я обсудила это с другом, и он предположил, что проверки работоспособности должны быть предельно простыми, и что реальный трафик — это лучший критерий для оценки работоспособности процесса.

Читать дальше ->

https://habr.com/post/433462/?utm_source=habrahabr&utm_medium=rss&utm_campaign=433462

<a href="https://www.liveinternet.ru/users/rss_habrahabr_of_lokoman/post446229999/">[РџРµСЂРµРІРѕРґ] РџСЂРѕРІРµСЂРєРё СЂР°Р±РѕС‚РѕСЃРїРѕСЃРѕР±РЅРѕСЃС‚Рё Рё РїРѕСЃС‚РµРїРµРЅРЅР°СЏ РґРµРіСЂР°РґР°С†РёСЏ СЂР°СЃРїСЂРµРґРµР»РµРЅРЅС‹С… СЃРёСЃС‚РµРј</a><br/>
РљР°Рє РІСЃРµРіРґР°, СЃРїР°СЃРёР±Рѕ Р¤СЂРµРґСѓ РҐРµР±РµСЂС‚Сѓ Рё РЎР°СЂРіСѓРЅСѓ Р”С…РёР»Р»РѕРЅСѓ Р·Р° С‚Рѕ, С‡С‚Рѕ РїСЂРѕС‡Р»Рё С‡РµСЂРЅРѕРІРёРє СЌС‚РѕР№ СЃС‚Р°С‚СЊРё Рё РїСЂРµРґР»РѕР¶РёР»Рё РЅРµСЃРєРѕР»СЊРєРёС… Р±РµСЃС†РµРЅРЅС‹С… СЃРѕРІРµС‚РѕРІ.
Р’ СЃРІРѕРµРј РґРѕРєР»Р°РґРµ Рѕ СЃРєРѕСЂРѕСЃС‚Рё РўР°РјР°СЂ Р‘РµСЂРєРѕРІРёС‡Рё РёР· Box РїРѕРґС‡РµСЂРєРЅСѓР»Р° РІР°Р¶РЅРѕСЃС‚СЊ РїСЂРѕРІРµСЂРѕРє СЂР°Р±РѕС‚РѕСЃРїРѕСЃРѕР±РЅРѕСЃС‚Рё РїСЂРё Р°РІС‚РѕРјР°С‚РёС‡РµСЃРєРѕРј Р°РІР°СЂРёР№РЅРѕРј РїРµСЂРµРєР»СЋС‡РµРЅРёРё Р±Р°Р· РґР°РЅРЅС‹С…. Р’ С‡Р°СЃС‚РЅРѕСЃС‚Рё, РѕРЅР° РѕС‚РјРµС‚РёР»Р°, С‡С‚Рѕ РјРѕРЅРёС‚РѕСЂРёРЅРі РІСЂРµРјРµРЅРё РІС‹РїРѕР»РЅРµРЅРёСЏ СЃРєРІРѕР·РЅС‹С… Р·Р°РїСЂРѕСЃРѕРІ, РєР°Рє РјРµС‚РѕРґ РѕРїСЂРµРґРµР»РµРЅРёСЏ СЂР°Р±РѕС‚РѕСЃРїРѕСЃРѕР±РЅРѕСЃС‚Рё Р±Р°Р·С‹ РґР°РЅРЅС‹С…, вЂ” Р»СѓС‡С€Рµ, С‡РµРј РїСЂРѕСЃС‚РѕРµ СЌС…Рѕ-С‚РµСЃС‚РёСЂРѕРІР°РЅРёРµ (РїРёРЅРіРёСЂРѕРІР°РЅРёРµ).
...В РїРµСЂРµР±СЂР°СЃС‹РІР°СЏ С‚СЂР°С„РёРє РЅР° РґСЂСѓРіСѓСЋ РЅРѕРґСѓ (СЂРµРїР»РёРєСѓ), С‡С‚РѕР±С‹ СѓСЃС‚СЂР°РЅРёС‚СЊ Р±РµР·РґРµР№СЃС‚РІРёРµ, РЅР°РґРѕ РїРѕСЃС‚СЂРѕРёС‚СЊ СЃСЂРµРґСЃС‚РІР° Р·Р°С‰РёС‚С‹ РѕС‚ РґСЂРµР±РµР·РіР° ... <a href="https://www.liveinternet.ru/users/rss_habrahabr_of_lokoman/post446229999/">Р§РёС‚Р°С‚СЊ РґР°Р»РµРµ...</a>

Комментировать

« Пред. запись — К дневнику — След. запись »

Страницы: [1] [Новые]

LiveInternetLiveInternet

-Поиск по дневнику

-Подписка по e-mail

-Статистика

[Перевод] Проверки работоспособности и постепенная деградация распределенных систем