[Перевод] Масштабируем Kubernetes до 2500 нод

Четверг, 08 Февраля 2018 г. 17:12 + в цитатник

Всем добра!

Ну что ж. Первый поток курса DevOps выпущен, второй обучается вовсю и вот на подходе третий. Курс усовершенствуется, проект тоже, остаётся неизменным пока что одно: интересные статьи, которые мы пока что только переводим для вас, но на носу уже и срывы покровов с тех вещей, что у нас просили :)

Поехали!

Мы используем Kubernetes для исследования в области deep learning уже более двух лет. В то время, как наши самые масштабные нагрузки управляют облачными ВМ напрямую, Kubernetes обеспечивает быстрый итерационный цикл и масштабируемость, что делает его идеальным для наших экспериментов. Сейчас мы управляем несколькими Kubernetes кластерами (как облачными, так и на физическом оборудовании), самый крупный из них состоит из более 2500 нод — это кластер в Azure на комбинации виртуальных машин D15v2 и NC24.

Многие системные компоненты отказывали в процессе масштабирования, включая etcd, Kube мастеров, загрузки образов Docker, сети, KubeDNS и даже ARP кэши наших машин. Поэтому мы решили, что будет полезным поделиться, с какими проблемами мы столкнулись и как с ними справились.

Читать дальше ->

https://habrahabr.ru/post/348640/

<a href="https://www.liveinternet.ru/users/rss_rss_hh_new/post430043431/">[РџРµСЂРµРІРѕРґ] РњР°СЃС€С‚Р°Р±РёСЂСѓРµРј Kubernetes РґРѕ 2500 РЅРѕРґ</a><br/>Р’СЃРµРј РґРѕР±СЂР°!

РќСѓ С‡С‚Рѕ Р¶. РџРµСЂРІС‹Р№ РїРѕС‚РѕРє РєСѓСЂСЃР° DevOps РІС‹РїСѓС‰РµРЅ, РІС‚РѕСЂРѕР№ РѕР±СѓС‡Р°РµС‚СЃСЏ РІРѕРІСЃСЋ Рё РІРѕС‚ РЅР° РїРѕРґС…РѕРґРµ С‚СЂРµС‚РёР№. РљСѓСЂСЃ СѓСЃРѕРІРµСЂС€РµРЅСЃС‚РІСѓРµС‚СЃСЏ, РїСЂРѕРµРєС‚ С‚РѕР¶Рµ, РѕСЃС‚Р°С‘С‚СЃСЏ РЅРµРёР·РјРµРЅРЅС‹Рј РїРѕРєР° С‡С‚Рѕ РѕРґРЅРѕ: РёРЅС‚РµСЂРµСЃРЅС‹Рµ СЃС‚Р°С‚СЊРё, РєРѕС‚РѕСЂС‹Рµ РјС‹ РїРѕРєР° С‡С‚Рѕ С‚РѕР»СЊРєРѕ РїРµСЂРµРІРѕРґРёРј РґР»СЏ РІР°СЃ, РЅРѕ РЅР° РЅРѕСЃСѓ СѓР¶Рµ Рё СЃСЂС‹РІС‹ РїРѕРєСЂРѕРІРѕРІ СЃ С‚РµС… РІРµС‰РµР№, С‡С‚Рѕ Сѓ РЅР°СЃ РїСЂРѕСЃРёР»Рё :)

РџРѕРµС…Р°Р»Рё!

РњС‹ РёСЃРїРѕР»СЊР·СѓРµРј Kubernetes РґР»СЏ РёСЃСЃР»РµРґРѕРІР°РЅРёСЏ РІ РѕР±Р»Р°СЃС‚Рё deep learning СѓР¶Рµ Р±РѕР»РµРµ РґРІСѓС… Р»РµС‚. Р’ С‚Рѕ РІСЂРµРјСЏ, РєР°Рє РЅР°С€Рё СЃР°РјС‹Рµ РјР°СЃС€С‚Р°Р±РЅС‹Рµ РЅР°РіСЂСѓР·РєРё СѓРїСЂР°РІР»СЏСЋС‚ РѕР±Р»Р°С‡РЅС‹РјРё Р’Рњ РЅР°РїСЂСЏРјСѓСЋ, Kubernetes РѕР±РµСЃРїРµС‡РёРІР°РµС‚ Р±С‹СЃС‚СЂС‹Р№ РёС‚РµСЂР°С†РёРѕРЅРЅС‹Р№ С†РёРєР» Рё РјР°СЃС€С‚Р°Р±РёСЂСѓРµРјРѕСЃС‚СЊ, С‡С‚Рѕ РґРµР»Р°РµС‚ РµРіРѕ РёРґРµР°Р»СЊРЅС‹Рј РґР»СЏ РЅР°С€РёС… СЌРєСЃРїРµСЂРёРјРµ... <a href="https://www.liveinternet.ru/users/rss_rss_hh_new/post430043431/">Р§РёС‚Р°С‚СЊ РґР°Р»РµРµ...</a>

Комментировать

« Пред. запись — К дневнику — След. запись »

Страницы: [1] [Новые]

LiveInternetLiveInternet

-Поиск по дневнику

-Подписка по e-mail

-Постоянные читатели

-Статистика

[Перевод] Масштабируем Kubernetes до 2500 нод