Обзор фреймворка Luigi для построения последовательностей выполнения задач
|
|
Четверг, 12 Октября 2017 г. 00:05
+ в цитатник
Доброго времени суток! У нас открылось совершенно новое направление обучения —
BigData, а это значит, что немного расширяется горизонт материалов, которыми мы будем делиться с вами. Сегодня рассмотрим Luigi, как часть того, что раскрывается на нашем курсе.
Luigi — фреймворк на языке Python для построения сложных последовательностей по выполнению зависимых задач. Довольно большая часть фреймворка направлена на преобразования данных из различных источников (MySql, Mongo, redis, hdfs) и с помощью различных инструментов (от запуска процесса до выполнения задач разных типов на кластере Hadoop). Разработан в компании Spotify и открыт в виде open source инструмента в 2012 году.
Самое главное преимущество фреймворка — возможность выстраивать последовательности зависимых задач. Фреймворк разрешает зависимости, отслеживает граф выполнения, управляет запуском задач, обрабатывает ошибки с возможностью перезапуска нужных задач, распределяет ресурсы рабочих процессов с возможностью параллельной работы независимых частей графа задач.
Для выполнения всех этих задач существуют и другие инструменты. Это
Oozie,
Pinball,
Airflow (находится в статусе инкубации в Apache — проходит различные проверки, недавно вышел обзор на
хабре). В данной статье рассмотрим только Luigi.
Читать дальше -> https://habrahabr.ru/post/339904/
Метки:
author MaxRokatansky
python
big data
блог компании отус
bigdata
-
Запись понравилась
-
0
Процитировали
-
0
Сохранили
-