Обучение на больших данных: Spark MLlib
|
|
Четверг, 26 Февраля 2015 г. 16:53
+ в цитатник
Привет, хабр!
В
прошлый раз мы познакомились с инструментом
Apache Spark, который в последнее время становится чуть ли не самым популярным средством для обработки больших данных и в частности,
Large Scale Machine Learning. Сегодня мы рассмотрим подробнее библиотеку
MlLib, а именно — покажем, как решать задачи машинного обучения — классификации, регресии, кластеризации, а также коллаборативной фильтрации. Кроме этого покажем, как можно исследовать признаки с целью отбора и выделения новых (т.н.
Feature Engineering, о котором мы
говорили ранее, причем
не один раз).
Читать дальше → http://habrahabr.ru/post/251471/
Метки:
Big Data
Apache
Data Mining
Разработка
Python
Большие данные
машинное обучение
анализ данных
Spark
Hadoop
-
Запись понравилась
-
0
Процитировали
-
0
Сохранили
-