Когда данных действительно много: Vowpal Wabbit
|
|
Воскресенье, 25 Января 2015 г. 19:59
+ в цитатник
Привет, хабр!
В предыдущих двух постах (
раз,
два) мы расмотрели основные алгоритмы и техники, применяющиеся участниками соревнований
Kaggle. Сегодня хотелось бы пойти дальше и поговорить про то, с какими трудностями встречаются исследователи при разработке алгоритмов в случае, когда данных очень много и обучаться приходится на выборках, которые не помещаются в память. Сразу стоит отметить, что это происходит довольно часто,
даже на самом Kaggle (в данной задаче обучающая выборка имеет обьем в несколько гигабайт и новичку может быть просто не понятно, что с этим делать). Ниже мы рассмотрим алгоритмы машинного обучения и инструменты, справляющиеся с данной проблемой.
Читать дальше → http://habrahabr.ru/post/248779/
Метки:
Big Data
*nix
Data Mining
Разработка
Python
Machine Learning
-
Запись понравилась
-
0
Процитировали
-
0
Сохранили
-