Обучение на больших данных: Spark MLlib

Четверг, 26 Февраля 2015 г. 16:53 + в цитатник

Привет, хабр!

В прошлый раз мы познакомились с инструментом Apache Spark, который в последнее время становится чуть ли не самым популярным средством для обработки больших данных и в частности, Large Scale Machine Learning. Сегодня мы рассмотрим подробнее библиотеку MlLib, а именно — покажем, как решать задачи машинного обучения — классификации, регресии, кластеризации, а также коллаборативной фильтрации. Кроме этого покажем, как можно исследовать признаки с целью отбора и выделения новых (т.н. Feature Engineering, о котором мы говорили ранее, причем не один раз).
Читать дальше →

http://habrahabr.ru/post/251471/

<a href="https://www.liveinternet.ru/users/rss_habrahabr_of_lokoman/post354788965/">РћР±СѓС‡РµРЅРёРµ РЅР° Р±РѕР»СЊС€РёС… РґР°РЅРЅС‹С…: Spark MLlib</a><br/>РџСЂРёРІРµС‚, С…Р°Р±СЂ!

Р’ РїСЂРѕС€Р»С‹Р№ СЂР°Р· РјС‹ РїРѕР·РЅР°РєРѕРјРёР»РёСЃСЊ СЃ РёРЅСЃС‚СЂСѓРјРµРЅС‚РѕРј Apache Spark, РєРѕС‚РѕСЂС‹Р№ РІ РїРѕСЃР»РµРґРЅРµРµ РІСЂРµРјСЏ СЃС‚Р°РЅРѕРІРёС‚СЃСЏ С‡СѓС‚СЊ Р»Рё РЅРµ СЃР°РјС‹Рј РїРѕРїСѓР»СЏСЂРЅС‹Рј СЃСЂРµРґСЃС‚РІРѕРј РґР»СЏ РѕР±СЂР°Р±РѕС‚РєРё Р±РѕР»СЊС€РёС… РґР°РЅРЅС‹С… Рё РІ С‡Р°СЃС‚РЅРѕСЃС‚Рё, Large Scale Machine Learning. РЎРµРіРѕРґРЅСЏ РјС‹ СЂР°СЃСЃРјРѕС‚СЂРёРј РїРѕРґСЂРѕР±РЅРµРµ Р±РёР±Р»РёРѕС‚РµРєСѓ MlLib, Р° РёРјРµРЅРЅРѕ вЂ” РїРѕРєР°Р¶РµРј, РєР°Рє СЂРµС€Р°С‚СЊ Р·Р°РґР°С‡Рё РјР°С€РёРЅРЅРѕРіРѕ РѕР±СѓС‡РµРЅРёСЏ вЂ” РєР»Р°СЃСЃРёС„РёРєР°С†РёРё, СЂРµРіСЂРµСЃРёРё, РєР»Р°СЃС‚РµСЂРёР·Р°С†РёРё, Р° С‚Р°РєР¶Рµ РєРѕР»Р»Р°Р±РѕСЂР°С‚РёРІРЅРѕР№ С„РёР»СЊС‚СЂР°С†РёРё. РљСЂРѕРјРµ СЌС‚РѕРіРѕ РїРѕРєР°Р¶РµРј, РєР°Рє РјРѕР¶РЅРѕ РёСЃСЃР»РµРґРѕРІР°С‚СЊ РїСЂРёР·РЅР°РєРё СЃ С†РµР»СЊСЋ РѕС‚Р±РѕСЂР° Рё РІС‹РґРµР»РµРЅРёСЏ РЅРѕРІС‹С… (С‚.РЅ. Feature Engineering, Рѕ РєРѕС‚РѕСЂРѕРј РјС‹ РіРѕРІРѕСЂРёР»Рё СЂР°РЅРµРµ, РїСЂРёС‡РµРј РЅРµ РѕРґРёРЅ СЂР°Р·).
 Р§РёС‚Р°С‚СЊ РґР°Р»СЊС€Рµ &rarr; ... <a href="https://www.liveinternet.ru/users/rss_habrahabr_of_lokoman/post354788965/">Р§РёС‚Р°С‚СЊ РґР°Р»РµРµ...</a>

Комментировать

« Пред. запись — К дневнику — След. запись »

Страницы: [1] [Новые]

LiveInternetLiveInternet

-Поиск по дневнику

-Подписка по e-mail

-Статистика

Обучение на больших данных: Spark MLlib