Kaggle Mercedes и кросс-валидация
|
|
Среда, 23 Августа 2017 г. 15:28
+ в цитатник
Всем привет, в этом посте я расскажу о том, как мне удалось занять 11 место в
конкурсе от компании Мерседес на kaggle, который можно охарактеризовать как лидера по количеству участников и по эпичности shake-up. Здесь можно ознакомиться с
моим решением, там же ссылка на github, здесь можно посмотреть
презентацию моего решения в Yandex.
В этом посте пойдет речь о том, как студент консерватории попал в data science, стал призером двух подряд kaggle-соревнований, и каким образом методы математической статистики помогают не переобучиться на публичный лидерборд
Начну я с того, что немного расскажу о задаче и о том, почему я взялся ее решать. Должен сказать, что в data science я человек новый. Лет 7 назад я закончил Физический Факультет СПбГУ и с тех пор занимался тем, что получал музыкальное образование. Идея немного размять мозг и вернуться к техническим задачам впервые посетила меня примерно два года назад, на тот момент я уже работал в оркестре Московской Филармонии и учился на 3 курсе в Консерватории. Начал я с того, что вооружившись книгой Страуструпа стал осваивать C++. Далее были конечно же разные онлайн курсы и примерно год назад я стал склоняться к мысли о том, что Data Science — это пожалуй именно то, чем я хотел бы заниматься в IT. Мое “образование” в Data Science — это
курс от Яндекса и Вышки на курсере, несколько курсов из
специализации МФТИ на курсере и конечно же постоянное саморазвитие в соревнованиях.
Читать дальше ->
https://habrahabr.ru/post/336168/
-
Запись понравилась
-
0
Процитировали
-
0
Сохранили
-