Хронология уровня CO в атмосфере США (решение задачи Kaggle с помощью Python+Feature Engineering)
|
|
Суббота, 28 Октября 2017 г. 01:31
+ в цитатник
Хочу поделиться опытом решения задачи по машинному обучению и анализу данных от Kaggle. Данная статья позиционируется как руководство для начинающих пользователей на примере не совсем простой задачи.
Выборка данных
Выборка данных содержит порядка 8,5 млн строк и 29 столбцов.Вот некоторые из параметров:
- Широта-latitude
- Долгота-longitude
- Способ взятия пробы-method_name
- Дата и время взятия пробы-date_local
Задача
- Найти параметры максимально влияющие на уровень CO в атмосфере.
- Создание гипотезы, предсказывающей уровень CO в атмосфере.
- Создание нескольких простых визуализаций.
Читать дальше ->
https://habrahabr.ru/post/341130/
Метки:
author born_2fuck
визуализация данных
python
big data
kaggle
python3
pandas
sklearn
seaborn
-
Запись понравилась
-
0
Процитировали
-
0
Сохранили
-