[Перевод] Отличия LabelEncoder и OneHotEncoder в SciKit Learn |
Если вы недавно начали свой путь в машинном обучении, вы можете запутаться между LabelEncoder и OneHotEncoder. Оба кодировщика — часть библиотеки SciKit Learn в Python и оба используются для преобразования категориальных или текстовых данных в числа, которые наши предсказательные модели понимают лучше. Давайте выясним отличия между кодировщиками на простеньком примере.
Прежде всего, документацию SciKit Learn для LabelEncoder можно найти здесь. Теперь рассмотрим такие данные:
В этом примере первый столбец (страна) является полностью текстовым. Как вы, возможно, уже знаете, мы не можем использовать текст в данных для обучения модели. Поэтому, прежде чем мы сможем начать процесс, нам нужно эти данные подготовить.
Читать дальше ->https://habr.com/ru/post/456294/?utm_source=habrahabr&utm_medium=rss&utm_campaign=456294
Комментировать | « Пред. запись — К дневнику — След. запись » | Страницы: [1] [Новые] |