Случайны выбор дневника Раскрыть/свернуть полный список возможностей


Найдено 73 сообщений
Cообщения с меткой

sklearn - Самое интересное в блогах

Следующие 30  »
rss_habr

Шпаргалка для подготовки к экзамену по машинному обучению

Пятница, 09 Декабря 2022 г. 23:26 (ссылка)

Многие студенты колледжей в России в этом году будут обязаны сдать демо-экзамен по дисциплине, посвящённой изучению темы машинного обучения, но качество обучения в учебном заведении может страдать в силу малого количества опыта в вопросе проведения подобного рода тестирования. В силу данного обстоятельства студенты в поисках материала для подготовки обращаются к помощи интернет ресурсов, но с ужасом обнаруживают, что информация не такая структуризированная, как было бы удобно экзаменуемым.

Меня тоже коснулась эта проблема, поэтому я решил написать статью, объясняющую принципы работы с необходимыми инструментами для сдачи демонстративного экзамена.

Читать далее

https://habr.com/ru/post/704608/?utm_source=habrahabr&utm_medium=rss&utm_campaign=704608

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Группируем текстовые записи с помощью Python и CountVectorizer

Среда, 30 Ноября 2022 г. 16:55 (ссылка)

Общедоступные реестры клинических исследований, такие как clinicaltrial.gov, печально известны низкой структурированностью данных. Попытка построить сводный отчет, например, о количестве исследований, проводимых ведущими фармкомпаниями, натыкается на давно всем надоевшую проблему множественных написаний одинаковых по смыслу значений.

В очередной раз столкнувшись с этой проблемой при анализе данных в pandas, я решил подключить к решению CountVectorizer из scikit-learn. Результат показался интересным. Сразу оговорюсь, что в данном случае я не использую методы и алгоритмы машинного обучения, а только CountVectorizer как инструмент.

Читать далее

https://habr.com/ru/post/702626/?utm_source=habrahabr&utm_medium=rss&utm_campaign=702626

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

[Перевод] Как писать преобразователи данных в Sklearn

Пятница, 08 Июля 2022 г. 19:49 (ссылка)

Сегодня разбираемся, как создавать собственные преобразователи Sklearn, позволяющие интегрировать практически любую функцию или преобразование данных в классы конвейера Sklearn. Подробности под катом к старту флагманского курса по Data Science.

Читать далее

https://habr.com/ru/post/675876/?utm_source=habrahabr&utm_medium=rss&utm_campaign=675876

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Анализ данных виртуальных велотренировок

Пятница, 15 Апреля 2022 г. 14:51 (ссылка)

В этой статье я расскажу как помощью python построить базовый график тренировки, произвести дополнительные расчеты и как определить похожие тренировки, а также о том какие бывают виртуальные велотренировки.

У вас на руках должен быть FIT-файлы тренировок, и установлены модули matplotlib, pandas, sklearn. В конце статьи ссылка на git с примерами.

Читать далее

https://habr.com/ru/post/661067/?utm_source=habrahabr&utm_medium=rss&utm_campaign=661067

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Как аналитик при помощи простых инструментов может создать ключевую ценность для информационного SaaS-продукта

Понедельник, 11 Апреля 2022 г. 16:23 (ссылка)

Всем привет! Меня зовут Саша и я занимаюсь продуктовой аналитикой в Циан. В этой статье я расскажу, как аналитик без привлечения ML может создать ключевую ценность для информационного SaaS-продукта.

Читать далее

https://habr.com/ru/post/660245/?utm_source=habrahabr&utm_medium=rss&utm_campaign=660245

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Как я учил нейронные сети играть в казино

Понедельник, 22 Ноября 2021 г. 20:43 (ссылка)

Привет, Хабр! Меня зовут Михаил, я учусь на втором курсе Южно-Уральского государственного Университета и одни из самых любимых вещей в моей жизни - это программирование и азартные игры.

Уже около года я занимаюсь машинным обучением, а значит пора закрепить полученные навыки на практике. Тема исследования казино давно меня интересовала, а знакомство с sklearn и компанией дало мне обширный арсенал для этого.

Сегодня мы будем считать чужие деньги, писать парсер, исследовать данные, создавать модели машинного обучения и смотреть мемы.

Place a bet

https://habr.com/ru/post/590817/?utm_source=habrahabr&utm_medium=rss&utm_campaign=590817

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Как посчитать количество звёзд на фото?

Суббота, 13 Ноября 2021 г. 20:58 (ссылка)

В данной статье я расскажу как разобрать изображение на сегменты, кластеризовать данные и просто посчитать количество звезд на фото.

Узнать!

https://habr.com/ru/post/589003/?utm_source=habrahabr&utm_medium=rss&utm_campaign=589003

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

[Перевод] Запускаем модель машинного обучения на iPhone

Воскресенье, 18 Апреля 2021 г. 18:10 (ссылка)

Чего уж только на Хабре не было, и DOOM на осциллографе, тесте на беременности и калькуляторе запускали, даже сервер Minecraft на зеркалке Canon 200D поднимали. Сегодня же, специально к старту нового потока курса по Machine Learning и углубленного Machine Learning и Deep Learning, попробуем описать кратчайший путь от обучения модели машинного обучения на Python до доказательства концепции iOS-приложения, которое можно развернуть на iPhone. Цель статьи — дать базовый скаффолдинг, оставляя место для дальнейшей настройки, подходящей для конкретного случая использования.

Приятного чтения

https://habr.com/ru/post/552402/?utm_source=habrahabr&utm_medium=rss&utm_campaign=552402

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Подбор гиперпараметров ML-модели с помощью HYPEROPT

Вторник, 16 Февраля 2021 г. 11:12 (ссылка)

В машинном обучении гиперпараметрами называют параметры модели, значения которых устанавливаются перед запуском процесса её обучения. Ими могут быть, как параметры самого алгоритма, например, глубина дерева в random forest, число соседей в knn, веса нейронов в нейронный сетях, так и способы обработки признаков, пропусков и т.д. Они используются для управления процессом обучения, поэтому подбор оптимальных гиперпараметров – очень важный этап в построении ML-моделей, позволяющий повысить точность, а также бороться с переобучением. На сегодняшний день существуют несколько популярных подходов к решению задачи подбора, например:

1.Поиск по решётке. В этом способе значения гиперпараметров задаются вручную, затем выполняется их полный перебор. Популярной реализацией этого метода является Grid Search из sklearn. Несмотря на свою простоту этот метод имеет и серьёзные недостатки:

Очень медленный т.к. надо перебрать все комбинации всех параметров. Притом перебор будет продолжаться даже при заведомо неудачных комбинациях.

Часто в целях экономии времени приходится укрупнять шаг перебора, что может привести к тому, что оптимальное значение параметра не будет найдено. Например, если задан диапазон значений от 100 до 1000 с шагом 100 (примером такого параметра может быть количество деревьев в случайном лесе, или градиентном бустинге), а оптимум находится около 550, то GridSearch его не найдёт.

2.Случайный поиск. Здесь параметры берутся случайным образом из выборки с указанным распределением. В sklearn он этот метод реализован как Randomized Search. В большинстве случаев он быстрее GridSearch, к тому же значения параметров не ограничены сеткой. Однако, даже это не всегда позволяет найти оптимум и не защищает от перебора заведомо неудачных комбинаций.

3.Байесовская оптимизация. Здесь значения гиперпараметров в текущей итерации выбираются с учётом результатов на предыдущем шаге. Основная идея алгоритма заключается в следующем – на каждой итерации подбора находится компромисс между исследованием регионов с самыми удачными из найденных комбинаций гиперпараметров и исследованием регионов с большой неопределённостью (где могут находиться ещё более удачные комбинации). Это позволяет во многих случаях найти лучшие значения параметров модели за меньшее количество времени.

Читать далее

https://habr.com/ru/post/542624/?utm_source=habrahabr&utm_medium=rss&utm_campaign=542624

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

[Перевод] Понимание деревьев решений в машинном обучении и их реализация с помощью Python

Понедельник, 09 Ноября 2020 г. 17:17 (ссылка)

Совсем скоро, 20 ноября, у нас стартует новый поток «Математика и Machine Learning для Data Science», и в преддверии этого мы делимся с вами полезным переводом с подробным, иллюстрированным объяснением дерева решений, разъяснением энтропии дерева решений с формулами и простыми примерами, вводом понятия «информационный выигрыш», которое игнорируется большинством умозрительно-простых туториалов. Статья рассчитана на любящих математику новичков, которые хотят больше разобраться вработе дерева принятия решений. Для полной ясности взят совсем маленький набор данных. В конце статьи — ссылка на код на Github.




Приятного чтения!

https://habr.com/ru/post/526970/?utm_source=habrahabr&utm_medium=rss&utm_campaign=526970

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

[Из песочницы] Ищем «Троллей». Алгоритм шинглов & косинусное сходство

Пятница, 25 Сентября 2020 г. 17:55 (ссылка)



Думаю, многие в напряженных дискуссиях в интернете сталкивались с обвинением людей в том, что они боты, тролли и проплачены Кремлем, Киевом или Вашингтоном. Но как действительно выявить таковых или просто людей пытающихся активно донести своё мнение до остальных?

Читать дальше →

https://habr.com/ru/post/520696/?utm_source=habrahabr&utm_medium=rss&utm_campaign=520696

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

[Из песочницы] Анализируем шедевры живописи с помощью классического ML

Понедельник, 01 Июня 2020 г. 12:58 (ссылка)

Всем привет! Один мой друг учится на художника и регулярно вдохновленно рассказывает о том или ином шедевре, о неповторимых композиционных приемах, о цветовосприятии, об эволюции живописи и гениальных художниках. На фоне этого постоянного воздействия я решил проверить, годятся ли мои инженерные знания и навыки для анализа мирового культурного наследия.



Вооружившись самодельным парсером под покровом ночи я ворвался в онлайн галерею и вынес оттуда почти 50 тысяч картин. Давайте разберем, что интересного с этим можно сделать, используя только классические ML инструменты (осторожно, трафик).

Читать дальше →

https://habr.com/ru/post/504806/?utm_source=habrahabr&utm_medium=rss&utm_campaign=504806

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Детектирование аномалий с помощью автоенкодеров на Python

Понедельник, 09 Марта 2020 г. 09:19 (ссылка)

Детектирование аномалий — интересная задача машинного обучения. Не существует какого-то определенного способа ее решения, так как каждый набор данных имеет свои особенности. Но в то же время есть несколько подходов, которые помогают добиться успеха. Я хочу рассказать про один из таких подходов — автоенкодеры.

Читать дальше →

https://habr.com/ru/post/491552/?utm_source=habrahabr&utm_medium=rss&utm_campaign=491552

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

[Из песочницы] Ансамбли нейронных сетей с PyTorch и Sklearn

Среда, 19 Февраля 2020 г. 15:41 (ссылка)

Нейронные сети довольно популярны. Их главное преимущество в том, что они способны обобщать довольно сложные данные, на которых другие алгоритмы показывают низкое качество. Но что делать, если качество нейронной сети все еще неудовлетворительное?



И тут на помощь приходят ансамбли...



Что такое ансамбли



Ансамбль алгоритмов машинного обучения — это использование нескольких (не обязательно разных) моделей вместо одной. То есть сначала мы обучаем каждую модель, а затем объединяем их предсказания. Получается, что наши модели вместе образуют одну более сложную (в плане обобщающей способности — способности "понимать" данные) модель, которую часто называют метамоделью. Чаще всего метамодель обучается уже не на нашей первоначальной выборке данных, а на предсказаниях других моделей. Она как бы учитывает опыт всех моделей, и это позволяет уменьшить ошибки.

Читать дальше →

https://habr.com/ru/post/489058/?utm_source=habrahabr&utm_medium=rss&utm_campaign=489058

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество

Следующие 30  »

<sklearn - Самое интересное в блогах

Страницы: [1] 2 3 ..
.. 10

LiveInternet.Ru Ссылки: на главную|почта|знакомства|одноклассники|фото|открытки|тесты|чат
О проекте: помощь|контакты|разместить рекламу|версия для pda