Совершеннолетняя журналистика: от России до Кремля |
Анализ публикаций Lenta.ru за 18 лет (с сентября 1999 по декабрь 2017 гг.) средствами python, sklearn, scipy, XGBoost, pymorphy2, nltk, gensim, MongoDB, Keras и TensorFlow.
В исследовании использованы данные из поста «Анализируй это — Lenta.ru» пользователя ildarchegg. Автор любезно предоставил 3 гигабайта статей в удобном формате, и я решил, что это прекрасная возможность протестировать некоторые методы текстовой обработки. Заодно, если повезёт, узнать что-то новое о российской журналистике, обществе и вообще.
Читать дальше ->https://habr.com/post/429270/?utm_source=habrahabr&utm_medium=rss&utm_campaign=429270
Комментировать | « Пред. запись — К дневнику — След. запись » | Страницы: [1] [Новые] |