Barnes-Hut t-SNE и LargeVis: визуализация больших объёмов данных
|
|
Пятница, 03 Ноября 2017 г. 09:08
+ в цитатник
Наборами данных в миллионы экземпляров в задачах машинного обучения уже давным давно никого не удивишь. Однако мало кто задаётся вопросом, как качественно визуализировать эти титанические пласты информации. Когда размер датасета превышает миллион, становится довольно грустно использовать стандартный t-SNE; остаётся играться с
даунсэмплированием или вовсе ограничиваться грубыми статистическими инструментами. Но на каждую задачу найдётся свой инструмент. В своей статье я бы хотел рассмотреть два алгоритма, которые преодолевают барьер квадратичной сложности: уже хорошо известный Barnes-Hut t-SNE и новый претендент на звание «золотого молотка infovis'a» LargeVis.
(Это не картина художника-абстракциониста, а визуализация LiveJournal-датасета с высоты птичьего полёта) Читать дальше ->
https://habrahabr.ru/post/341208/
Метки:
author Siarshai
машинное обучение
математика
алгоритмы
data mining
visualization
data science
data analysis
exploratory data analysis
tsne
large data
-
Запись понравилась
-
0
Процитировали
-
0
Сохранили
-