Intel и Facebook совместно повышают производительность библиотеки Caffe2

Вторник, 30 Мая 2017 г. 09:14 + в цитатник

Каждый день окружающий нас мир генерирует все больше и больше информации — текстовой, графической, мультимедийной и т.д. За последние годы технологии искусственного разума и глубокого изучения сумели улучшить ряд приложений, которые помогают людям лучше воспринимать эту информацию, обогатив их возможностями распознавания речи, видео, изображений, а также функционалом рекомендаций.

За последний год Intel добавила аппаратную поддержку ЦПУ в нескольких фреймворков глубокого изучения для оптимизации приложений, делающих выводы на основе анализа. Основой этих оптимизаций является Intel Math Kernel Library (Intel MKL), использующая инструкции Intel Advanced Vector Extension (Intel AVX-512) для расширенной поддержки функционала глубокого изучения.

Caffe2 — это open source фреймворк глубокого изучения, созданный Facebook и отличающийся высокой скоростью работы и модульным исполнением. Caffe2 разработан для того, чтобы помочь исследователям тренировать большие модели машинного обучения и разрабатывать AI для мобильных устройств.

Intel и Facebook совместно интегрируют функции Intel MKL в Caffe2 для оптимальной производительности получения выводов. Таблица ниже показывает скорость получения выводов с
использованием библиотек Intel MKL и Eigen BLAS. В таблице OMP_NUM_THREADS показывает количество используемых физических ядер. Результаты показывают, что Caffe2 может быть хорошо оптимизирован с точки зрения процессора. Для небольших пакетов нагрузок рекомендуется использовать свое процессорное ядро для каждой нагрузки и запускать их параллельно.

	OMP_NUM_THREADS=44		OMP_NUM_THREADS=1
Размер пакета	Intel MKL (изобр./сек)	Eigen BLAS (изобр./сек)	Intel MKL (изобр./сек)	Eigen BLAS (изобр./сек)
1	173.4	5.2	28.6	5.1
32	1500.2	29.3	64.6	15.4
64	1596.3	35.3	66.0	15.5
256	1735.2	44.9	67.3	16.2

Ранее в этом году на рынок были выведено новое поколение процессоров Intel Xeon (кодовое название Skylake). Одной из новинок Skylake стали 512-битные инструкции Fused Multiply Add (FMA) как часть векторного набора Intel AVX-512, обеспечивающего существенный прирост производительности по сравнению с предыдущими 256-битными инструкциями AVX2 как для тренировки моделей, так и для подсчета выводов. 512-битные функции FMA вдвое увеличивают достигаемые процессором FLOPS и сильно ускоряют матричную арифметику одинарной точности, используемую в сверточных и рекурентных нейронных сетях. Подсчет выводов хорошо параллелизуется и получит выгоду от увеличения количества ядер в новых процессорах. Кроме того, на скорости работы благотворно скажется увеличение частоты памяти и размера кэша Mid-Level-Cache (MLC) на одно ядро.

Original source: habrahabr.ru (comments, light).

https://habrahabr.ru/post/329682/

<a href="https://www.liveinternet.ru/users/rss_rss_hh_new/post415863191/">Intel Рё Facebook СЃРѕРІРјРµСЃС‚РЅРѕ РїРѕРІС‹С€Р°СЋС‚ РїСЂРѕРёР·РІРѕРґРёС‚РµР»СЊРЅРѕСЃС‚СЊ Р±РёР±Р»РёРѕС‚РµРєРё Caffe2</a><br/>

РљР°Р¶РґС‹Р№ РґРµРЅСЊ РѕРєСЂСѓР¶Р°СЋС‰РёР№ РЅР°СЃ РјРёСЂ РіРµРЅРµСЂРёСЂСѓРµС‚ РІСЃРµ Р±РѕР»СЊС€Рµ Рё Р±РѕР»СЊС€Рµ РёРЅС„РѕСЂРјР°С†РёРё вЂ” С‚РµРєСЃС‚РѕРІРѕР№, РіСЂР°С„РёС‡РµСЃРєРѕР№, РјСѓР»СЊС‚РёРјРµРґРёР№РЅРѕР№ Рё С‚.Рґ. Р—Р° РїРѕСЃР»РµРґРЅРёРµ РіРѕРґС‹ С‚РµС…РЅРѕР»РѕРіРёРё РёСЃРєСѓСЃСЃС‚РІРµРЅРЅРѕРіРѕ СЂР°Р·СѓРјР° Рё РіР»СѓР±РѕРєРѕРіРѕ РёР·СѓС‡РµРЅРёСЏ СЃСѓРјРµР»Рё СѓР»СѓС‡С€РёС‚СЊ СЂСЏРґ РїСЂРёР»РѕР¶РµРЅРёР№, РєРѕС‚РѕСЂС‹Рµ РїРѕРјРѕРіР°СЋС‚ Р»СЋРґСЏРј Р»СѓС‡С€Рµ РІРѕСЃРїСЂРёРЅРёРјР°С‚СЊ СЌС‚Сѓ РёРЅС„РѕСЂРјР°С†РёСЋ, РѕР±РѕРіР°С‚РёРІ РёС… РІРѕР·РјРѕР¶РЅРѕСЃС‚СЏРјРё СЂР°СЃРїРѕР·РЅР°РІР°РЅРёСЏ СЂРµС‡Рё, РІРёРґРµРѕ, РёР·РѕР±СЂР°Р¶РµРЅРёР№, Р° С‚Р°РєР¶Рµ С„СѓРЅРєС†РёРѕРЅР°Р»РѕРј СЂРµРєРѕРјРµРЅРґР°С†РёР№.

Р—Р° РїРѕСЃР»РµРґРЅРёР№ РіРѕРґ Intel РґРѕР±Р°РІРёР»Р° Р°РїРїР°СЂР°С‚РЅСѓСЋ РїРѕРґРґРµСЂР¶РєСѓ Р¦РџРЈ РІ РЅРµСЃРєРѕР»СЊРєРёС… С„СЂРµР№РјРІРѕСЂРєРѕРІ РіР»СѓР±РѕРєРѕРіРѕ РёР·СѓС‡РµРЅРёСЏ РґР»СЏ РѕРїС‚РёРјРёР·Р°С†РёРё РїСЂРёР»РѕР¶РµРЅРёР№, РґРµР»Р°СЋС‰РёС… РІС‹РІРѕРґС‹ РЅР° РѕСЃРЅРѕРІРµ Р°РЅР°Р»РёР·Р°. РћСЃРЅРѕРІРѕР№ СЌС‚РёС… РѕРїС‚РёРјРёР·Р°С†РёР№ СЏРІР»СЏРµС‚СЃСЏ Intel Math Kern... <a href="https://www.liveinternet.ru/users/rss_rss_hh_new/post415863191/">Р§РёС‚Р°С‚СЊ РґР°Р»РµРµ...</a>

Комментировать

« Пред. запись — К дневнику — След. запись »

Страницы: [1] [Новые]

LiveInternetLiveInternet

-Поиск по дневнику

-Подписка по e-mail

-Постоянные читатели

-Статистика

Intel и Facebook совместно повышают производительность библиотеки Caffe2