gpu - Самое интересное в блогах

rss_habr

[Перевод] Как можно ускорить Python сегодня

Суббота, 31 Декабря 2022 г. 13:00 (ссылка)

Python не перестаёт удивлять многих своей гибкостью и эффективностью. Лично я являюсь приверженцем С и Fortran, а также серьёзно увлекаюсь C++, поскольку эти языки позволяют добиться высокого быстродействия. Python тоже предлагает такие возможности, но дополнительно выделяется удобством, за что я его и люблю.

Этот инструмент способен обеспечивать хорошее быстродействие, поскольку имеет в арсенале ключевые оптимизированные библиотеки, а также возможность динамической компиляции основного кода, который предварительно не компилировался. Однако скорость Python значительно падает, когда дело доходит до обработки крупных датасетов или более сложных алгоритмов. В текущей статье мы разберём:

Почему столь важно думать о «будущем разнородных вычислений».

Две ключевых сложности, которые необходимо преодолеть в открытом решении.

Параллельное выполнение задач для более эффективного задействования CPU.

Использование ускорителя для дополнительного повышения быстродействия.

Один только третий пункт позволил увеличить быстродействие в 12 раз притом, что четвёртый позволяет добиться ещё большего за счёт ускорителя. Эти простые техники могут оказаться бесценными при работе с Python, когда требуется добиться дополнительного ускорения программы. Описанные здесь приёмы позволяют нам уверенно продвигаться вперёд без длительного ожидания результатов. Читать дальше →

https://habr.com/ru/post/708358/?utm_source=habrahabr&utm_medium=rss&utm_campaign=708358

Комментарии (0)Комментировать В цитатник или сообщество

rss_habr

[Перевод] Сказ о M1 GPU

Четверг, 16 Декабря 2022 г. 01:09 (ссылка)

https://habr.com/ru/post/705852/?utm_source=habrahabr&utm_medium=rss&utm_campaign=705852

Метки: Программирование Rust Разработка под Linux Процессоры Linux GPU высокая производительность драйверы

Комментарии (0)Комментировать В цитатник или сообщество

rss_habr

[Перевод] Пишем кастомные CUDA-ядра на Triton

Среда, 30 Ноября 2022 г. 11:01 (ссылка)

Triton – это языковой компилятор для создания сильно оптимизированных ядер CUDA. Здесь будут изложены основы программирования для GPU и рассказано, как для этой цели используется Triton.

Учитывая нынешний успех глубокого обучения и вал исследовательских статей на эту тему, часто возникает такая ситуация: рождается какая-нибудь новая идея, и выясняется, что для нее не поддерживается аппаратное ускорение. Точнее, стоит вам изобрести новую функцию активации или механизм самовнимания – нам сразу приходится прибегать к возможностям PyTorch/Tensorflow для обработки прямого и обратного прохода через модуль.

В таких случаях применим, например, PyTorch JIT. Но PyTorch JIT – это высокоуровневый компилятор, способный оптимизировать лишь некоторые части кода, но непригодный для написания специализированных ядер CUDA.
Читать дальше →

https://habr.com/ru/post/702298/?utm_source=habrahabr&utm_medium=rss&utm_campaign=702298

Комментарии (0)Комментировать В цитатник или сообщество

rss_habr

[recovery mode] Нужен ли вам GPU-сервер

Среда, 09 Ноября 2022 г. 15:44 (ссылка)

Сегодня никого не удивляет, что процессоры видеокарт обладают большей вычислительной мощностью, чем процессоры компьютеров. Эту особенность давно оценили все, кто нуждается в высокопроизводительных вычислениях, тем более, что сами производители видеокарт поддерживают такой режим их использования, выпустив библиотеки для использования видеопроцессора в так называемом General Purpose режиме.

Тенденцию подхватили и производители оборудования. На волне популярности криптовалют в продаже появились майнинговые фермы, а когда восторги поутихли, обнаружились и более сбалансированные решения для высокопроизводительных вычислений — GPU-сервера.

В этом посте поговорим о том, чем GPU-сервер отличается от майнинг-фермы и о том, как устроен GPU-сервер.

https://habr.com/ru/post/698366/?utm_source=habrahabr&utm_medium=rss&utm_campaign=698366

Метки: Блог компании Acer Высокая производительность Серверная оптимизация GPGPU gpu производительность криптовалюта майнинг сервера

Комментарии (0)Комментировать В цитатник или сообщество

rss_habr

[Перевод] Почему набор инструкций AVX 512 полезен для RPCS3?

Понедельник, 08 Ноября 2022 г. 00:47 (ссылка)

Часто приходится слышать, что важность отличий между наборами инструкций на современных компьютерах преувеличена и, в самом деле, сложно не согласиться с таким наблюдением. Поскольку стандартная программа на 90 % состоит из простейших инструкций для АЛУ, загрузки и сохранения, а также инструкций ветвления, а также с учётом, что на таком базовом уровне разбежки между различными наборами команд очень невелики, такой вывод просто напрашивается.

Но PS3, эмулятор RPCS3 – не просто обычная программа. Даже если вам не доводилось работать с самим эмулятором, вам наверняка приводили RPCS3 в пример как образец
потребительского ПО, в котором используются сильные стороны AVX-512. В этой
статье я расскажу, почему именно новые инструкции и возможности, введённые в семействе
AVX-512, так полезны для эмуляции PS3. В некоторых ситуациях использование 512-разрядных инструкций может положительно сказываться на RPCS3, но в этом посте будет рассказано, почему новые инструкции полезны и для 128-разрядных, и для 256-разрядных конфигураций.

https://habr.com/ru/post/697972/?utm_source=habrahabr&utm_medium=rss&utm_campaign=697972

Метки: Программирование Процессоры Высокая производительность avx-512 avx2 цп gpu эмуляторы

Комментарии (0)Комментировать В цитатник или сообщество

rss_habr

AMD проводит суперкомпьютерный день в Казахстане. Можно подсоединиться по Зуму

Среда, 21 Сентября 2022 г. 18:40 (ссылка)

AMD проводит суперкомпьютерный день в Назарбаевском Университете в Астане, в Казахстане. 29 сентября. Можно подсоединиться по Зуму. Зарегистрироваться можно до 27 сентября по ссылке.

Вообще приезжающие в Астану замечали, что в городе есть амальгамация духа советских городов с духом американского Лас-Вегаса, в частности в элементах архитектуры.

Теперь можно добавить и другое сходство: в Лас-Вегасе помимо казино есть университет, в котором еще в допотопные времена стояли суперкомпьютеры и велись конкурсы на качество распознавания образов. Также там сейчас преподает Сара Харрис, соавтор известного учебника. Кроме этого в Лас-Вегасе иногда проводится конференция DAC по автоматизации проектирования электроники. Почему бы не превратить Астану в евразийский центр такого рода?

Расписание докладов суперкомпьютерного дня

https://habr.com/ru/post/689398/?utm_source=habrahabr&utm_medium=rss&utm_campaign=689398

Комментарии (0)Комментировать В цитатник или сообщество

rss_habr

США запретили поставлять в Россию и Китай современные GPU-ускорители. Как это повлияет на IT-компании в стране

Вторник, 20 Сентября 2022 г. 14:20 (ссылка)

Две недели назад власти США запретили AMD и Nvidia поставлять в Россию и Китай современные GPU-ускорители. Правда, не все, а лишь те, что соответствуют определенным критериям производительности. Nvidia не сможет продавать в РФ и КНР ускорители серий A100 и H100. Ну а AMD придется отказаться от экспорта ускорителей Instinct MI250 (Instinct MI100 под удар не попали).

В основном запрет коснулся систем, которые предназначены для использования в суперкомпьютерах и ИИ-системах. США решили блокировать поставки ускорителей из-за того, что, по их мнению, карточки можно использовать в разработке оружия, обработке изображений в немирных целях (обнаружение военных объектов на спутниковых снимках и т.п.). Но на самом деле гораздо мощные GPU-уcкорители используются крупными технологическими компаниями, в том числе Selectel, для решения собственных и клиентских задач. О масштабах проблемы — под катом.
Читать дальше →

https://habr.com/ru/post/684090/?utm_source=habrahabr&utm_medium=rss&utm_campaign=684090

Метки: Блог компании Selectel Исследования и прогнозы в IT Производство и разработка электроники amd nvidia сша россия gpu

Комментарии (0)Комментировать В цитатник или сообщество

rss_habr

Увеличиваем FPS в аниме с помощью нейросети и GPU Tesla T4

Среда, 07 Сентября 2022 г. 14:18 (ссылка)

Привет, Хабр! Я Кирилл, работаю в техподдержке Selectel. Как-то я решил посмотреть легендарное аниме 1995 года «Призрак в доспехах» и не смог сдержать слез. В первую очередь оттого, что частота кадров в этом аниме – убийственные для моего зрения 23 кадра в секунду. В силу особенностей жанра аниме частота кадров на некоторых отрезках видео может достигать до 12 в секунду.

Страдать я не хотел, поэтому начал гуглить, какое решение может предложить мне мир IT. В итоге наткнулся на крайне интересную технологию — интерполяцию, которая используется почти везде, но мы о ней очень мало знаем. Под катом рассказываю, как она, нейросеть RIFE и сервер с GPU помогли мне посмотреть «Призрака» без головной боли.
Читать дальше →

https://habr.com/ru/post/686870/?utm_source=habrahabr&utm_medium=rss&utm_campaign=686870

Метки: Блог компании Selectel Работа с видео машинное обучение Видеокарты аниме призрак в доспехах интерполяция нейросети алгоритмы gpu облачный сервер

Комментарии (0)Комментировать В цитатник или сообщество

rss_habr

ML в Managed Kubernetes: для каких задач нужен кластер с GPU

Пятница, 12 Августа 2022 г. 20:11 (ссылка)

Машинное обучение используют в разных сферах: от бизнес-аналитики до астрофизики. Для грамотного потребления ресурсов модели развертывают в контейнерах на выделенных серверах или в облаках. Теперь с ML можно эффективно работать в готовых кластерах Kubernetes — в них появились производительные видеокарты.

Под катом рассказываем, для чего нужны GPU в кластерах Managed Kubernetes и как они ускоряют продакшн ML-сервисов.
Читать дальше →

https://habr.com/ru/post/682284/?utm_source=habrahabr&utm_medium=rss&utm_campaign=682284

Метки: Блог компании Selectel Kubernetes машинное обучение Selectel Managed Kubernetes контейнеры ML GPU

Комментарии (0)Комментировать В цитатник или сообщество

rss_habr

Тезисы, сформулированные во время распития чая, о процессе интервью, с позиции интервьирующего

Вторник, 28 Июня 2022 г. 18:55 (ссылка)

В моей жизни было четыре периода, когда я активно принимал участие в интервьировании людей на работу. В 1998 для своего стартапа в области программ для проектирования микросхем, в 2010-11 для MIPS Technologies (компания среднего размера но престижная в свое время в узком кругу процессоростроителей), в 2019 для Wave Computing (хайповый стартап в хардверном AI) и сейчас для Samsung (на позиции дизайнеров графических процессоров телефонов). Я не собирался писать длинный текст, но пока я пью чай, набросаю несколько тезисов, первое, что приходит в голову:

https://habr.com/ru/post/673916/?utm_source=habrahabr&utm_medium=rss&utm_campaign=673916

Комментарии (0)Комментировать В цитатник или сообщество

rss_habr

Какой бенчмарк от UNIGINE выбрать

Понедельник, 20 Июня 2022 г. 12:30 (ссылка)

В 2022 году общее количество пользователей Heaven, Valley и Superposition перевалило за 40 миллионов. В честь этого впечатляющего результата мы подготовили обзорный материал о наших бенчах, чтобы помочь определиться, какой из них лучше подходит для испытания вашего «железа» на прочность.

За разбором добро пожаловать под кат.

https://habr.com/ru/post/669782/?utm_source=habrahabr&utm_medium=rss&utm_campaign=669782

Комментарии (0)Комментировать В цитатник или сообщество

rss_habr

NVIDIA А5500: реальная мощь или фейслифтинг?

Среда, 26 Мая 2022 г. 02:24 (ссылка)

Проверили новую GPU NVIDIA RTX A5500 на архитектуре Ampere с RT-ядрами второго поколения и тензорными — третьего. Хороша ли новинка? Для чего использовать — энкодинг, майнинг, нейросети? Рассказываем о результатах теста.

Узнать подробности

https://habr.com/ru/post/667886/?utm_source=habrahabr&utm_medium=rss&utm_campaign=667886

Метки: Блог компании HOSTKEY видеокарты nvidia rtx a5500 gpu многопоточная ffmpeg бенчмаркинг бенчмарки бенчмарк

Комментарии (0)Комментировать В цитатник или сообщество

rss_habr

[Перевод] Стримеру игр в помощь: аппаратный энкодинг видео силами GPU – насколько он хорош?

Четверг, 13 Мая 2022 г. 01:51 (ссылка)

Игроки-стримеры не хотят тратить ресурсы на кодирование видео в ущерб производительности самой игры, да и современные GPU часто идут с аппаратными кодировщиками. Но все ли они одинаково полезны? Ведь смотреть замыленную картинку с артефактами никто не станет. Проверяем несколько реализаций аппаратных кодеков, чтобы выбрать лидера.

Узнать подробности

https://habr.com/ru/post/665484/?utm_source=habrahabr&utm_medium=rss&utm_campaign=665484