Случайны выбор дневника Раскрыть/свернуть полный список возможностей


Найдено 634 сообщений
Cообщения с меткой

gpu - Самое интересное в блогах

Следующие 30  »
rss_habr

[Перевод] Как можно ускорить Python сегодня

Суббота, 31 Декабря 2022 г. 13:00 (ссылка)



Python не перестаёт удивлять многих своей гибкостью и эффективностью. Лично я являюсь приверженцем С и Fortran, а также серьёзно увлекаюсь C++, поскольку эти языки позволяют добиться высокого быстродействия. Python тоже предлагает такие возможности, но дополнительно выделяется удобством, за что я его и люблю.



Этот инструмент способен обеспечивать хорошее быстродействие, поскольку имеет в арсенале ключевые оптимизированные библиотеки, а также возможность динамической компиляции основного кода, который предварительно не компилировался. Однако скорость Python значительно падает, когда дело доходит до обработки крупных датасетов или более сложных алгоритмов. В текущей статье мы разберём:




  1. Почему столь важно думать о «будущем разнородных вычислений».

  2. Две ключевых сложности, которые необходимо преодолеть в открытом решении.

  3. Параллельное выполнение задач для более эффективного задействования CPU.

  4. Использование ускорителя для дополнительного повышения быстродействия.



Один только третий пункт позволил увеличить быстродействие в 12 раз притом, что четвёртый позволяет добиться ещё большего за счёт ускорителя. Эти простые техники могут оказаться бесценными при работе с Python, когда требуется добиться дополнительного ускорения программы. Описанные здесь приёмы позволяют нам уверенно продвигаться вперёд без длительного ожидания результатов. Читать дальше →

https://habr.com/ru/post/708358/?utm_source=habrahabr&utm_medium=rss&utm_campaign=708358

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

[Перевод] Сказ о M1 GPU

Четверг, 16 Декабря 2022 г. 01:09 (ссылка)

https://habr.com/ru/post/705852/?utm_source=habrahabr&utm_medium=rss&utm_campaign=705852

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

[Перевод] Пишем кастомные CUDA-ядра на Triton

Среда, 30 Ноября 2022 г. 11:01 (ссылка)

image



Triton – это языковой компилятор для создания сильно оптимизированных ядер CUDA. Здесь будут изложены основы программирования для GPU и рассказано, как для этой цели используется Triton.



Учитывая нынешний успех глубокого обучения и вал исследовательских статей на эту тему, часто возникает такая ситуация: рождается какая-нибудь новая идея, и выясняется, что для нее не поддерживается аппаратное ускорение. Точнее, стоит вам изобрести новую функцию активации или механизм самовнимания – нам сразу приходится прибегать к возможностям PyTorch/Tensorflow для обработки прямого и обратного прохода через модуль.



В таких случаях применим, например, PyTorch JIT. Но PyTorch JIT – это высокоуровневый компилятор, способный оптимизировать лишь некоторые части кода, но непригодный для написания специализированных ядер CUDA.
Читать дальше →

https://habr.com/ru/post/702298/?utm_source=habrahabr&utm_medium=rss&utm_campaign=702298

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

[recovery mode] Нужен ли вам GPU-сервер

Среда, 09 Ноября 2022 г. 15:44 (ссылка)

Сегодня никого не удивляет, что процессоры видеокарт обладают большей вычислительной мощностью, чем процессоры компьютеров. Эту особенность давно оценили все, кто нуждается в высокопроизводительных вычислениях, тем более, что сами производители видеокарт поддерживают такой режим их использования, выпустив библиотеки для использования видеопроцессора в так называемом General Purpose режиме.

Тенденцию подхватили и производители оборудования. На волне популярности криптовалют в продаже появились майнинговые фермы, а когда восторги поутихли, обнаружились и более сбалансированные решения для высокопроизводительных вычислений — GPU-сервера.

В этом посте поговорим о том, чем GPU-сервер отличается от майнинг-фермы и о том, как устроен GPU-сервер.

Читать далее

https://habr.com/ru/post/698366/?utm_source=habrahabr&utm_medium=rss&utm_campaign=698366

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

[Перевод] Почему набор инструкций AVX 512 полезен для RPCS3?

Понедельник, 08 Ноября 2022 г. 00:47 (ссылка)

Часто приходится слышать, что важность отличий между наборами инструкций на современных компьютерах преувеличена и, в самом деле, сложно не согласиться с таким наблюдением. Поскольку стандартная программа на 90 % состоит из простейших инструкций для АЛУ, загрузки и сохранения, а также инструкций ветвления, а также с учётом, что на таком базовом уровне разбежки между различными наборами команд очень невелики, такой вывод просто напрашивается.

Но PS3, эмулятор RPCS3 – не просто обычная программа. Даже если вам не доводилось работать с самим эмулятором, вам наверняка приводили RPCS3 в пример как образец
потребительского ПО, в котором используются сильные стороны AVX-512. В этой
статье я расскажу, почему именно новые инструкции и возможности, введённые в семействе
AVX-512, так полезны для эмуляции PS3. В некоторых ситуациях использование 512-разрядных инструкций может положительно сказываться на RPCS3, но в этом посте будет рассказано, почему новые инструкции полезны и для 128-разрядных, и для 256-разрядных конфигураций.

Читать далее

https://habr.com/ru/post/697972/?utm_source=habrahabr&utm_medium=rss&utm_campaign=697972

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

AMD проводит суперкомпьютерный день в Казахстане. Можно подсоединиться по Зуму

Среда, 21 Сентября 2022 г. 18:40 (ссылка)

AMD проводит суперкомпьютерный день в Назарбаевском Университете в Астане, в Казахстане. 29 сентября. Можно подсоединиться по Зуму. Зарегистрироваться можно до 27 сентября по ссылке.

Вообще приезжающие в Астану замечали, что в городе есть амальгамация духа советских городов с духом американского Лас-Вегаса, в частности в элементах архитектуры.

Теперь можно добавить и другое сходство: в Лас-Вегасе помимо казино есть университет, в котором еще в допотопные времена стояли суперкомпьютеры и велись конкурсы на качество распознавания образов. Также там сейчас преподает Сара Харрис, соавтор известного учебника. Кроме этого в Лас-Вегасе иногда проводится конференция DAC по автоматизации проектирования электроники. Почему бы не превратить Астану в евразийский центр такого рода?

Расписание докладов суперкомпьютерного дня

https://habr.com/ru/post/689398/?utm_source=habrahabr&utm_medium=rss&utm_campaign=689398

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

США запретили поставлять в Россию и Китай современные GPU-ускорители. Как это повлияет на IT-компании в стране

Вторник, 20 Сентября 2022 г. 14:20 (ссылка)



Две недели назад власти США запретили AMD и Nvidia поставлять в Россию и Китай современные GPU-ускорители. Правда, не все, а лишь те, что соответствуют определенным критериям производительности. Nvidia не сможет продавать в РФ и КНР ускорители серий A100 и H100. Ну а AMD придется отказаться от экспорта ускорителей Instinct MI250 (Instinct MI100 под удар не попали).



В основном запрет коснулся систем, которые предназначены для использования в суперкомпьютерах и ИИ-системах. США решили блокировать поставки ускорителей из-за того, что, по их мнению, карточки можно использовать в разработке оружия, обработке изображений в немирных целях (обнаружение военных объектов на спутниковых снимках и т.п.). Но на самом деле гораздо мощные GPU-уcкорители используются крупными технологическими компаниями, в том числе Selectel, для решения собственных и клиентских задач. О масштабах проблемы — под катом.
Читать дальше →

https://habr.com/ru/post/684090/?utm_source=habrahabr&utm_medium=rss&utm_campaign=684090

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Увеличиваем FPS в аниме с помощью нейросети и GPU Tesla T4

Среда, 07 Сентября 2022 г. 14:18 (ссылка)



Привет, Хабр! Я Кирилл, работаю в техподдержке Selectel. Как-то я решил посмотреть легендарное аниме 1995 года «Призрак в доспехах» и не смог сдержать слез. В первую очередь оттого, что частота кадров в этом аниме – убийственные для моего зрения 23 кадра в секунду. В силу особенностей жанра аниме частота кадров на некоторых отрезках видео может достигать до 12 в секунду.



Страдать я не хотел, поэтому начал гуглить, какое решение может предложить мне мир IT. В итоге наткнулся на крайне интересную технологию — интерполяцию, которая используется почти везде, но мы о ней очень мало знаем. Под катом рассказываю, как она, нейросеть RIFE и сервер с GPU помогли мне посмотреть «Призрака» без головной боли.
Читать дальше →

https://habr.com/ru/post/686870/?utm_source=habrahabr&utm_medium=rss&utm_campaign=686870

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

ML в Managed Kubernetes: для каких задач нужен кластер с GPU

Пятница, 12 Августа 2022 г. 20:11 (ссылка)



Машинное обучение используют в разных сферах: от бизнес-аналитики до астрофизики. Для грамотного потребления ресурсов модели развертывают в контейнерах на выделенных серверах или в облаках. Теперь с ML можно эффективно работать в готовых кластерах Kubernetes — в них появились производительные видеокарты.



Под катом рассказываем, для чего нужны GPU в кластерах Managed Kubernetes и как они ускоряют продакшн ML-сервисов.
Читать дальше →

https://habr.com/ru/post/682284/?utm_source=habrahabr&utm_medium=rss&utm_campaign=682284

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Тезисы, сформулированные во время распития чая, о процессе интервью, с позиции интервьирующего

Вторник, 28 Июня 2022 г. 18:55 (ссылка)

В моей жизни было четыре периода, когда я активно принимал участие в интервьировании людей на работу. В 1998 для своего стартапа в области программ для проектирования микросхем, в 2010-11 для MIPS Technologies (компания среднего размера но престижная в свое время в узком кругу процессоростроителей), в 2019 для Wave Computing (хайповый стартап в хардверном AI) и сейчас для Samsung (на позиции дизайнеров графических процессоров телефонов). Я не собирался писать длинный текст, но пока я пью чай, набросаю несколько тезисов, первое, что приходит в голову:

Читать далее

https://habr.com/ru/post/673916/?utm_source=habrahabr&utm_medium=rss&utm_campaign=673916

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Какой бенчмарк от UNIGINE выбрать

Понедельник, 20 Июня 2022 г. 12:30 (ссылка)

В 2022 году общее количество пользователей Heaven, Valley и Superposition перевалило за 40 миллионов. В честь этого впечатляющего результата мы подготовили обзорный материал о наших бенчах, чтобы помочь определиться, какой из них лучше подходит для испытания вашего «железа» на прочность.

За разбором добро пожаловать под кат.

Читать далее

https://habr.com/ru/post/669782/?utm_source=habrahabr&utm_medium=rss&utm_campaign=669782

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

NVIDIA А5500: реальная мощь или фейслифтинг?

Среда, 26 Мая 2022 г. 02:24 (ссылка)

Проверили новую GPU NVIDIA RTX A5500 на архитектуре Ampere с RT-ядрами второго поколения и тензорными — третьего. Хороша ли новинка? Для чего использовать — энкодинг, майнинг, нейросети? Рассказываем о результатах теста.

Узнать подробности

https://habr.com/ru/post/667886/?utm_source=habrahabr&utm_medium=rss&utm_campaign=667886

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

[Перевод] Стримеру игр в помощь: аппаратный энкодинг видео силами GPU – насколько он хорош?

Четверг, 13 Мая 2022 г. 01:51 (ссылка)

Игроки-стримеры не хотят тратить ресурсы на кодирование видео в ущерб производительности самой игры, да и современные GPU часто идут с аппаратными кодировщиками. Но все ли они одинаково полезны? Ведь смотреть замыленную картинку с артефактами никто не станет. Проверяем несколько реализаций аппаратных кодеков, чтобы выбрать лидера.

Узнать подробности

https://habr.com/ru/post/665484/?utm_source=habrahabr&utm_medium=rss&utm_campaign=665484

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Вычисляем на видеокартах. Технология OpenCL. Часть 2. Алгоритмы в условиях массового параллелизма

Четверг, 05 Мая 2022 г. 15:57 (ссылка)

Автор курса «Разработчик C++» в Яндекс.Практикуме Георгий Осипов провёл вебинар «Вычисляем на видеокартах. Технология OpenCL».







Мы подготовили для вас его текстовую версию, для удобства разбив её на смысловые блоки.

1. Зачем мы здесь собрались. Краткая история GPGPU.

1a. Как работает OpenCL.

1b. Пишем для OpenCL.

2. Алгоритмы в условиях массового параллелизма.
Читать дальше →

https://habr.com/ru/post/661543/?utm_source=habrahabr&utm_medium=rss&utm_campaign=661543

Комментарии (0)КомментироватьВ цитатник или сообщество

Следующие 30  »

<gpu - Самое интересное в блогах

Страницы: [1] 2 3 ..
.. 10

LiveInternet.Ru Ссылки: на главную|почта|знакомства|одноклассники|фото|открытки|тесты|чат
О проекте: помощь|контакты|разместить рекламу|версия для pda