Генерация аудио диффузионной нейросетью. Стоит ли использовать обычную диффузию для генерации мел-спектрограмм?
|
|
Среда, 28 Декабря 2022 г. 16:00
+ в цитатник
В уходящем году вы могли видеть множество нейросетей для генерации изображений. Скорее всего, даже ваша бабушка слышала про Stable Diffusion или DALL-E, но эти нейросети объединяет одна очень важная деталь — они основаны на методе обратной диффузии. Этот подход к генерации стал самым популярным в 2022 году. Почему бы не попробовать применить его не для генерации картинок, а для музыки или пения птиц?
В этой статье я расскажу о том, как генерировать аудио с помощью классической диффузионной нейросети, и нюансах этого подхода.
Читать дальше → https://habr.com/ru/post/708182/?utm_source=habrahabr&utm_medium=rss&utm_campaign=708182
Метки:
нейронные сети
искусственный интеллект
машинное обучение
аудио синтез
блог компании ruvds.com
ruvds_статьи
диффузионные сети
dalle-2
stable diffusion
-
Запись понравилась
-
0
Процитировали
-
0
Сохранили
-