Генерация аудио диффузионной нейросетью. Стоит ли использовать обычную диффузию для генерации мел-спектрограмм?

Среда, 28 Декабря 2022 г. 16:00 + в цитатник

В уходящем году вы могли видеть множество нейросетей для генерации изображений. Скорее всего, даже ваша бабушка слышала про Stable Diffusion или DALL-E, но эти нейросети объединяет одна очень важная деталь — они основаны на методе обратной диффузии. Этот подход к генерации стал самым популярным в 2022 году. Почему бы не попробовать применить его не для генерации картинок, а для музыки или пения птиц?

В этой статье я расскажу о том, как генерировать аудио с помощью классической диффузионной нейросети, и нюансах этого подхода. Читать дальше →

https://habr.com/ru/post/708182/?utm_source=habrahabr&utm_medium=rss&utm_campaign=708182

<a href="https://www.liveinternet.ru/users/rss_habrahabr_main/post497238567/">Р“РµРЅРµСЂР°С†РёСЏ Р°СѓРґРёРѕ РґРёС„С„СѓР·РёРѕРЅРЅРѕР№ РЅРµР№СЂРѕСЃРµС‚СЊСЋ. РЎС‚РѕРёС‚ Р»Рё РёСЃРїРѕР»СЊР·РѕРІР°С‚СЊ РѕР±С‹С‡РЅСѓСЋ РґРёС„С„СѓР·РёСЋ РґР»СЏ РіРµРЅРµСЂР°С†РёРё РјРµР»-СЃРїРµРєС‚СЂРѕРіСЂР°РјРј?</a><br/>
Р’ СѓС…РѕРґСЏС‰РµРј РіРѕРґСѓ РІС‹ РјРѕРіР»Рё РІРёРґРµС‚СЊ РјРЅРѕР¶РµСЃС‚РІРѕ РЅРµР№СЂРѕСЃРµС‚РµР№ РґР»СЏ РіРµРЅРµСЂР°С†РёРё РёР·РѕР±СЂР°Р¶РµРЅРёР№. РЎРєРѕСЂРµРµ РІСЃРµРіРѕ, РґР°Р¶Рµ РІР°С€Р° Р±Р°Р±СѓС€РєР° СЃР»С‹С€Р°Р»Р° РїСЂРѕ Stable Diffusion РёР»Рё DALL-E, РЅРѕ СЌС‚Рё РЅРµР№СЂРѕСЃРµС‚Рё РѕР±СЉРµРґРёРЅСЏРµС‚ РѕРґРЅР° РѕС‡РµРЅСЊ РІР°Р¶РЅР°СЏ РґРµС‚Р°Р»СЊ вЂ” РѕРЅРё РѕСЃРЅРѕРІР°РЅС‹ РЅР° РјРµС‚РѕРґРµ РѕР±СЂР°С‚РЅРѕР№ РґРёС„С„СѓР·РёРё. РС‚РѕС‚ РїРѕРґС…РѕРґ Рє РіРµРЅРµСЂР°С†РёРё СЃС‚Р°Р» СЃР°РјС‹Рј РїРѕРїСѓР»СЏСЂРЅС‹Рј РІ 2022 РіРѕРґСѓ. РџРѕС‡РµРјСѓ Р±С‹ РЅРµ РїРѕРїСЂРѕР±РѕРІР°С‚СЊ РїСЂРёРјРµРЅРёС‚СЊ РµРіРѕ РЅРµ РґР»СЏ РіРµРЅРµСЂР°С†РёРё РєР°СЂС‚РёРЅРѕРє, Р° РґР»СЏ РјСѓР·С‹РєРё РёР»Рё РїРµРЅРёСЏ РїС‚РёС†?

Р’ СЌС‚РѕР№ СЃС‚Р°С‚СЊРµ СЏ СЂР°СЃСЃРєР°Р¶Сѓ Рѕ С‚РѕРј, РєР°Рє РіРµРЅРµСЂРёСЂРѕРІР°С‚СЊ Р°СѓРґРёРѕ СЃ РїРѕРјРѕС‰СЊСЋ РєР»Р°СЃСЃРёС‡РµСЃРєРѕР№ РґРёС„С„СѓР·РёРѕРЅРЅРѕР№ РЅРµР№СЂРѕСЃРµС‚Рё, Рё РЅСЋР°РЅСЃР°С… СЌС‚РѕРіРѕ РїРѕРґС…РѕРґР°. Р§РёС‚Р°С‚СЊ РґР°Р»СЊС€Рµ &rarr;  https://habr.com/ru/post/708182/?utm_sourc... <a href="https://www.liveinternet.ru/users/rss_habrahabr_main/post497238567/">Р§РёС‚Р°С‚СЊ РґР°Р»РµРµ...</a>

Комментировать

« Пред. запись — К дневнику — След. запись »

Страницы: [1] [Новые]

LiveInternetLiveInternet

-Поиск по дневнику

-Подписка по e-mail

-Постоянные читатели

-Статистика

Генерация аудио диффузионной нейросетью. Стоит ли использовать обычную диффузию для генерации мел-спектрограмм?