Применение рекуррентных слоев для решения многоходовок

Среда, 25 Апреля 2018 г. 16:11 + в цитатник

История

Рекуррентные слои были изобретены еще в 80х Джоном Хопфилдом. Они легли в основу разработанных им искусственных ассоциативных нейронных сетей (сетей Хопфилда). Сегодня рекуррентные сети получили большое распространение в задачах обработки последовательностей: естественных языков, речи, музыки, видеоряда и тд.

Задача

В рамках задачи по Hierarchy reinforcement learning я решил прогнозировать не одно действие агента, а несколько, используя для этого уже пред обученную сеть способную предсказать последовательность действий. В данной статье я покажу как реализовать “sequence to sequence” алгоритм для обучения этой самой сети а в последующей, постараюсь рассказать, как использовать ее в Q-learning обучении.
Читать дальше ->

https://habr.com/post/354220/?utm_source=habrahabr&utm_medium=rss&utm_campaign=354220

<a href="https://www.liveinternet.ru/users/rss_habrahabr_of_lokoman/post434113535/">РџСЂРёРјРµРЅРµРЅРёРµ СЂРµРєСѓСЂСЂРµРЅС‚РЅС‹С… СЃР»РѕРµРІ РґР»СЏ СЂРµС€РµРЅРёСЏ РјРЅРѕРіРѕС…РѕРґРѕРІРѕРє</a><br/>

РСЃС‚РѕСЂРёСЏ
Р РµРєСѓСЂСЂРµРЅС‚РЅС‹Рµ СЃР»РѕРё Р±С‹Р»Рё РёР·РѕР±СЂРµС‚РµРЅС‹ РµС‰Рµ РІ 80С… Р”Р¶РѕРЅРѕРј РҐРѕРїС„РёР»РґРѕРј. РћРЅРё Р»РµРіР»Рё РІ РѕСЃРЅРѕРІСѓ СЂР°Р·СЂР°Р±РѕС‚Р°РЅРЅС‹С… РёРј РёСЃРєСѓСЃСЃС‚РІРµРЅРЅС‹С… Р°СЃСЃРѕС†РёР°С‚РёРІРЅС‹С… РЅРµР№СЂРѕРЅРЅС‹С… СЃРµС‚РµР№ (СЃРµС‚РµР№ РҐРѕРїС„РёР»РґР°). РЎРµРіРѕРґРЅСЏ СЂРµРєСѓСЂСЂРµРЅС‚РЅС‹Рµ СЃРµС‚Рё РїРѕР»СѓС‡РёР»Рё Р±РѕР»СЊС€РѕРµ СЂР°СЃРїСЂРѕСЃС‚СЂР°РЅРµРЅРёРµ РІ Р·Р°РґР°С‡Р°С… РѕР±СЂР°Р±РѕС‚РєРё РїРѕСЃР»РµРґРѕРІР°С‚РµР»СЊРЅРѕСЃС‚РµР№: РµСЃС‚РµСЃС‚РІРµРЅРЅС‹С… СЏР·С‹РєРѕРІ, СЂРµС‡Рё, РјСѓР·С‹РєРё, РІРёРґРµРѕСЂСЏРґР° Рё С‚Рґ.

Р—Р°РґР°С‡Р°
Р’ СЂР°РјРєР°С… Р·Р°РґР°С‡Рё РїРѕ Hierarchy reinforcement learning СЏ СЂРµС€РёР» РїСЂРѕРіРЅРѕР·РёСЂРѕРІР°С‚СЊ РЅРµ РѕРґРЅРѕ РґРµР№СЃС‚РІРёРµ Р°РіРµРЅС‚Р°, Р° РЅРµСЃРєРѕР»СЊРєРѕ, РёСЃРїРѕР»СЊР·СѓСЏ РґР»СЏ СЌС‚РѕРіРѕ СѓР¶Рµ РїСЂРµРґ РѕР±СѓС‡РµРЅРЅСѓСЋ СЃРµС‚СЊ СЃРїРѕСЃРѕР±РЅСѓСЋ РїСЂРµРґСЃРєР°Р·Р°С‚СЊ РїРѕСЃР»РµРґРѕРІР°С‚РµР»СЊРЅРѕСЃС‚СЊ РґРµР№СЃС‚РІРёР№. Р’ РґР°РЅРЅРѕР№ СЃС‚Р°С‚СЊРµ СЏ РїРѕРєР°Р¶Сѓ РєР°Рє СЂРµР°Р»РёР·РѕРІР°С‚СЊ вЂњsequence to seq... <a href="https://www.liveinternet.ru/users/rss_habrahabr_of_lokoman/post434113535/">Р§РёС‚Р°С‚СЊ РґР°Р»РµРµ...</a>

Комментировать

« Пред. запись — К дневнику — След. запись »

Страницы: [1] [Новые]

LiveInternetLiveInternet

-Поиск по дневнику

-Подписка по e-mail

-Статистика

Применение рекуррентных слоев для решения многоходовок

История

Задача