LiveInternet
LiveInternet
x
(+ )
rss habrahabr of lokoman
rss habrahabr of lokoman
rss_habrahabr_of_lokoman
-
-
e-mail
-
: 16.03.2008
:
:
: 2
:
, 25 2018 . 16:11
+
80 . ( ). : , , , .
Hierarchy reinforcement learning
, , . sequence to sequence , , Q-learning .
->
https://habr.com/post/354220/?utm_source=habrahabr&utm_medium=rss&utm_campaign=354220
:
python
recurrent neural network
tensorflow
gamedev
q-learning
0
0
0
0
0
0
<a href="https://www.liveinternet.ru/users/rss_habrahabr_of_lokoman/post434113535/">Применение рекуррентных слоев для решения многоходовок</a><br/> История Рекуррентные слои были изобретены еще в 80х Джоном Хопфилдом. Они легли в основу разработанных им искусственных ассоциативных нейронных сетей (сетей Хопфилда). Сегодня рекуррентные сети получили большое распространение в задачах обработки последовательностей: естественных языков, речи, музыки, видеоряда и тд. Задача В рамках задачи по Hierarchy reinforcement learning я решил прогнозировать не одно действие агента, а несколько, используя для этого уже пред обученную сеть способную предсказать последовательность действий. В данной статье я покажу как реализовать “sequence to seq... <a href="https://www.liveinternet.ru/users/rss_habrahabr_of_lokoman/post434113535/">Читать далее...</a>
« .
—
—
. »
:
[1] [
]
:
:
: ( )
:
URL
LiveInternet
PDA