Transformer — новая архитектура нейросетей для работы с последовательностями

Понедельник, 30 Октября 2017 г. 09:34 + в цитатник

Необходимое предисловие: я решил попробовать современный формат несения света в массы и пробую стримить на YouTube про deep learning.

В частности, в какой-то момент меня попросили рассказать про attention, а для этого нужно рассказать и про машинный перевод, и про
sequence to sequence, и про применение к картинкам, итд итп. В итоге получился вот такой стрим на час:

Я так понял по другим постам, что c видео принято постить его транскрипт. Давайте я лучше вместо этого расскажу про то, чего в видео нет — про новую архитектуру нейросетей для работы с последовательностями, основанную на attention. А если нужен будет дополнительный бэкграунд про машинный перевод, текущие подходы, откуда вообще взялся attention, итд итп, вы посмотрите видео, хорошо?

Новая архитектура называется Transformer, была разработана в Гугле, описана в статье Attention Is All You Need (arxiv) и про нее есть пост на Google Research Blog (не очень детальный, зато с картинками).

Поехали.

Читать дальше ->

https://habrahabr.ru/post/341240/

<a href="https://www.liveinternet.ru/users/rss_rss_hh_new/post424055200/">Transformer вЂ” РЅРѕРІР°СЏ Р°СЂС…РёС‚РµРєС‚СѓСЂР° РЅРµР№СЂРѕСЃРµС‚РµР№ РґР»СЏ СЂР°Р±РѕС‚С‹ СЃ РїРѕСЃР»РµРґРѕРІР°С‚РµР»СЊРЅРѕСЃС‚СЏРјРё</a><br/>РќРµРѕР±С…РѕРґРёРјРѕРµ РїСЂРµРґРёСЃР»РѕРІРёРµ: СЏ СЂРµС€РёР» РїРѕРїСЂРѕР±РѕРІР°С‚СЊ СЃРѕРІСЂРµРјРµРЅРЅС‹Р№ С„РѕСЂРјР°С‚ РЅРµСЃРµРЅРёСЏ СЃРІРµС‚Р° РІ РјР°СЃСЃС‹ Рё РїСЂРѕР±СѓСЋ СЃС‚СЂРёРјРёС‚СЊ РЅР° YouTube РїСЂРѕ deep learning.
Р’ С‡Р°СЃС‚РЅРѕСЃС‚Рё, РІ РєР°РєРѕР№-С‚Рѕ РјРѕРјРµРЅС‚ РјРµРЅСЏ РїРѕРїСЂРѕСЃРёР»Рё СЂР°СЃСЃРєР°Р·Р°С‚СЊ РїСЂРѕ attention, Р° РґР»СЏ СЌС‚РѕРіРѕ РЅСѓР¶РЅРѕ СЂР°СЃСЃРєР°Р·Р°С‚СЊ Рё РїСЂРѕ РјР°С€РёРЅРЅС‹Р№ РїРµСЂРµРІРѕРґ, Рё РїСЂРѕ
sequence to sequence, Рё РїСЂРѕ РїСЂРёРјРµРЅРµРЅРёРµ Рє РєР°СЂС‚РёРЅРєР°Рј, РёС‚Рґ РёС‚Рї. Р’ РёС‚РѕРіРµ РїРѕР»СѓС‡РёР»СЃСЏ РІРѕС‚ С‚Р°РєРѕР№ СЃС‚СЂРёРј РЅР° С‡Р°СЃ:
 
РЇ С‚Р°Рє РїРѕРЅСЏР» РїРѕ РґСЂСѓРіРёРј РїРѕСЃС‚Р°Рј, С‡С‚Рѕ c РІРёРґРµРѕ РїСЂРёРЅСЏС‚Рѕ РїРѕСЃС‚РёС‚СЊ РµРіРѕ С‚СЂР°РЅСЃРєСЂРёРїС‚. Р”Р°РІР°Р№С‚Рµ СЏ Р»СѓС‡С€Рµ РІРјРµСЃС‚Рѕ СЌС‚РѕРіРѕ СЂР°СЃСЃРєР°Р¶Сѓ РїСЂРѕ С‚Рѕ, С‡РµРіРѕ РІ РІРёРґРµРѕ РЅРµС‚ вЂ” РїСЂРѕ РЅРѕРІСѓСЋ Р°СЂС…РёС‚РµРєС‚СѓСЂСѓ РЅРµР№СЂРѕСЃРµС‚РµР№ РґР»СЏ СЂР°Р±РѕС‚С‹ СЃ РїРѕСЃР»РµРґРѕРІР°С‚РµР»СЊРЅРѕСЃС‚СЏРјРё, РѕСЃРЅРѕРІР°РЅРЅСѓСЋ РЅР° attention... <a href="https://www.liveinternet.ru/users/rss_rss_hh_new/post424055200/">Р§РёС‚Р°С‚СЊ РґР°Р»РµРµ...</a>

Комментировать

« Пред. запись — К дневнику — След. запись »

Страницы: [1] [Новые]

LiveInternetLiveInternet

-Поиск по дневнику

-Подписка по e-mail

-Постоянные читатели

-Статистика

Transformer — новая архитектура нейросетей для работы с последовательностями