-Поиск по дневнику

Поиск сообщений в Philfrol2

 -Подписка по e-mail

 

 -Статистика

Статистика LiveInternet.ru: показано количество хитов и посетителей
Создан: 19.08.2016
Записей:
Комментариев:
Написано: 509


"Что ты делаешь, Дэйв?"

Суббота, 26 Ноября 2016 г. 14:02 + в цитатник
В колонках играет - SikTh - Bland Street Bloom

6087826_php4c3f222aacbc1 (560x300, 120Kb)

Новая победа Скайнета Google и технологий "умного" распознавания речи:

ИИ Google теперь читает по губам лучше, чем человек

 
Исследователи из Google DeepMind и Оксфордского университета использовали искусственный интеллект для создания наиболее точного на сегодняшний день программного обеспечения для чтения по губам. Для тренировки нейронной сети учёные использовали тысячи часов записей с BBC, благодаря чему система научилась с вероятностью в 46,8 % определять то, что говорят люди на экране. Результаты могут показаться не такими уж и впечатляющими, особенно если учесть точность транскрибирования искусственным интеллектом аудиозаписей, однако профессионал в чтении по губам смог правильно определить слова в тех же видеороликах лишь в 12,4 % случаев.
 
Другая группа исследователей из Оксфордского университета ранее в этом месяце отчиталась о похожем проекте. Используя аналогичные технологии, они сумели создать программу LipNet, которая в тестах показала точность в 93,4 %, в то время как точность определения слов человеком составила 52,3 %. Однако программа эта тестировалась только на специально записанном для неё видео, в котором волонтёры зачитывали шаблонные фразы. В свою очередь, программное обеспечение DeepMind, называемое Watch, Listen, Attend, and Spell, транскрибировало естественные, неподготовленные диалоги из политических передач с канала BBC.
 
Для тренировки нейронной сети использовалось более пяти тысяч часов записей из таких телевизионных шоу, как Newsnight, Question Time и World Today. Ролики включали в себя 118 тысяч различных предложений и около 17,5 тысяч уникальных слов, в то время как в базе видеороликов для тестирования LipNet присутствовало всего 51 уникальное слово.
 
Исследователи из DeepMind считают, что их новая программа может быть полезна в целом ряде случаев — например, в помощи людям со слабым слухом в понимании диалогов. Она также могла бы быть использована для аннотирования немых фильмов или управления голосовыми помощниками посредством проговаривания слов на камеру.
Цели и помыслы создателей очередного технического чуда как всегда прекрасны, однако опыт подсказывает: человечество пока не избавилось от привычки к всяческим злоупотреблениям, поэтому все, что может быть использовано во зло, рано или поздно будет таким образом использовано. Что характерно, при чтении этой новости не только у меня в памяти всплыла сцена из "Космической одиссеи 2000", где коварный судовой компьютер считывает по губам беседу "заговорщиков".
 
Похоже, любителям посекретничать, покидающим из-за возможных "жучков" помещения ради важного разговора, теперь придется принимать дополнительные меры предосторожности. В частности, давно ставший декоративным жест определенно снова становится актуальным.
 
6087826_whisper (700x265, 121Kb)
 


Рубрики:  Музыкальное
Занудство
Метки:  

 

Добавить комментарий:
Текст комментария: смайлики

Проверка орфографии: (найти ошибки)

Прикрепить картинку:

 Переводить URL в ссылку
 Подписаться на комментарии
 Подписать картинку