[Перевод] Как я сделал AI для выявления фейковых новостей с точностью в 95% и чуть не рехнулся

Пятница, 26 Января 2018 г. 12:43 + в цитатник

Краткий пересказ: мы сделали программу, определяющую надежность новостей с точностью 95% (на валидационной выборке) при помощи машинного обучения и технологий обработки естественного языка. Скачать ее можно здесь. В условиях реальной действительности точность может оказаться несколько ниже, особенно по прошествии некоторого времени, так как каноны написания новостных статей будут меняться.

Глядя, как бурно развиваются машинное обучение и обработка естественного языка, я подумал: чем черт не шутит, может быть, мне удастся создать модель, которая выявляла бы новостной контент с недостоверной информацией, и тем самым хоть чуть-чуть сгладить катастрофические последствия, которые приносит сейчас распространение фейковых новостей.

С этим можно поспорить, но, на мой взгляд, самый сложный этап в создании собственной модели машинного обучения — сбор материалов для обучения. Когда я обучал модель для распознавания лиц, мне пришлось несколько дней собирать фотографии каждого из игроков лиги НБА в сезоне 2017/2018. Теперь же я и не подозревал, что мне придется провести погруженным в этот процесс несколько мучительных месяцев и столкнуться с очень неприятными и жуткими вещами, которые люди пытаются выдать за настоящие новости и надежную информацию.
Читать дальше ->

https://habrahabr.ru/post/347586/

<a href="https://www.liveinternet.ru/users/rss_rss_hh_new/post429127661/">[РџРµСЂРµРІРѕРґ] РљР°Рє СЏ СЃРґРµР»Р°Р» AI РґР»СЏ РІС‹СЏРІР»РµРЅРёСЏ С„РµР№РєРѕРІС‹С… РЅРѕРІРѕСЃС‚РµР№ СЃ С‚РѕС‡РЅРѕСЃС‚СЊСЋ РІ 95% Рё С‡СѓС‚СЊ РЅРµ СЂРµС…РЅСѓР»СЃСЏ</a><br/>РљСЂР°С‚РєРёР№ РїРµСЂРµСЃРєР°Р·: РјС‹ СЃРґРµР»Р°Р»Рё РїСЂРѕРіСЂР°РјРјСѓ, РѕРїСЂРµРґРµР»СЏСЋС‰СѓСЋ РЅР°РґРµР¶РЅРѕСЃС‚СЊ РЅРѕРІРѕСЃС‚РµР№ СЃ С‚РѕС‡РЅРѕСЃС‚СЊСЋ 95% (РЅР° РІР°Р»РёРґР°С†РёРѕРЅРЅРѕР№ РІС‹Р±РѕСЂРєРµ) РїСЂРё РїРѕРјРѕС‰Рё РјР°С€РёРЅРЅРѕРіРѕ РѕР±СѓС‡РµРЅРёСЏ Рё С‚РµС…РЅРѕР»РѕРіРёР№ РѕР±СЂР°Р±РѕС‚РєРё РµСЃС‚РµСЃС‚РІРµРЅРЅРѕРіРѕ СЏР·С‹РєР°. РЎРєР°С‡Р°С‚СЊ РµРµ РјРѕР¶РЅРѕ Р·РґРµСЃСЊ. Р’ СѓСЃР»РѕРІРёСЏС… СЂРµР°Р»СЊРЅРѕР№ РґРµР№СЃС‚РІРёС‚РµР»СЊРЅРѕСЃС‚Рё С‚РѕС‡РЅРѕСЃС‚СЊ РјРѕР¶РµС‚ РѕРєР°Р·Р°С‚СЊСЃСЏ РЅРµСЃРєРѕР»СЊРєРѕ РЅРёР¶Рµ, РѕСЃРѕР±РµРЅРЅРѕ РїРѕ РїСЂРѕС€РµСЃС‚РІРёРё РЅРµРєРѕС‚РѕСЂРѕРіРѕ РІСЂРµРјРµРЅРё, С‚Р°Рє РєР°Рє РєР°РЅРѕРЅС‹ РЅР°РїРёСЃР°РЅРёСЏ РЅРѕРІРѕСЃС‚РЅС‹С… СЃС‚Р°С‚РµР№ Р±СѓРґСѓС‚ РјРµРЅСЏС‚СЊСЃСЏ.

Р“Р»СЏРґСЏ, РєР°Рє Р±СѓСЂРЅРѕ СЂР°Р·РІРёРІР°СЋС‚СЃСЏ РјР°С€РёРЅРЅРѕРµ РѕР±СѓС‡РµРЅРёРµ Рё РѕР±СЂР°Р±РѕС‚РєР° РµСЃС‚РµСЃС‚РІРµРЅРЅРѕРіРѕ СЏР·С‹РєР°, СЏ РїРѕРґСѓРјР°Р»: С‡РµРј С‡РµСЂС‚ РЅРµ С€СѓС‚РёС‚, РјРѕР¶РµС‚ Р±С‹С‚СЊ, РјРЅРµ СѓРґР°СЃС‚СЃСЏ СЃРѕР·РґР°С‚СЊ РјРѕРґРµР»СЊ, РєРѕС‚РѕСЂР°СЏ РІС‹СЏРІР»СЏР»Р° Р±С‹ РЅРѕРІРѕСЃС‚РЅРѕР№ РєРѕРЅС‚РµРЅС‚ СЃ РЅРµРґРѕСЃС‚РѕРІРµСЂРЅРѕР№ РёРЅ... <a href="https://www.liveinternet.ru/users/rss_rss_hh_new/post429127661/">Р§РёС‚Р°С‚СЊ РґР°Р»РµРµ...</a>

Комментировать

« Пред. запись — К дневнику — След. запись »

Страницы: [1] [Новые]

LiveInternetLiveInternet

-Поиск по дневнику

-Подписка по e-mail

-Постоянные читатели

-Статистика

[Перевод] Как я сделал AI для выявления фейковых новостей с точностью в 95% и чуть не рехнулся