-Музыка

 -Подписка по e-mail

 

 -Поиск по дневнику

Поиск сообщений в Flashr

 -Статистика

Статистика LiveInternet.ru: показано количество хитов и посетителей
Создан: 26.02.2007
Записей:
Комментариев:
Написано: 6574


Solution for News

+ в цитатник

Cообщение скрыто для удобства комментирования.
Прочитать сообщение


QoSyS   обратиться по имени Вторник, 18 Августа 2009 г. 17:38 (ссылка)
Идея замечательная, но кто мешает забирать куски(абзацы) новости из рсс и их перемешивать, или убирать/дополнять новыми тэгами новость. Такого алгоритма просто пока нет.

Можно конечно каждой новости при помощи специального централизованного сервиса выдавать 'авторство', что будет являться гарантией уникальности. А потом уже сверять контент с других источников, которые будут добавлять аналогичную новость новость.

Но все-таки, самая главная проблема - семантический разбор цепочек новостей. т.е. разбор по событиям, кто первый опубликовал и т.д.
Ответить С цитатой В цитатник
Перейти к дневнику

Вторник, 18 Августа 2009 г. 17:47ссылка
Исходное сообщение QoSyS
самая главная проблема - семантический разбор цепочек новостей. т.е. разбор по событиям, кто первый опубликовал и т.д.

Семантический разбор - выделение троек типа "Кто, что сделал, где" - успешно делается Яндексом. Также мы знаем другие проекты обработки новостей, такие как Ktotam.ru.
---
Кто первый опубликовал - Какая разница? если 10% новостей всеравно надуманны. И мне важно, чтобы до меня просто дошла новость типа "Facebook купил Friendfeed" или что в Москве прогремел взрыв.
---
Про добавление тэгов - видимо нужна общая онтология типа crunchbase - со всеми терминами, которые можно использовать в качестве основных тэгов для хэшфункции построения DailyID.
Перейти к дневнику

Вторник, 18 Августа 2009 г. 17:57ссылка
по поводу Яндекса - я не уверен, что выделение ключевой информации из новостей они делают на автомате.
Перейти к дневнику

Вторник, 18 Августа 2009 г. 17:58ссылка
т.е. не обходится без редактирования сюжетов, например
http://news.yandex.ru/yandsearch?cl4url=www.rian.r...F181419261.html&country=Russia
 

Добавить комментарий:
Текст комментария: смайлики

Проверка орфографии: (найти ошибки)

Прикрепить картинку:

 Переводить URL в ссылку
 Подписаться на комментарии
 Подписать картинку