-Музыка

 -Подписка по e-mail

 

 -Поиск по дневнику

Поиск сообщений в Flashr

 -Статистика

Статистика LiveInternet.ru: показано количество хитов и посетителей
Создан: 26.02.2007
Записей:
Комментариев:
Написано: 6574


Как работают Яндекс.Блоги?

Суббота, 04 Апреля 2009 г. 18:15 + в цитатник
Ответ на этот вопрос дал А.Волнухин 3го апреля, выступив перед группой зазванных журналистов, чтобы они пересказали это всем интересующимся и экспертам(накрутчикам). Подробный отчет о событии можно найти в блоге Людмилы. Я же выделю самое интересное и дам свои комментарии.

Цифры Яндекс.Блогов и основные сервисы



  • Миллион запиcей и комментариев из блогов и форумов каждый день
  • 7 млн. источников индексируется
  • индексируется 14 млн. профилей пользователей. Примерно половина пользователей создает блог и не делает там ни одной записи, а, например, использует для комментирования или забрасывает. Отсюда разница.
  • всего около миллиарда документов
  • блоги - одна пятая Рунета (по количеству элементов для индексации)
  • Новые записи индексируются в течении 10 минут на более чем 120 блогхостингах
Все похоже на правду. Обработать миллион в день - это далеко не предел.
Поиск - это самый нужный для людей сервис по блогам. Однако, многим интернет-маркетологам гораздо интереснее Топ Блогосферы.
Поиск по блогам - единственное, что нормально работает, а у ТОПа просто нет других аналогов, вот и пользуются. Вот и все объяснение.
Антон Волнухин, ответственный за поиск по блогам, рассказал, что "коммерческой ценности" пребывание в популярных записях не несёт - самый большой возможный трафик оттуда исчисляется единицами тысяч посетителей блога.
Мухаха. Да, чистая ссылка в Яндекс ТОПе получает порядка 2000 кликов, но ведь многие потом копируют этот текст. Так что суммарно эффективность доходит до десятков тысяч. Хотя известны примеры с тем же Воронежским конем, когда количество просмотров перевалило за 200тыс.

Какова же "формула ранжирования" записей в Топе Блогосферы?

  1. Записи сортируются по количеству ссылок на пост за последние три дня.
  2. В топ может попасть только блог, существующий более полугода
  3. ссылки за последние 8 часов имеют удвоенный вес - это нужно, чтобы топ чаще "освежался"
  4. Записи теряют вес каждый час нахождения в топе - с той же целью
  5. В топ может попасть одновременно не более 1 записи из 1 блога.
  6. Рейтинг пересчитывается каждые 20 минут
  7. Чем меньше раз тот или иной блог ссылался на блог, содержащий топовую запись, тем весомее ссылка.
Теперь стоимость полугодовалых виртуалов вырастет... Про то, что 1 блогер и один пост в одно время - я тоже когда-то верил, пока stanislav_mikov это не нарушил. Также последний критерий особенно интересен, так как теперь все начнут это использовать =)
Планируется добавлять больше источников данных для рейтингования - учитывать комментарии и посещаемость.
Нуну, вот этого точно НЕ надо делать.
В ближайшее время пользователи смогут посмотреть разные неотфильтрованные срезы по каждому из источников - и накрутки станут видны каждому.
А разве сейчас кому-то что-то неочевидно? А хомячки не станут пользоваться этими срезами.
Антон Волнухин с прискорбием признал тот факт, что управлять индексированием и участием в поиске своего блога его владелец может только при помощи писем в саппорт.
Я же с прискорбием признаю, что даже написание в суппорт в 70% случаях вам не поможет.
Главные проблемы поиска по блогам - это спам, фильтрация дублей, индексирование удаленных и скрытых записей.
Пока в Интернете не будет полноценного 5го(вся инфа о том кто пишет) и 9го(вся инфа о смысле того, что пишут) инвариантов семантического web'a, это так и будет проблемой.
Устройcтво Яндекс Блогов приведено на картинке ниже, вот уж не думал, что в нем найдется применения для SQLite
Метки:  

_LexIncorp_   обратиться по имени Суббота, 04 Апреля 2009 г. 18:24 (ссылка)
про топ30 явно наврали. там был однажды очень свежий блог.
и ссылки учли с виртов, которым меньше месяца.

дайрик скрытый они индексирует.
а проблема дублированного контента - криворукость яши

PS а еще яндекс.блогам пофиг на noindex
Ответить С цитатой В цитатник
Перейти к дневнику

Суббота, 04 Апреля 2009 г. 18:29ссылка
Про новые блоги - они скорее всего пофиксили, я тоже помню, как давно выводили в ТОП всяких только созданных, типа "zzzz_girl", но сомневаюсь, что подобное сейчас пройдет.

Хм, помойму с NOINDEX они не обрабатывают, во всяком случаю RSS от них вполне можно закрыть таким тэгом, например - http:///blogsfeed.php?advertiser=1
Перейти к дневнику

Суббота, 04 Апреля 2009 г. 18:50ссылка
мой пост с ноуиндексными ссылками весь проиндексировали и в рейтингах учли.
_LexIncorp_   обратиться по имени Суббота, 04 Апреля 2009 г. 18:28 (ссылка)
из ее статьи "данные не переиндексируются каждый раз, а накапливаются в индексе"
вранье.
топовые записи ЖЖ они переиндексировывают
Ответить С цитатой В цитатник
Перейти к дневнику

Суббота, 04 Апреля 2009 г. 18:30ссылка
Вот это верное замечание =)
Алексей_Тригуб   обратиться по имени Суббота, 04 Апреля 2009 г. 19:23 (ссылка)
все это интересно, только кто в топе того и читают, комментируют, а кто в жопе на каком нибудь 3658741 месте чтобы он не писал какие бы его мысли не были его никто читать ни будет!
Ответить С цитатой В цитатник
Перейти к дневнику

Суббота, 04 Апреля 2009 г. 19:28ссылка
вообще-то речь о топ30
Комментировать К дневнику Страницы: [1] [Новые]
 

Добавить комментарий:
Текст комментария: смайлики

Проверка орфографии: (найти ошибки)

Прикрепить картинку:

 Переводить URL в ссылку
 Подписаться на комментарии
 Подписать картинку