-Музыка

 -Подписка по e-mail

 

 -Поиск по дневнику

Поиск сообщений в Flashr

 -Статистика

Статистика LiveInternet.ru: показано количество хитов и посетителей
Создан: 26.02.2007
Записей:
Комментариев:
Написано: 6574





noindex - Неиндексируемый контент

Среда, 02 Декабря 2009 г. 17:20 + в цитатник
Еще одна актуальная проблема создания ТОПа, с которой придется столкнуться всем - когда сам автор не хочет попадать в ТОП. Для этого ему логичнее всего поставить настройку в ЖЖ "не учавствовать в индексации". Технически это выражается в добавлении тэга noindex. Но ЖЖ такой нехороший, что продолжает выдавать данные по RSS, что позволяет все равно попадать в ТОП, а вот Яндекс, с другой стороны, поступает честно и не индексирует записи, что заметно усложняет анализ "топовости" поста. Но с другой стороны, если автор не захотел поисковой популярности, почему бы нам не пойти ему на уступку и отбрасывать запись.

И более сложный вопрос, а что если модераторы сообщества запретили индексацию, а автор и не знал об этом, как это случилось с популярной записью в следующем сообществе - http://community.livejournal.com/positive_adopt/117852.html. Вроде бы автор не виноват, писал хороший текст, старался, а тут облом и не пришла популярность. Видимо именно для таких случаев придется сделать исключение. А Вы что думаете?

Метки:  

Last week news

Вторник, 01 Декабря 2009 г. 17:24 + в цитатник

Метки:  

Рейтинг блогосферы - пост 5 (алгоритм сортировки)

Понедельник, 30 Ноября 2009 г. 16:45 + в цитатник
За прошедшую неделю я успел пообщаться с нашим патентным ведомством, которое сказало мне, что алгоритмы не патентуют, патентуют готовые прототипы. Предложили подогнать мою заявку под "Программу для базы данных для ЭВМ", но я не стал тратить время. Таким образом продолжаю серию постов, кратко рассказывающих как формируется ТОП30.
Содержание уже опубликованных заметок


Сегодня я приведу алгоритм первичной сортировки и объясню некоторые моменты. Если Вы читали предыдущие заметки, то должны знать, что алгоритм первичной сортировки нужен только для того, чтобы выбрать порядок в котором записи будут анализироваться на предмет прохождения через фильтры. Собственно сам package первичной сортировки:
Читать далее...

Метки:  

Who care about comments: GoogleWave

Пятница, 27 Ноября 2009 г. 15:43 + в цитатник
Уже все крупнейшие западные гик-блоги успели высказать негатив про GoogleWave: TechCrunch, TheNextWeb и т.д. Кто-то сравнивает wave с очередной аськой, которой еще никто не пользуется, кто-то сравнивает с новой социальной сетью, в которой лень регистрироваться. Но лично мне видится явная задача, которую wave сможет скоро решить - это "комментарии, как источник новостей". Действительно, сейчас всех журналистов волнуют только посты, которые они перепечатывают получая новости, но очень часто в комментариях появляются не менее важная информация, которая достойна стать отдельной новостью. Но, увы, нигде нет нормальных средств для распространения комемнтариев - "цитирования", "ретвитинга", или иными словами "распространения в контексте обсуждения". Есть много систем пытавшихся унифицировать комментарии к новостям - это и Disqus, и IntenseDebate. Но все они пытались лишь привлечь пользователя со стороннего ресурса для обсуждения новости у себя. GoogleWave же должен позволить скопировать обсуждение в любую из имеющихся новостных площадок. И даже проиграть комментарии по времени.

Пример для наглядности: президент подписывает новый закон - это есть новость, которая копируется во все СМИ, в том числе и в GoogleWave, где пользователи начинают активно обсуждать и высказывать негатив. Это замечают журналисты, которые пишут 2 новые новости: 1) интернет пользователи высказываются негативно по новому закону. 2) пользователь kasparov@googlewave.com в комментариях к новому закону призывает выйти на митинг против новых....
Соответственно сейчас в СМИ, если и будет напечатана одна из двух новостей, созданных комментариями, то будет в лучшем случае показана картинка с комментариями и дана ссылка на всю тему с обсуждением. Но интернет-СМИ на то и "интернет", чтобы давать не просто картинки, а более полные и интерактивные цитаты того, что происходит.
Поэтому, если wave создаст удобный функционал во вне для так называемого "ReWave" (по аналогии с ReTweet) - то у него все шансы обогнать твиттер и тем более закрытый фейсбук благодаря открытому обсуждению горячих новостей.

Метки:  

Подстава дня: rss2email.ru

Четверг, 26 Ноября 2009 г. 12:18 + в цитатник
С грустью обнаружил, что и среди перспективных проектов до сих пор случаются проблемы с регистрацией доменных имен. Так сегодня стал недоступен стартап с многотысячной аудиторийей http://rss2email.ru, о котором так много писала UNOVA и презентацию которого можно увидеть по ссылке. Кроме того я и сам планировал им пользоваться. Ребята то ли забыли продлить доменное имя, то ли не нашли инвестиций и решили закрыть "перспективный" проект. В любом случае доменное имя можно будет купить послезавтра, тогда же мы и узнаем ответ на столь волнующий вопрос.

Метки:  

Hardlock Dongles emulation

Вторник, 24 Ноября 2009 г. 17:15 + в цитатник
Многие знают как создавать виртуальные сидиромы, чтобы устанавливать игрушки и пиратский софт, но не многие знают как эмулировать USB-ключ, который обычно поставляется с серьезными программными решениями. То есть чтобы запустить программу нужно предварительно вставить ключ и только тогда программа запустится. На западе такое устройство называется Dongle, у нас, кроме как USB-ключ, существует название "Шипка". Важно отметить, что устройство не обнаруживается как простой USB-ключ, тем самым вы его просто так не скопируете. Доступ к нему даже самой прогой осуществляется через специальный драйвер (Alladin и т.д.).

Программ по обходу такой защиты и эмуляции, если поискать, то можно найти массу, и 98% из них будут разводиловом. Поэтому для тех кто найдет этот пост через поиск я выложил архивчик, в котором есть все что надо для устройств типа Hardlock.
Читать далее...

Метки:  

Speedly: Text Parsing

Понедельник, 23 Ноября 2009 г. 23:26 + в цитатник
Мало освященной в рунете оказалась новость, что некие ребята планируют запустить сервис автоматического парсинга страниц по словам и тематике. То есть на вход дает ссылку на текст, а на выходе получает набор основных слов и название тематики поста. Очень удобно и всем необходимо, жаль, что пока закрытое тестирование идет. В целом, такой сервис без труда могли бы поднять как Гугл, так и Яндекс. В последнем случая у нас были бы просто космические возможности по созданию тематического ТОПа... А пока приходится все делать вручную.

Метки:  

Аудио-запись: посвящается топ30

Воскресенье, 22 Ноября 2009 г. 19:22 + в цитатник
Файл удален из-за ошибки в конвертации Click Click Boom - Saliva

Рейтинг блогеров

Пятница, 20 Ноября 2009 г. 20:33 + в цитатник
Яндекс наконец-то выкинул мертвяков (их нельзя было читать) из blogs.mail.ru с верхних строчек рейтинга. Теперь вопросы вызывает нахождение там "блога картинок" - уровень заметно ниже тех же фишек, да и посещаемость накручена, да и комментариев относительно немного.
Будем ждать.

Метки:  

news-Outernet-ICQ-GoogleOS

Пятница, 20 Ноября 2009 г. 14:12 + в цитатник
самые интересные технический новости: 1) Tish - выложила презентацию про следующий этап развития Интернета - Outernet , а также про необходимость использования Google Wave в AR приложениях. В общем все уныло, если бы не мысль, что "А.Everyone here will make money, B.Everyone not here can go fuck themselves" или по русски, "кто успеет - тот и папка"

2) AOL продает ICQ - дада, ту самую ICQ, через которую вы общаетесь с друзьями. Теперь вашу переписку будет мониторить не только ЦРУ, но и любая фирма за символические 300млн.у.е. Такая дешевизна продажи может быть связана либо с кризисом, либо с тем, что все боятся выхода Google Wave - нового слова в коммуникациях.

3) Состоялся показ GoogleOS - он запускается за 7 секунд! - почти также быстро как винда выходит из спящего режима!


Метки:  

CAPTHA+ADS

Четверг, 19 Ноября 2009 г. 21:15 + в цитатник
Посетила меня мысль, что каптча в современном мире бесполезна, однако ее продолжают применять, так как несколько сот миллионов пользователей интернет уже привыкли к тому, что это защищает сайт от роботов и пользователи на дрессировались распознавать хитро-зашумленные буквы и цифры, поэтому грех этим не воспользоваться. А в итоге только тратиться впустую время всей планеты. Сегодня, когда Микрософт и Гугл тратят немало усилий, вплоть до пересмотра базовых протоколов, чтобы сделать интернет быстрее, когда лучшие умы планеты думают, чтобы ускорить загрузку на сотую секунды, и все это напрасно, ибо после нескольких миллисекунд вам грузится капча и вы тратите несколько минут пытаясь угадать, что же там нарисовано. А между тем роботы, которых все якобы боятся, делают стартап популярным в глазах статистики, а уже на популярный ресурс в итоге заглядывают реальные пользователи, делая посещаемость.

Таким образом, мысль моя приходит к тому, что в у нас должна быть капча, где пользователям предлагают ввести не просто слово, а имя бренда, одного из тех, что рекламируется. То есть создается банерная сеть из каптча вводов. А рядом еще кнопка подсказка, где вам тупо зачитывают основной рекламный лозунг этого бренда, про отбеливание и чистую одежду, чтобы вы уж точно вспомнили, что это "VANISH" закодирован в каптче.

Метки:  

Рейтинг блогосферы - пост 4 (про ссылки)

Среда, 18 Ноября 2009 г. 15:10 + в цитатник
Примечательно, что с каким бы программистом я не начинал обсуждать алгоритм составления ТОПа, в итоге каждый говорил, что вот он сейчас пойдет создаст сайт, выложит там новый ТОП и станет популярным. Это с одной стороны хорошо, так как показывает, что программисты - люди дела и любители играть в разные алгоритмы, а также мечтают стать знаменитыми. Но с другой стороны показывает, что они не понимают
1) Как работать в команде,
2) Что так как все работают с одним векторным пространством и одинаковыми сырыми данными, то в итоге рейтинг у всех будет совпадать в значительной степени.(~20%)
3) Самая сложность не в первоначальной сортировке, а в последующих фильтрах, которые должны отсеять спамерские посты. А спамерские посты чаще всего имеют ссылки как входящие, на сам пост, так и исходящие - на рекламу - которые нужно уметь определять и фильтровать. Вот об этом алгоритме работы нового ТОПа и поговорим.

После 4х летнего изучения топов я с полной уверенностью могу сказать, что нет смысла составлять списки бана, то есть лишать определенныз определенных блогеров шанса попасть в ТОП. Ибо это равносильно тому, чтобы посадить своего модератора, так как спамер может создавать новые блоги каждый день. В связи с этим логичным видится
1) фильтр по ссылкам, которые содержаться в посте - то есть все ссылки должны проходить проверку через сервис opendns, чтобы исключить ссылки на фишинговые сайты в топе или на сайты с вирусами. Минус - медленная работа по отбору записей, поэтому я пока ограничился самосоставленным списком с плохими ресурсами. И если в после есть ссылка на плохой ресурс, то пост не попадет в топ. Также я расматриваю вариант, когда на наличие плохих ссылок будет анализироваться вся главная страница блога и страница профиля, так как вероятно их откроет человек захотевший узнать побольше об авторе ТОПа и этим тоже пользуются спамеры.
2) ссылки на популярные сервисы сокращения ссылок (bit.ly) можно пока не фильтровать, так как эти сервисы сами заинтересованы в фильтрации ссылок на фишинговые и вирусные сайты.
3) Ранее я упомянул фильтр на локальный экстримум - он заключается в том, что проверяется, что за локальный период времени ссылок именно на этот пост блогера было больше всего или комментариев было больше всего. Это прежде всего позволяет отфильтровать тех у кого есть трансляции и у кого стабильно по несколько ссылок между своими трансляциями. Также отфильтрует тех, у кого стабильно много комментариев, например из-за спама в комментариях.
4) Анализируя спамерскую активность я пришел к выводу в необходимости фильтра "LinksIntegrity" - задача которого проверить все ссылки на расматриваемый пост, отбросить одинаковые, отбросить те, которые сделаны из сообществ и отбросить все ссылки с микроблогов. Повышенная активность в микроблогах и то, что там почти каждый пост содержит ссылки - говорит о том, что нельзя микроблоги причислять к полноценным блогам. Кроме того в микроблогах сейчас каждый упоминание типа "@user" - считается ссылкой и это сильно перекосило рейтинг блогеров и вызывает недоумение в определенных кругах. Итак, после отбора ссылок, проверяется, что оставшееся число ссылок достаточно для того, чтобы интегральная характеристика поста оставалась среди 20% постов с наибольшим значением.

Метки:  

Сказка на ночь

Понедельник, 16 Ноября 2009 г. 02:01 + в цитатник
В сеть выложено еще 13 тыс. взломанных аккаунтов от вконтакта - http://habrahabr.ru/blogs/virus/75345/. Проверил - подходят. Такая регулярность с паролями в открытом виде наводит на мысль, что взлом осуществляется не просто троянами, а с помощью популярных социальных игр число которых растет постоянно, где участникам предлагается залогиниться, введя мыло и пароль, что наивные пользователи и делают.
Спокойной ночи.

Метки:  


Процитировано 3 раз

Go Code

Воскресенье, 15 Ноября 2009 г. 03:55 + в цитатник
Свежая наклейка на ноуте с надписью "Go Code" заставила меня поразмышлять о новом языке программирования, который предлагает Google. Во-первых, уже полно языков программирования и трудно придумать что-то, чтобы всех заставило разом перейти на него. Во-вторых, пошла шутка, что "В ответ Yahoo запустил язык программирования YO! А мы теперь ждем языка YA!". Но если подумать, то можно вспомнить, что сейчас идет бета тестирование GoogleWave, которое в следующем году станет доступно всем, а также появится маркет, на подобии AppStore, где девелоперы смогут продавать, написанные ими снипеты для GoogleWave. Это программы, с помощью которых пользователи смогут взаимодействовать друг с другом, например, игры в социальных сетях. Но если мы возьмем OpenSocial платформу, то даже в ней для создания какой-то простой игры потребуется дополнительно изучать форматы сообщений, представления данных, почти как изучить новый язык. Не исключено, что Гугл захочет заставить прогеров писать снипеты, а также федеративные сервера, для GoogleWave на собственном языке.

Метки:  

Ретинг блогосферы - пост 3

Четверг, 12 Ноября 2009 г. 16:29 + в цитатник
Провел небольшой эксперимент, имея на руках 4 параметра (visits24, links, comments, commenters), базу из 1000 постов за 3 дня, а также историю ТОПа с 40 постами за сутки, а попытался методом перебора коэффициентов найти наиболее подходящий вектор, на который делается проекция, как было описано в первом посте, чтобы после сортировки всех записей по величине этой проекции, в первых 100 оказывалось максимальное число постов, которые попали в топ, построенный по старому алгоритму.
Результатом стал вектор (10,9,12,12) с результатом в 25 постов из 40. Это прежде всего говорит о том, что в текущем алгоритме есть явная завышенная зависимость от числа различных русскоязычных комментаторов к посту (commenters). Я же для сортировки записей беру вектор с равными весами = (1,1,1,1). Кроме того, стоит отметить два выявленных особенностей
1) В блогах на YaRu - внутренняя ссылка является также комментарием, поэтому важно уменьшать кисло комментариев на число ссылок. Иначе получается завышенное число ярушных блогов с высокими значениями.
2) Нормировка происходит не только в группах по типу блогплатформы, но и по типу блога или сообщества. То есть для блогов и сообществ максимумы значений считаются отдельно.

После того, как записи в текущей куче постов за 3 дня отсортированы применяются фильтры. Их много, я их кратко перечислю по ходу применения:

Читать далее...

Метки:  

Рейтинг блогосферы - А что всем нужно?

Среда, 11 Ноября 2009 г. 14:31 + в цитатник
В рамках открытого обсуждения нового алгоритма ранжирования записей блогосферы собраны следующие пожелания к обновленному топу. Эти условия необходимо выполнить, чтобы ТОП блогов, как социальное явление не был полностью дискредитирован теми, кто хочет на нем лишь заработать:

  • Сводный рейтинг записей, который было бы интересно читать.
  • Сводный рейтинг записей, в который при необходимости можно было бы попасть.
  • Несколько разных страниц с разным дизайном, но одинаковым содержанием, чтобы не винить одну сторону во всем.
  • Достаточную посещаемость у рейтинга, чтобы рекламодателям было бы интересно.
  • Единую систему ценностей, чтобы попадание в ТОП – что-то значило как достижение.

Метки:  

GoogleDevDeay 2009

Среда, 11 Ноября 2009 г. 12:26 + в цитатник
Пару слов о вчерашнем мероприятии гугла. План минимум выполнен - попили, поели, футболку получили. В остальном же не был особо поражен наработками гугла, такое чувство, что переделываются в Open Source все наработки Микрософта. Только для бизнеса Open Source не вариант - ибо если что-то непонятно или не работает, то кто должен отвечать или чинить? Вот на той же схеме с синхронизированными данными сервер-сервер в GoogleWave мне бы обязательно задали вопрос - а что будет, если один из серверов вырубиться в процесе такого обмена... как будет реагировать второй.

Посмотрел еще раз на моего любимого Chrisa Chabota (любимый, так как похож на Гомера Симпсона), занимающегося http://ActivityStrea.ms, правда он до сих пор пребывает в заблуждениях, разбивая социально значимый объект на 3 части, а не на пять, как я рекомендую, забывая о еще не созданном 8м семантическом инварианте - мониторинге. То есть "социально значимый объект" в сети должен состоять из "Idendity"(я-вася), "Relations"(знаю Петю), "CurrentState"(часто меняющиеся переменные, такие как локация или список используемых приложений), "Activities"(список посещенных мероприятий, сделанных постов), "Statistic" (например, блог ведется 2 года, запощено 100 постов).

Далее подловил главного по GoogleWave - спросил, собираются ли они делать из WaveID распределенный идентификатор, чтобы я мой шарить не только личные данные, но и текущие активные вавлеты, через которые со мною можно было бы связаться. Он сказал, что не думал еще про это, но идея очень интересная.

И в дополнение, на ugotrade вышла очередная большая статья, рассказывающая про будущее Дополненной реальности и создание так называемого OuterNet'a - то что прийдет на смену InterNet'u.

Метки:  

F5 today

Понедельник, 09 Ноября 2009 г. 14:30 + в цитатник
Почитал сегодняшний номер журнала F5. В целом как обычно - отсутствие собственных мыслей и куча копипастов из интернета дополненных развлекательными картинками. Хочу прокомментировать историю про черно-белые мультики Mr.Freeman. Примерно 2 года назад в сети появилась книга, которую можно было бесплатно скачать и активно распространялась среди разных вирусмейкеров рунета. Книга называлась "Войны креатива" и как раз повествовала о русском креативщике, который анонимно завел блог в интернете и постил креативы. Его целью было активизация российских умов с целью создания нового товара экспортируемого на запад - креатива. Российского креатива, который бы составил конкуренцию западному креативу, какой-то там фирмы. Вообщем тым была долгая история, но можель исполнения и ключевые фразы совпадают. Помню еще тогда мне говорили, что типа - давай организуем блог креатива, сделаем революцию в умах... но я не ведусь на подобный бред.

Примечательно также, что из газеты убрали небольшой блог с самыми интересными блогпостами за неделю, хотя и топ яндекса еще жив и мой deep-water.ru (на который они ссылались, но данные которого не релевантны) тоже еще жив.

Метки:  

Рейтинг блогосферы - пост 2

Воскресенье, 08 Ноября 2009 г. 17:43 + в цитатник
Сегодня я вернусь к вопросу правильности выбора параметров, от которых строится функция F(comms,visits,commenters,links) - входящая в композицию веса поста.
Первый вопрос, почему я отбросил другие параметры, кроме перечисленных четырех, такие как "число комментариев/ссылок/комментаторов за последние 24 часа", а также "вес ссылок - linksweight". Ответ: Я достаточно долго работал с данными, собираемыми распределенной системой по всему миру и убедился, что такой параметр как время становится более чем относительной характеристикой. В этот параметр вкладывается и задержка поступления данных с разного индексирующего кластера, и месторасположение блогплатформы, у которой серверное время может выдаваться со сдвигом и прочее и прочее. Однако, стоит заметить, что параметр linksweight в алгоритме учитывается. Так как в старом алгоритме придавалась большая значимость количеству ссылок, которые делаются на запись, и кроме того есть механизмы обнаружения спамерских ссылок, то в новом алгоритме я оставляю требование на наличии хотя бы одной неспамерской по версии Яндекса ссылки.

Второй вопрос, почему четыре параметра входят в функцию с одинаковыми весами. Ответ: При построении интегрального коэффициента глупо было бы отдавать предпочтение одному из параметров. Записи должны отсеиваться на основании тех параметров, которые определяют текущее состояние экспертной системы, а следовательно базируются на выборке из всех записей блогосферы, а не одной конкретной, о которой накрутчикам известно все и они могут подкрутить любой из параметров. С такой точки зрения, все четыре параметра равноценны, однако, у меня есть большое недоверие к параметру посещений, так как он весьма условный и вероятно считается некорректно. Но это не так важно, так как наш интегральный параметр задает лишь критерии сортировки записей перед выборкой и не является определяющим при помещении записи в ТОП.

В заключение отмечу, что в единицу времени в ТОП помещается только одна запись, так как эта операция меняет основные параметры экспертной системы и следовательно дискретна. За день в ТОП может попасть не более 70 записей. Если этого будет много, то я уменьшу этот параметр.

В следующий раз я затрону тему фильтров 1)по темам дня 2) отсеивание ссылок на плохие сайты 3) отсеивание дублей методов сравнения слов-низкочастотников в постах находящихся в ТОПе. А пока, результат работы нового алгоритма формирование рейтинга популярных тем блогосферы публикуется на сайте beta.topbot.ru. Присылайте вопросы на topbot@ya.ru.

Метки:  

Новости в IT

Пятница, 06 Ноября 2009 г. 11:51 + в цитатник
Привлекла мое внимание новость об открытии технологического центра в Москве от Микрософта - стоимостью аж 300 млн.руб, причем крупнейший в Европе, неужели больше ни одной стране не нужен? Центр создан с целью тестирования крупно масштабных IT-решений российских компаний. И вот тут мне режет глаз цифра в 300 млн. - ведь именно такой бюджетный расход у нашего МВД за последние 3 года на технологическое обеспечение от Микрософта. Это не только "лицензионная винда", но и услуги консультантов, mssql сервера, biztalk сервера, сертификационные курсы админов - как раз все то, что покупалось для создания "крупно масштабного IT-решения". И для чего центр - чтобы дальше доить дойную корову. С других стран Восточной Европы видимо нет такого хорошего удоя.
В итоге хороший, хоть и не совсем корректный, пример того, как деньги от глупых перетекают к умным.

Кроме того, меня порадовала фантазия журналистов про яндекс топ, которая не имеет под собою фактов, и все утверждения в ней можно доказательно опровергнуть, но я не буду себя утруждать.

Метки:  

Рейтинг Блогосферы - ОБНОВЛЕНИЕ

Четверг, 05 Ноября 2009 г. 14:19 + в цитатник
На днях в СМИ появились непонятные статьи о том, что рейтинг русскоязычных блогов закрывается. Тут стоило прояснить, что ничего не закрывается, а произойдет лишь обновление алгоритма ранжирования записей и то, в декабре этого года. Все самые обсуждаемые темы по прежнему будут доступны через сеть блогов topbot.ru и вся статистика будет доступна все там же - topbloger.ru. Необходимость обновления алгоритмов работы ТОПа обусловлена большим числом рекламных сообщений, которые стали попадать в ТОП. Последней каплей стало попадание 31 октября 4х записей одинакового содержания "МВД РАЗГОНЯЕТ ПЕНСИОНЕРОВ". Найти эти записи можно на странице, введя в поиск по названию указанную выше фразу (После того как мне позвонили с требованием убрать их - я стер часть копий).


Перейдем теперь к рассмотрению алгоритма ранжирования самых обсуждаемых тем русскоязычной блогосферы. Новой его особенностью будет то, что алгоритм помещения записи в ТОП будет публиковаться открыто в моих блогах. До момента обновления я буду результаты работы нового алгоритма доступны на странице beta.topbot.ru

Итак, как же работает ТОП? Имеется еженедельная куча всех стоящих для прочтения постов. Для каждой записи строится оценочная функция. Исходя общей теории экспертных оценок имеем, что вес записи в блоге равен композиции трех функций BlogPost(n) = F(comms,views,commenters,links)*H(author,weekly,reffers)*C(theme,copies,time) - функции состояния объекта, истории объекта и функции коррекции от связей объекта с экспертной системой.
Читать далее...

Метки:  

Кавказ - Цена признания независимости.

Суббота, 31 Октября 2009 г. 23:14 + в цитатник
Ситуация вокруг признания независимости Абхазии и Южной Осетии наводит меня на мысль, что в современном мире, чтобы страна считалась признанной, необходимо две вещи: 1) Нарисовать страну на карте гугла. 2) Нарисовать страну на карте Yahoo. И не исключено, что это обойдется заметно дешевле, чем раздача многомиллиардных кредитов военизированным странам, которые их не вернут.

А пока же, наши южные соседи отмечены лишь на Яндекс картах.

Метки:  

ICANN: 500 symbols in domain names

Суббота, 31 Октября 2009 г. 00:16 + в цитатник
Важнейшим событием для Интернета стала конференция ICANN в Южной Корее, где говорилось о включении в названия доменных имен еще нескольких языков(в том числе и русский). И несмотря на то, что мне неприятно такое изменение, но с общих позиций - данных шаг рано или поздно необходимо было сделать.

Плюсы введения новых языков:
1) Детям проще быть в интернете. И почти все новые технологии интерфейсно создаются исключительно под детей.
2) Мы приближаемся к идее "LID" - когда у каждого пользователя будет отдельный домен - являющийся его паспортом и написанный на его языке. То есть в интернете пропадет концепция сайтов, а остануться лишь странички отдельных людей и групп людей. И возможно, когда-нить выходить в интернет мы будем так: m://вася.пупкин к паспорту человека и c://газпром.ру - к сайту кампаний.
3)Появление новых деменных зон и, как следствие, возможностей заработать на web-мастерах.

минусы:
1) Детей станет больше в интернете, которые не знают язык, и от этого интернет потупеет еще больше.
2) Непонятно как создать один домен на все языки, раскошеливаться на все языки - глупо.
3) Английский останется доминантным.

Метки:  

Yandex: Экстрасенсы и кривые алгоритмы.

Четверг, 29 Октября 2009 г. 22:11 + в цитатник
С каждым днем все больше поражаюсь тому, что происходит на страницах Яндекс поиска по блогам. Сегодняшний день не стал исключением. Сегодня в десятку самых популярных блогеров вошел некто Мехди Вафа с блогом на майл.ру. Историю его роста можно увидеть на топблогере. И если год назад нахождение в 10-ке рейтинга одного дневника с майл.ру было уже чем-то подозрительным, то сейчас там "висят" целых 2.
Итак, Мехди Вафа возглавляет центр экстрасенсов (боюсь назвать их шарлотанами, а то мало ли что наколдуют), поэтому выбор площадки майл.ру для ведения дневника - вполне обоснован. Далее, как говорит нам Yandex, у дневника аж 75тыс друзей, в то время как сам mail.ru показывает только 10тыс читателей(ps: на этой странице переключение вкладок под оперой не пашет). А 100тыс - это число тех, кто имеет доступ к его записям, но не читает регулярно в ленте. Это известное искажение понятия "дружбы" на mail.ru, помогающей ей строить красивые рекламные отчеты о раскрутке брэндов.
Странности добавляет то, что уважаемый Вафа день назад закрыл дневник ото всех, кроме друзей, и теперь мы имеем один из самых популярных дневников по версии Яндекса закрытым. В любом случае будем надеется, что такая ошибка рейтинга - следствие африкаского аутсорсинга у наших чернокожих братьев(а не желание отдельных личностей творить кривой рейтинг) - будет исправлена в кратчайшие сроки и все виновные будут скормлены акулам.


Читать далее...

Метки:  


Процитировано 1 раз

ВЛАДИМИР ШКЕТ

Среда, 28 Октября 2009 г. 15:11 + в цитатник
Сегодняшним постом расскажу о некоторых фишках asp.net, о которых многие еще не знают:
  • При размещении в рамках одного IIS нескольких сайтов, важно задавать machinekey разный в настройках web.config. В противном случае в логах постоянно будут возникать ошибки при подгрузке сайтом ресурсов через Script~.axd. Автоматически генерить ключи для сайтов можно например по ссылке
  • В новой Visial Studio 10 появилось блочное редактирование, которое будет удобным для проставлений комментров в коде, заценить новую фишку можно по ссылке. Также уже есть возможность скачать бету 2 и поиграться.
  • Win-сервис наконец-то можно будет встроить в IIS с выходом asp.net 4.0. Это очень удобно когда запрос к сервису идет в виде большого файла и тредует длительной обработки.
  • Замечу, что для передачи больших файлов между серверами в asp.net правильно использовать поточное кодирование, для этого в биндинг нужно добавить настройки messageEncoding="Mtom" textEncoding="utf-8" transferMode="Streamed"
ЗЫ: На название поста не обращаем внимание.

Метки:  

IT girlfriend

Вторник, 27 Октября 2009 г. 17:44 + в цитатник
Пиарщики проекта books.ru устроили забавный конкурс, предложив айтишникам описать девушек своей мечты при помощи SQL запроса - http://habrahabr.ru/blogs/i_am_insane/73212/. Стоящий вариант на мой взгляд один, но и он содержит грубейшие ошибки. В идущем ниже запросе стоилобы все сравнения count(*) с нулем заменить на left join нужный таблиц с проверкой на null индексного значения.

Copy Source | Copy HTML
  1. SELECT
  2.     face_image,
  3.     first_name,
  4.     last_name,
  5.     phone_number
  6. FROM
  7.     humanity
  8. WHERE
  9.     gender = 'woman' -- Под понятие идеальной девушки попадает только женский пол, я думаю…
  10.  
  11.     AND NOT married -- не замужем, не женатая
  12.     AND (SELECT COUNT(*) FROM humanity WHERE mother_id = humanity.id) = 0 -- без детей
  13.     AND social_status IN ('student', 'employee', 'business lady') -- не сидит впросидь дома
  14.  
  15.     AND weight / POW(height, 2) BETWEEN 17 AND 22 -- Индекс Массы Тела
  16.     AND breast_size BETWEEN 2 AND 4 -- Рамер груди
  17.  
  18.     AND iq_index BETWEEN 95 AND 110 -- Не глупая, но и не перегибая палку
  19.     AND (SELECT COUNT(DISTINCT word) FROM spoken_words WHERE human_id = humanity.id) > 6000 -- Есть, о чём поговорить
  20.  
  21.     AND cooking_level /*+ football_interesting*/ + computer_education > /*220*/ 180 -- Любые комбинации приветствуются
  22.  
  23.     AND (
  24.         SELECT
  25.             COUNT(*)
  26.         FROM
  27.             books
  28.             JOIN bag_content ON bag_content.object_id = books.id AND bag_content.object_type = 'books'
  29.             JOIN bag ON bag.id = bag_content.bag_id
  30.         WHERE
  31.             bag.owner_id = humanity.id
  32.             AND books.author_last_name = 'Донцова'
  33.     ) = 0 -- Без комментариев
  34.  
  35.     AND NOT smoking -- !!! 

Метки:  

Just a day

Понедельник, 26 Октября 2009 г. 15:48 + в цитатник
Ниже я перечислю некоторые обсуждаемые новости рунета, дополнив их комментариями:
  • Сергей брин, сооснователь Гугла, пожертвовал 1млн.баксов в компанию, которая помогла ему убежать из СССР. У Вас же есть более простая возможность уехать в США - выиграть грин-карту. Россия впервые за 5 лет в списке стран, которые могут подавать заявку. Шанс получить визу - примерно 1 из 100. Подать заявку можно до конца ноября. Лично я не рекомендую уезжать в эту дикую страну, где черные свободно покупают оружие за стремительно дешевеющие доллары.
  • Газета F5 вынесла на первую полосу обсуждение перспектив паспортизации интернета, опубликовав серию негативных комментариев. Я же уверен, что интернет-паспортизация нам жизненно необходима на базе медицинских чипов, создав тем самым 5й инвариант семантического веба - Internet Identity Layer.
  • На хабре выяснили, что большинство российских гиков негативно относится к твиттеру. Проблема в том, что журналюгам и быдлу - он нравится, что и является причиной его роста в России. Однако в мире, согласно Quantcast и AlexaGB, за октябрь твиттер впервые(!!!) потерял 3% посещений упав до 27млн в день. Также некоторое падение есть и в данных AlexaRUS. Возможно это связано с бета тестированием GoogleWave или рецессиями против спамеров, которые и являются самыми активными пользователями твиттера.

Метки:  

RIW: after

Суббота, 24 Октября 2009 г. 21:37 + в цитатник
Пара слов о мероприятии.

1) Во-первых на нем присутствовали голые разукрашенные сиськи от капании skillopedia. Появление разукрашенных женских вторичных половых признаков становится для IT тусовок чем-то обыденным. И напоминает принесение в жертву девственниц "богу производительности" в языческие времена.

2) На втором месте идут слова Антона из Яндекса, который сказал, что "Рейтинг Яндекса по блогам скоро изменится, ввиду того, что будут обсчитывать новые (ранее неучтенные) ссылки, а также учитывать посещаемость блога в рейтинге". На замечание, что тогда рейтинг будет влиять на рейтинг, ответил - "А он и сейчас влияет, не нравится, придумайте лучше". Между делом на секретной странице yandex.st версия системы поиска по блогам обновилась до 2.6. И до сих пор не ясно, когда же мы научимся распознавать дубли и когда топбот попадет в выдачу яндекса.

3) Глянул глазком на iWeekend. Ребят там было немного, лица у всех напряжены, видимо сказывается 3й день упорной работы. Со стороны можно понять, что делается какой-то проект для мобильных телефонов.

4) И завершу обзор феерическим выступлением Белоусова Николая, который пытался рекламировать Твиттер. Непосвященному его речь могла бы показаться бредом, но в ней очень много было того, что стоит разобрать на цитаты: "Пользуйтесь твиттером - это модно! Я испытываю особое чувство, когда пользуюсь им!", "Сейчас все бренды, вкладываясь в твиттер, - вкладываются туда, где нет аудитории!"
Эти слова отчести правда - так как тем фирмам, что размещают рекламу в блогосфере - платят не за конкретных людей, а за красивые отчеты, которые очень быстро рисуются в твиттере, ибо в твиттере сама ссуть "френдинга" давно превратилась в фарс (важны лишь группы) и кроме того, высок процент клика на ссылки, а следовательно переходов куда нужно.
Далее приводится картинка со списком микроблогов (не знаю, почему горе-евангелисты не развернули полный список):

И идет следующий комментарий: "У майлру больше всего сообщений. Но мы знаем, что они врут! Вычеркиваем их! Qip.ru? Они тоже врут! Теперь вычеркиваем тех, кто ниже твиттера, потому что они лохи - у них совсем нет аудитории. Но Friendfeed оставим, потому что я им пользуюсь. Таким образом для эффективной рекламы можно пользоваться только Твиттером и Френдидом!"

Url Shorteners API

Суббота, 24 Октября 2009 г. 00:56 + в цитатник
Добавил в библиотеку BlogsAPI(только в исходники, не в релиз) класс для работы с Bit.ly API. По умолчанию использует мой девелоперский ключ, но можно в конструкторе задать и свой. Позволяет получить сокращенную ссылку по длинной следующим кодом. Также есть возможность извлечения числа переходов по ссылке:

Copy Source | Copy HTML
  1. [TestFixture]
  2. public class Shorteners
  3. {
  4.     [Test]
  5.     public void Bitly()
  6.     {
  7.         BitLy shortener = new BitLy();
  8.         String sRet = shortener.ConvertDataTo("http://s-c.me", ItemType.FullUrl, ItemType.ShortUrl);
  9.         Assert.AreEqual(false,String.IsNullOrEmpty(sRet));
  10.     }
  11. }

Метки:  

Major Updates

Пятница, 23 Октября 2009 г. 10:43 + в цитатник
Мое внимание привлекли 2 новости мирового масштаба:
1) ЖЖ по прошествии 3х лет сотрудничества открыло-таки поиск по ЖЖ на базе Яндекса, благодаря этому я не могу найти сам себя.
2) GoogleReader обрастает все большим количеством сложных разделов, сегодня они сделали некий "ТОП"(Popular Items) фидов на основе "Нравиться"(Likes) от читателей. Этот топ не кастомизирован по языку и пугает большим обилием постов, которые бы я в жизни не стал читать.

Метки:  

Поиск сообщений в Flashr
Страницы: 26 ... 15 14 [13] 12 11 ..
.. 1 Календарь