-Поиск по дневнику

Поиск сообщений в rss_weblancer

 -Подписка по e-mail

 

 -Постоянные читатели

 -Статистика

Статистика LiveInternet.ru: показано количество хитов и посетителей
Создан: 27.12.2007
Записей: 5369
Комментариев: 3
Написано: 3


Парсинг web сайта

Пятница, 31 Января 2014 г. 13:09 + в цитатник
Категория: Веб-программирование/Скрипты
Бюджет: ?

необходимо реализовать алгоритмический обход и парсинг (средствами JAVA) существующего web сайта:
- страница содержащая список продуктов - выявление всех возможных ссылок на продукт (ProductID)
- страница представления продукта (шаблонное оформление продукта = one server page) - формирование структурированного data set (product properties) заданной структуры
- формирование общего структурированного списка продуктов (product data set) в заданном техническом формате

парсинг может включать как парсинг визуального содержимого (raw server side html) так и dynamic JSON данных.

возможное количество продуктов ~ 1-3K

необходимые профеcсиональные навыки:
- Java development
- Web development
задача предусматривает исправление bug fixes (после проверки final data set quality)

http://www.weblancer.net/projects/574320.html


 

Добавить комментарий:
Текст комментария: смайлики

Проверка орфографии: (найти ошибки)

Прикрепить картинку:

 Переводить URL в ссылку
 Подписаться на комментарии
 Подписать картинку