Парсинг данных: цены, сложности и практическое применение в бизнесе
Зачем это нужно – ориентироваться в рынке, сверяться с конкурентами, понимать ситуацию на рынке. Конкуренция существует на любом рынке товаров и услуг и мало кому это не нужно. Узнать цены на недвижимость, о самой этой недвижимости, самым первым узнать об изменении ситуации на рынке, узнать о наличии товара, получить контакты лидов и закрыть ещё десятки вопросов - да для этого датацентры ближе к источникам переносят. Всем это нужно, разберёмся сколько это стоит.
В агрегаторе moscowi.ru - главные новости экономики, политики, IT - как свежее, так и анализ за период .
По цене разработчика - опуститься ниже 10 долларов в час мы не можем, даже для начинающего. Время разработки программного кода для парсинга – от минимального получаса до нескольких дней. Если за 4 рабочих часа источник не получается разобрать, то нужно использовать другие подходы, они существенно дороже.
Выяснить задачу у заказчика – заложим пару часов, не получается пока быстрее. Зачастую заказчик сам не понимает, чего он хочет. И заказы делаются не сразу, тоже это учитываем. Что бы не отрывать программистов, для этого нужен менеджер, который будет общаться на первоначальном этапе – отложите денег для него.
Из-за массового засорения интернета мусором и спамом, большинство сайтов защищается от ботов и защищается от парсеров. Если защита не самопальная, то нужны платные программные решения для обхода защиты. Они не дорогие, до 3 – 5 тысяч рублей в месяц. Если вы нашли специализированную фирму по этому вопросу, то для них этот вопрос дешевле на порядок.
Следующий пункт – количество, объём и номенклатура позиций для сбора. Собрать весь сайт можно, только это встаёт в кучу денег. Определитесь что вам нужно собирать и как часто. Тут меряют в десятках тысяч записей. Если вам нужно до одного десятка записей, то цена за средний сайт будет 4-5 тысяч рублей, если больше, то кратно умножайте цену. Цене 15 - 20 тысяч тоже не нужно удивляться, попробуйте скрапнуть какой либо защищённый сайт и запросите ещё больше.
По периодичности сбора данных – если однократно, то цена будет выше, если нужно собирать периодически, то можно рассчитывать на существенные скидки. И это нужно обговаривать заранее - новый договор и будут новые цены.
И что бы не было разочарований на первом же заказе и общении – цена зависит от объема, результат от этого будет при регулярном анализе данных, вам будут нужны специалисты, которые разбираются в вопросах как это анализировать и использовать.
Как работать с полученными данными – это сложный вопрос, на сайте выложил сотни статей на эту тему. Если мониторите цены, то вам будет нужен статистический анализ хорошего уровня и менеджер понимающий ситуацию, если собираете контакты лидов, то уметь обойти секретарей и возражения – а не сломаться на ответе «нам это не нужно». Тоже на сайте есть и это непростые вопросы, с наскоку их не осилить.
Фирма должна быть достаточно крупная, чтобы выделить средства и время специалистов на длительное время без мучительных терзаний о возможных потерях, минимально на полгода, после этого можно понимать какой результат это даёт и нужно ли это для бизнеса.