... Законно ли заниматься парсингом сайтов в России?
Законно ли заниматься парсингом сайтов в России?... Попробуем рассмотреть один из лучших способов сбора информации в интернете – парсинг – с юридической точки зрения в России и в других странах. Эта публикация касается некоторых юридических вопросов, связанных с парсингом сайтов, но не является полноценной юридической консультацией. Парсинг – это автоматизированный процесс извлечения данных с чужого веб-сайта (обычно с Интернет-магазина). Но стоит разобраться, действительно ли это один из самых полезных инструментов ИТ для сбора данных или ловушка, влекущая неизбежные проблемы с законом? Предположим, вам нужно разместить тысячу карточек товаров в вашем новом интернет-магазине. Вам нужно собрать много информации, обработать, переписать и заполнить карточки. Для решения таких задач, появились программы, сканирующие сайты, результаты выдачи поисковых систем, и копирующие однотипные (текст или картинки) либо универсальные (текст и картинки) сведения. Они позволяют распознавать огромные объемы непрерывно обновляемых значений. Парсинг мог бы непременно стать одним из совершеннейших способов добычи контента по всей сети, но к нему прилагается оговорка: с этим инструментом очень сложно разобраться с юридической стороны. Парсинг – это процесс, посредством которого автоматизированная часть программного обеспечения извлекает данные веб-сайта, «прочесывая» многочисленные страницы. Поисковые системы как Google и Яндекс делают нечто подобное, когда индексируют веб-страницы, а парсинговые механизмы идут дальше и преобразовывают информацию в формат, который позволяет этими данными пользоваться, заносить в базы или электронные таблицы. Парсинг – не то же самое, что получение данных по API. Например, компания может открыть доступ к API, чтобы позволить другим системам взаимодействовать с ее данными; при этом качество и количество доступных данных через API, как правило, ниже, чем можно получить, используя парсинг. Кроме того, парсинг предоставляет более актуальную информацию, чем через API, и значительно проще настраивается со структурной точки зрения. Области применения «парсинговой» информации очень многочисленны. Спортивный журналист может использовать парсинг, чтобы исследовать бейсбольную статистику для статьи. Или, например, в электронной коммерции можно извлекать наименования товаров и цены на них из разных источников для последующего анализа (как пример в России — наш сервис парсинга и мониторинга цен конкурентов xmldatafeed.com). Но, хоть парсинг и, несомненно, мощный инструмент, когда дело касается правовых вопросов, могут появиться трудности. Поскольку в процессе парсинга изначально существующий контент из разных источников присваивается тем, кто этот инструмент использует, появляются этические и юридические затруднения. [su_box title=»Парсинг сайтов» style=»soft» box_color=»#085fc8″] Планируете свой бизнес и необходимы данные? Регистрируйтесь по ссылке https://ru.xmldatafeed.com и пользуйтесь ежедневными итогами парсинга крупнейших сайтов России! [/su_box] На сегодняшний день в среде парсинга нет четко очерченных юридических рамок, это состояние постоянного движения, но можно попытаться приблизительно обрисовать зоны наибольшего риска. Ниже в общих чертах описываются самые яркие случаи судебных разбирательств, имевшие место в США, и ставшие прецедентными.
2000-2009: eBay
2009: Facebook
2011-2014: Ауэрнхаймер
В 2010 году хакер Эндрю Ауэрнхаймер нашел брешь в системе безопасности на веб-сайте AT&T и извлек адреса электронной почты пользователей, которые посещали сайт со своих iPad. Воспользовавшись недостатком системы безопасности и парсингом, Ауэрнхаймер смог получить доступ к тысячам электронных адресов с сайта AT&T. Ауэрнхаймер был признан виновным в несанкционированном доступе к серверу AT&T и присвоении чужих данных. Использование парсинга для извлечения конфиденциальной личной информации может привести к обвинению, даже если эта информация была номинально общедоступной. Можно попробовать убедить суд, что ни пароли, ни коды не взламывались для получения доступа к информации, тем не менее, это опасная территория.2013: Meltwater
Meltwater – компания-разработчик программного обеспечения, чей продукт Global Media Monitoring, использует парсинг для сбора новостей. Ассошиэйтед Пресс подала в суд на Meltwater за парсинг статей, некоторые из которых были защищены авторским правом, и за незаконное присвоение новостей. Факты нельзя защищать авторским правом, но суд решил, что сами статьи и авторское изложение фактов копировать незаконно. Кроме того, использование статей компанией Meltwater не соответствовало установленным стандартам. Авторский контент не всегда можно парсить!2014: QVC
В 2014 году QVC (известный телевизионный ритейлер) и Resultly (приложение-магазин) судились из-за того, что QVC назвал «чрезмерным парсингом». Обвинение QVC было в том, что Resultly маскировала своих поисковых роботов, чтобы скрыть исходный IP-адрес, таким образом QVC не могли блокировать нежелательных для них парсеров. Из-за того, что боты были достаточно агрессивны к серверам QVC, произошла перегрузка с отключением электричества, которое повлекло ущерб в 2 миллиона долларов. Суд оправдал Resultly, постановив, что намерений нанести ущерб не было.Разрешен (законен) ли парсинг сайтов в России?
- информацию, свободно распространяемую;
- информацию, предоставляемую по соглашению лиц, участвующих в соответствующих отношениях;
- информацию, которая в соответствии с федеральными законами подлежит предоставлению или распространению;
- информацию, распространение которой в Российской Федерации ограничивается или запрещается.
- Не допускается нарушение Авторских и смежных прав.
- Не допускается неправомерный доступ к охраняемой законом компьютерной информации.
- Не допускается сбор сведений, составляющих коммерческую тайну, незаконным способом.
- Не допускается заведомо недобросовестное осуществление гражданских прав (злоупотребление правом).
- Не допускается использование гражданских прав в целях ограничения конкуренции.
- Информация находится в открытом доступе и не защищается законодательством об авторских и смежных правах.
- Автоматизированный сбор осуществляется законными способами.
- Автоматизированный сбор информации не приводит к нарушению в работе сайтов в сети интернет.
- Автоматизированный сбор информации не приводит к ограничению конкуренции.
- Извлекаемый контент не должен быть защищен авторским правом
- Процесс парсинга не должен мешать работе сайта, который подвергается парсингу
- Парсинг не должен нарушать условия использования сайта
- Парсер не должен извлекать личную (персональную) информацию пользователя
- Контент, который подвергается парсингу, должен отвечать стандартам правомерного использования