The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

форумы  помощь  поиск  регистрация  вход/выход  слежка  RSS
"Защита web-сервера от парсинга"
Вариант для распечатки  
Пред. тема | След. тема 
Форум WEB технологии (Apache, http-серверы)
Изначальное сообщение [ Отслеживать ]

"Защита web-сервера от парсинга"  +/
Сообщение от deatwisedog (ok) on 07-Июл-16, 11:55 
Добрый день, коллеги!
Перешел на новый проект и появилась новая для меня задача.

Дано: VDS с Centos 6 на борту.
Развёрнут сайт на очень сильно перепиленном  bitrix.
Нужно защитить контент (Которого много и он уникальный) от парсинга/краулинга/скреппинга (Называйте как хотите).

1) Можно ли натравить на отслеживание парсинга fail2ban? Может есть готовый мануал? Сейчас он отслеживает только попытки брутфорса ssh.

2) Есть ли какие-то специализированные решения для bitrix?

3) Как вообще можно отследить парсинг? При условии, что парсер использует, скажем 10/100/1000 геораспределенных прокси?

ПыСы: Чувствую, что решение будет в чём-то схоже с защитой от DDoS, но обосновать не могу.

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения по теме [Сортировка по времени | RSS]


1. "Защита web-сервера от парсинга"  +/
Сообщение от _ (??) on 07-Июл-16, 18:10 
> Нужно защитить контент (Которого много и он уникальный) от парсинга/краулинга/скреппинга
> (Называйте как хотите).

Назовём это тупостью и жадностью. Ибо это оно и есть.
Расскжи начальству что есть много компаний которые ежемесячно платят CDN-ам за доставку "контента (Которого много и он уникальный)" суммы в миллион раз превышающие стоимость вашей лавки :)

> ПыСы: Чувствую, что решение будет в чём-то схоже с защитой от DDoS, но обосновать не могу.

Прикрутите рэйт-лимиты, но оно тоже не сильно поможет, а клиенты будут недовольны.

Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

2. "Защита web-сервера от парсинга"  +/
Сообщение от Павел Самсонов email on 08-Июл-16, 11:55 
>[оверквотинг удален]
> Развёрнут сайт на очень сильно перепиленном  bitrix.
> Нужно защитить контент (Которого много и он уникальный) от парсинга/краулинга/скреппинга
> (Называйте как хотите).
> 1) Можно ли натравить на отслеживание парсинга fail2ban? Может есть готовый мануал?
> Сейчас он отслеживает только попытки брутфорса ssh.
> 2) Есть ли какие-то специализированные решения для bitrix?
> 3) Как вообще можно отследить парсинг? При условии, что парсер использует, скажем
> 10/100/1000 геораспределенных прокси?
> ПыСы: Чувствую, что решение будет в чём-то схоже с защитой от DDoS,
> но обосновать не могу.

Контент защищается паролем. Рассмотри возможность авторизации на сайте.

Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

3. "Защита web-сервера от парсинга"  +/
Сообщение от deatwisedog (ok) on 08-Июл-16, 12:31 
Пароль - не вариант, это каталог. Вопрос именно в том, как защитить работу фотографа/дизайнера/копирайтера и прочих. Само собой, стопроцентной защиты не будет никогда, но нужно осложнить парсинг ровно настолько, чтобы он стал просто нецелесообразным

Ответить | Правка | ^ к родителю #2 | Наверх | Cообщить модератору

5. "Защита web-сервера от парсинга"  +/
Сообщение от fail on 08-Июл-16, 14:57 
> Пароль - не вариант, это каталог. Вопрос именно в том, как защитить
> работу фотографа/дизайнера/копирайтера и прочих. Само собой, стопроцентной защиты не
> будет никогда, но нужно осложнить парсинг ровно настолько, чтобы он стал
> просто нецелесообразным

- js, с сеансовыми токенами(и подобное)
- на графику можно прикрутить "водяные знаки"

Ответить | Правка | ^ к родителю #3 | Наверх | Cообщить модератору

4. "Защита web-сервера от парсинга"  +1 +/
Сообщение от keir (ok) on 08-Июл-16, 14:32 
1. То, что попало в интернет - навсегда останется в интернете.
2. Защитить сайт от парсинга - невозможно. Любой сайт для парсера - html код, а он очень хорошо структурирован и парсить его нет проблем. Можно придумать разные извращения, но их изобретательство встанет вам в разы дороже чем возможные потенциальные убытки.
3. Раз у вас каталог с графическим материалом, его можно защищать водяными знаками или не выкладывать полные оригиналы (Делать обрезку обрамления и хранить оригинал в недоступном никому месте. В дальнейшем это даст выиграть в суде борьбу за авторство).
4. см. пункт 1.
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру