<?xml version="1.0" encoding="koi8-r"?>
<rss version="0.91">
<channel>
    <title>OpenForum RSS: Защита web-сервера от парсинга</title>
    <link>https://mobile.opennet.me/openforum/vsluhforumID8/8034.html</link>
    <description>Добрый день, коллеги!&lt;br&gt;Перешел на новый проект и появилась новая для меня задача.&lt;br&gt;&lt;br&gt;Дано: VDS с Centos 6 на борту.&lt;br&gt;Развёрнут сайт на очень сильно перепиленном  bitrix.&lt;br&gt;Нужно защитить контент (Которого много и он уникальный) от парсинга/краулинга/скреппинга (Называйте как хотите).&lt;br&gt;&lt;br&gt;1) Можно ли натравить на отслеживание парсинга fail2ban? Может есть готовый мануал? Сейчас он отслеживает только попытки брутфорса ssh.&lt;br&gt;&lt;br&gt;2) Есть ли какие-то специализированные решения для bitrix? &lt;br&gt;&lt;br&gt;3) Как вообще можно отследить парсинг? При условии, что парсер использует, скажем 10/100/1000 геораспределенных прокси?&lt;br&gt;&lt;br&gt;ПыСы: Чувствую, что решение будет в чём-то схоже с защитой от DDoS, но обосновать не могу.&lt;br&gt;</description>

<item>
    <title>Защита web-сервера от парсинга (fail)</title>
    <link>https://mobile.opennet.me/openforum/vsluhforumID8/8034.html#5</link>
    <pubDate>Fri, 08 Jul 2016 11:57:12 GMT</pubDate>
    <description>&amp;gt; Пароль - не вариант, это каталог. Вопрос именно в том, как защитить &lt;br&gt;&amp;gt; работу фотографа/дизайнера/копирайтера и прочих. Само собой, стопроцентной защиты не &lt;br&gt;&amp;gt; будет никогда, но нужно осложнить парсинг ровно настолько, чтобы он стал &lt;br&gt;&amp;gt; просто нецелесообразным &lt;br&gt;&lt;br&gt; - js, с сеансовыми токенами(и подобное)&lt;br&gt; - на графику можно прикрутить &quot;водяные знаки&quot;&lt;br&gt;</description>
</item>

<item>
    <title>Защита web-сервера от парсинга (keir)</title>
    <link>https://mobile.opennet.me/openforum/vsluhforumID8/8034.html#4</link>
    <pubDate>Fri, 08 Jul 2016 11:32:53 GMT</pubDate>
    <description>1. То, что попало в интернет - навсегда останется в интернете.&lt;br&gt;2. Защитить сайт от парсинга - невозможно. Любой сайт для парсера - html код, а он очень хорошо структурирован и парсить его нет проблем. Можно придумать разные извращения, но их изобретательство встанет вам в разы дороже чем возможные потенциальные убытки.&lt;br&gt;3. Раз у вас каталог с графическим материалом, его можно защищать водяными знаками или не выкладывать полные оригиналы (Делать обрезку обрамления и хранить оригинал в недоступном никому месте. В дальнейшем это даст выиграть в суде борьбу за авторство).&lt;br&gt;4. см. пункт 1.&lt;br&gt;</description>
</item>

<item>
    <title>Защита web-сервера от парсинга (deatwisedog)</title>
    <link>https://mobile.opennet.me/openforum/vsluhforumID8/8034.html#3</link>
    <pubDate>Fri, 08 Jul 2016 09:31:31 GMT</pubDate>
    <description>Пароль - не вариант, это каталог. Вопрос именно в том, как защитить работу фотографа/дизайнера/копирайтера и прочих. Само собой, стопроцентной защиты не будет никогда, но нужно осложнить парсинг ровно настолько, чтобы он стал просто нецелесообразным&lt;br&gt;&lt;br&gt;</description>
</item>

<item>
    <title>Защита web-сервера от парсинга (Павел Самсонов)</title>
    <link>https://mobile.opennet.me/openforum/vsluhforumID8/8034.html#2</link>
    <pubDate>Fri, 08 Jul 2016 08:55:21 GMT</pubDate>
    <description>&amp;gt;&#091;оверквотинг удален&#093;&lt;br&gt;&amp;gt; Развёрнут сайт на очень сильно перепиленном  bitrix.&lt;br&gt;&amp;gt; Нужно защитить контент (Которого много и он уникальный) от парсинга/краулинга/скреппинга &lt;br&gt;&amp;gt; (Называйте как хотите).&lt;br&gt;&amp;gt; 1) Можно ли натравить на отслеживание парсинга fail2ban? Может есть готовый мануал? &lt;br&gt;&amp;gt; Сейчас он отслеживает только попытки брутфорса ssh.&lt;br&gt;&amp;gt; 2) Есть ли какие-то специализированные решения для bitrix?&lt;br&gt;&amp;gt; 3) Как вообще можно отследить парсинг? При условии, что парсер использует, скажем &lt;br&gt;&amp;gt; 10/100/1000 геораспределенных прокси?&lt;br&gt;&amp;gt; ПыСы: Чувствую, что решение будет в чём-то схоже с защитой от DDoS, &lt;br&gt;&amp;gt; но обосновать не могу.&lt;br&gt;&lt;br&gt;Контент защищается паролем. Рассмотри возможность авторизации на сайте.&lt;br&gt;&lt;br&gt;</description>
</item>

<item>
    <title>Защита web-сервера от парсинга (_)</title>
    <link>https://mobile.opennet.me/openforum/vsluhforumID8/8034.html#1</link>
    <pubDate>Thu, 07 Jul 2016 15:10:41 GMT</pubDate>
    <description>&amp;gt; Нужно защитить контент (Которого много и он уникальный) от парсинга/краулинга/скреппинга &lt;br&gt;&amp;gt; (Называйте как хотите).&lt;br&gt;&lt;br&gt;Назовём это тупостью и жадностью. Ибо это оно и есть. &lt;br&gt;Расскжи начальству что есть много компаний которые ежемесячно платят CDN-ам за доставку &quot;контента (Которого много и он уникальный)&quot; суммы в миллион раз превышающие стоимость вашей лавки :)&lt;br&gt;&lt;br&gt;&amp;gt; ПыСы: Чувствую, что решение будет в чём-то схоже с защитой от DDoS, но обосновать не могу.&lt;br&gt;&lt;br&gt;Прикрутите рэйт-лимиты, но оно тоже не сильно поможет, а клиенты будут недовольны.&lt;br&gt;</description>
</item>

</channel>
</rss>
