<?xml version="1.0" encoding="koi8-r"?>
<rss version="0.91">
<channel>
    <title>OpenForum RSS: Google открыл код парсера файлов robots.txt&#091;BR&#093;</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/117784.html</link>
    <description>Компания Google опубликовала (https://opensource.googleblog.com/2019/07/googles-robotstxt-parser-is-now-open.html) под лицензией Apache 2.0 код С++ библиотеки (https://github.com/google/robotstxt) для разбора файлов robots.txt, содержащих правила (https://ru.wikipedia.org/wiki/&#037;D0&#037;A1&#037;D1&#037;82&#037;D0&#037;B0&#037;D0&#037;BD&#037;D0&#037;B4&#037;D0&#037;B0&#037;D1&#037;80&#037;D1&#037;82_&#037;D0&#037;B8&#037;D1&#037;81&#037;D0&#037;BA&#037;D0&#037;BB&#037;D1&#037;8E&#037;D1&#037;87&#037;D0&#037;B5&#037;D0&#037;BD&#037;D0&#037;B8&#037;D0&#037;B9_&#037;D0&#037;B4&#037;D0&#037;BB&#037;D1&#037;8F_&#037;D1&#037;80&#037;D0&#037;BE&#037;D0&#037;B1&#037;D0&#037;BE&#037;D1&#037;82&#037;D0&#037;BE&#037;D0&#037;B2) (REP (https://www.robotstxt.org/norobots-rfc.txt), Robots Exclusion Protocol) для  исключения контента из области индексации ботами поисковых систем. Одновременно компания Google выступила с инициативой продвижения протокола REP в качестве интернет-стандарта после 25 лет существования в роли стандарта де-факто.&lt;br&gt;&lt;br&gt;&lt;br&gt;Библиотека развивается уже около 20 лет, соответствует стандарту C++11  и учитывает различные нюансы оформления, встречающиеся в обиходе. Вместе с библиотекой также предложен код утилиты для проверки правильности определения правил в robots.txt. Представле</description>

<item>
    <title>Google открыл код парсера файлов robots.txt (Andrey_Karpov)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/117784.html#20</link>
    <pubDate>Thu, 11 Jul 2019 16:50:45 GMT</pubDate>
    <description>&amp;#65279;PVS-Studio хотел, но не смог найти баги в robots.txt - https://www.viva64.com/ru/b/0638/&lt;br&gt;</description>
</item>

<item>
    <title>Google открыл код парсера файлов robots.txt (пох.)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/117784.html#19</link>
    <pubDate>Tue, 02 Jul 2019 18:45:26 GMT</pubDate>
    <description>&amp;gt; поди с нуля переписывали 80 раз (по 4 раза в год)&lt;br&gt;&lt;br&gt;конечно - ты ради кода в 1,5k строк (работающего банально - со строками) будешь изучать что это за нёх?&lt;br&gt;absl::StartsWithIgnoreCase() - и т д? &lt;br&gt;&lt;br&gt;Полагаю, ты просто перепишешь большую часть на чем-то что либо нужно в другой работе, либо просто уже знаешь.&lt;br&gt;&lt;br&gt;Вот и следующий копчоный то же самое сделает.&lt;br&gt;&lt;br&gt;</description>
</item>

<item>
    <title>Google открыл код парсера файлов robots.txt (Аноним)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/117784.html#18</link>
    <pubDate>Tue, 02 Jul 2019 14:37:43 GMT</pubDate>
    <description>О, эксперты-любители автокрапа подъехали? Его то уж точно не пара терабайт, да?&lt;br&gt;</description>
</item>

<item>
    <title>Google открыл код парсера файлов robots.txt (бублички)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/117784.html#17</link>
    <pubDate>Tue, 02 Jul 2019 12:25:26 GMT</pubDate>
    <description>за 20 лет, карл! ты погляди чего наваляли! поди с нуля переписывали 80 раз (по 4 раза в год)&lt;br&gt;</description>
</item>

<item>
    <title>Google открыл код парсера файлов robots.txt (пох.)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/117784.html#16</link>
    <pubDate>Tue, 02 Jul 2019 10:29:02 GMT</pubDate>
    <description>ты просто еще зависимости не скачал - там не &quot;целый индус&quot;, там вся его бангалорская родня в количестве 3000000 обезьян трудилась.&lt;br&gt;И еще пяток миллионов китайцев припахала за ними горшки выносить.&lt;br&gt;&lt;br&gt;&lt;br&gt;</description>
</item>

<item>
    <title>Google открыл код парсера файлов robots.txt (пох.)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/117784.html#15</link>
    <pubDate>Tue, 02 Jul 2019 10:27:04 GMT</pubDate>
    <description>ты хочешь сказать, что моя строчка с dissalow: / все же не будет им обрабатываться &quot;правильно&quot;?&lt;br&gt;&lt;br&gt;да ну, не может быть!&lt;br&gt;</description>
</item>

<item>
    <title>Google открыл код парсера файлов robots.txt (пох.)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/117784.html#14</link>
    <pubDate>Tue, 02 Jul 2019 10:25:55 GMT</pubDate>
    <description>о, хренассе, это вот прямо в основном коде. &lt;br&gt;&lt;br&gt;впрочем, пользы от поделки все равно никакой - https://www.opennet.ru/openforum/vsluhforumID3/117784.html#11&lt;br&gt;&lt;br&gt;(ведь сиплюсплюсики такой низкоуровневый язычок, что для банальной задачи обработки текстового файла из десятка предопределенных строк надо притащить за собой мильен каких-то мусорных гуглоисходников и собирать это все нескучной сборочной системочкой)&lt;br&gt;&lt;br&gt;</description>
</item>

<item>
    <title>Google открыл код парсера файлов robots.txt (YetAnotherOnanym)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/117784.html#13</link>
    <pubDate>Tue, 02 Jul 2019 08:45:31 GMT</pubDate>
    <description>Осталась мелочь - догадаться, что сам Гугл вовсе не обязательно использует этот парсер в том виде, в каком он опубликован, но уж всяко хочет, чтобы мы верили, что используемый им парсер именно такой.&lt;br&gt;</description>
</item>

<item>
    <title>Google открыл код парсера файлов robots.txt (Аноним84701)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/117784.html#12</link>
    <pubDate>Tue, 02 Jul 2019 08:38:04 GMT</pubDate>
    <description>&amp;gt;&amp;gt; Опечатки, например, diasllow&lt;br&gt;&amp;gt; эксперты опеннета, как всегда. Нет, думать за вас и исправлять ваши опечатки &lt;br&gt;&amp;gt; этот парсер не обучен.&lt;br&gt;&lt;br&gt;Эк вы &amp;#8230; самокритичны (впрочем, как обычно):&lt;br&gt;https://github.com/google/robotstxt/blob/master/robots.cc#L696&lt;br&gt;&#091;code&#093;&lt;br&gt;bool ParsedRobotsKey::KeyIsDisallow(absl::string_view key) &#123;&lt;br&gt;  return (&lt;br&gt;      absl::StartsWithIgnoreCase(key, &quot;disallow&quot;) &amp;#124;&amp;#124;&lt;br&gt;      (kAllowFrequentTypos &amp;&amp; ((absl::StartsWithIgnoreCase(key, &quot;dissallow&quot;)) &amp;#124;&amp;#124;&lt;br&gt;                               (absl::StartsWithIgnoreCase(key, &quot;dissalow&quot;)) &amp;#124;&amp;#124;&lt;br&gt;                               (absl::StartsWithIgnoreCase(key, &quot;disalow&quot;)) &amp;#124;&amp;#124;&lt;br&gt;                               &#091;b&#093;(absl::StartsWithIgnoreCase(key, &quot;diasllow&quot;))&#091;/b&#093; &amp;#124;&amp;#124;&lt;br&gt;                               (absl::StartsWithIgnoreCase(key, &quot;disallaw&quot;)))));&lt;br&gt;&#091;/code&#093;&lt;br&gt;</description>
</item>

</channel>
</rss>
