<?xml version="1.0" encoding="koi8-r"?>
<rss version="0.91">
<channel>
    <title>OpenForum RSS: помогите с простенькой задачкой</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID9/10141.html</link>
    <description>всем привет,&lt;br&gt;&lt;br&gt;есть 2 файла:&lt;br&gt;1. список мыл&lt;br&gt;gagag&#064;domain1.com&lt;br&gt;jdjdjd&#064;domain2.com&lt;br&gt;...&lt;br&gt;kdkdk&#064;domainX.com&lt;br&gt;&lt;br&gt;2. список доменов:&lt;br&gt;domain1.com&lt;br&gt;domain2.com&lt;br&gt;...&lt;br&gt;domainX.com&lt;br&gt;&lt;br&gt;задача сосотоит в том чтобы выкинуть все мыла из листа 1 домены которых совпали с доменами из листа 2&lt;br&gt;&lt;br&gt;grep -v работает ужасно долго при больших листах - уверен перл справиться намного быстрее.&lt;br&gt;&lt;br&gt;Спасибо!&lt;br&gt;</description>

<item>
    <title>помогите с простенькой задачкой (Andrey Mitrofanov)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID9/10141.html#8</link>
    <pubDate>Mon, 16 Jan 2017 06:40:34 GMT</pubDate>
    <description>&amp;gt;&amp;gt; А тебя ещё чуть выше предупредили про &quot;медленный&quot; греп &lt;br&gt;&amp;gt; да что за предъявы?&lt;br&gt;&amp;gt; сижу никого не трогаю, починяю примус &lt;br&gt;&amp;gt; на перле заказывали? получите, распишитесь )) &lt;br&gt;&lt;br&gt;Да, я так, погулять вышел. Греп тормоз, да. Я пробовал &quot;поанализировать&quot; в сторону, что в перле же тоже регекспы и поэтому-то... Доказательство по аналогии &quot;считаю безобразной ошибкой&quot;&lt;br&gt;&lt;br&gt;--&#091;Расскаиваюсь. Прошу дать возможность загладить, искупить.&#093;Ц&lt;br&gt;&lt;br&gt;&amp;gt; ну можно ещё так отрезать &quot;всё до вон того символа&quot;&#091;code&#093;#!/usr/bin/perl &lt;br&gt;&amp;gt;     $m=~s/^.*&#092;&#064;//; &lt;br&gt;&lt;br&gt;Это ж опять регексп, см.index+substr выше. Впрочем, перл всяко быстрее грепа, а заякорённый регексп должен быть даже быстрее index+substr.&lt;br&gt;&lt;br&gt;&amp;gt; а ТС, если захочет, замерит, что там будет быстрее, чем &#091;code&#093;grep -vFf &lt;br&gt;&amp;gt; domain mail&#091;/code&#093; и насколько быстрее, </description>
</item>

<item>
    <title>помогите с простенькой задачкой (Andrey Mitrofanov)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID9/10141.html#7</link>
    <pubDate>Mon, 16 Jan 2017 06:31:02 GMT</pubDate>
    <description>&amp;gt;&amp;gt;&amp;gt; Ну что же, сам напросился - получай )) &lt;br&gt;&amp;gt;&amp;gt;&amp;gt; #!/usr/bin/perl &lt;br&gt;&amp;gt;&amp;gt;&amp;gt;     /^.*&#092;&#064;(.*)/; &lt;br&gt;&amp;gt;&amp;gt;&amp;gt; насчет жручести памяти в перле будем считать тебя предупредили выше &lt;br&gt;&amp;gt;&amp;gt; А тебя ещё чуть выше предупредили про &quot;медленный&quot; греп... В перле нет &lt;br&gt;&amp;gt;&amp;gt; чего побыстрее для отрезания &quot;всего до вон того символа&quot;? Ну, вложенные &lt;br&gt;&lt;br&gt;user:~$ awk &apos;BEGIN&#123;mail=&quot;som&#064;example.com&quot;;dom=substr(mail,index(mail,&quot;&#064;&quot;)+1);print dom&#125;&apos;&lt;br&gt;example.com&lt;br&gt;user:~$ _&lt;br&gt;&lt;br&gt;&amp;gt;&amp;gt; циклы (найти вложенный - упражнение для читателей младше 2го курса #форумная-ЦС) &lt;br&gt;&amp;gt;&amp;gt; оставим, как &quot;подарок&quot; начинающему падавану.&lt;br&gt;&amp;gt; Правильно! Решение на awk не будем показывать!&lt;br&gt;&lt;br&gt;Конечно. Лениво же.&lt;br&gt;</description>
</item>

<item>
    <title>помогите с простенькой задачкой (михалыч)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID9/10141.html#6</link>
    <pubDate>Sun, 15 Jan 2017 17:56:53 GMT</pubDate>
    <description>&amp;gt; А тебя ещё чуть выше предупредили про &quot;медленный&quot; греп&lt;br&gt;&lt;br&gt;да что за предъявы?&lt;br&gt;сижу никого не трогаю, починяю примус&lt;br&gt;&lt;br&gt;на перле заказывали? получите, распишитесь ))&lt;br&gt;&lt;br&gt;ну можно ещё так отрезать &quot;всё до вон того символа&quot;&#091;code&#093;#!/usr/bin/perl&lt;br&gt;&lt;br&gt;open (DOMAIN, domain);&lt;br&gt;&#064;domain&#123;&amp;lt;DOMAIN&amp;gt;&#125;=();&lt;br&gt;&lt;br&gt;open (MAIL, mail);&lt;br&gt;while (&amp;lt;MAIL&amp;gt;) &#123;&lt;br&gt;    $m=$_;&lt;br&gt;    $m=~s/^.*&#092;&#064;//;&lt;br&gt;    print unless exists $domain&#123;$m&#125;;&lt;br&gt;&#125;&#091;/code&#093;но сути использования ключей хеша это не изменит&lt;br&gt;&lt;br&gt;а ТС, если захочет, замерит, что там будет быстрее, чем &#091;code&#093;grep -vFf domain mail&#091;/code&#093; и насколько быстрее,&lt;br&gt;&lt;br&gt;а если памяти мало - так это не ко мне, это в магазин за углом ))&lt;br&gt;</description>
</item>

<item>
    <title>помогите с простенькой задачкой (universite)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID9/10141.html#5</link>
    <pubDate>Sun, 15 Jan 2017 16:03:44 GMT</pubDate>
    <description>&amp;gt;&amp;gt; Ну что же, сам напросился - получай )) &lt;br&gt;&amp;gt;&amp;gt; #!/usr/bin/perl &lt;br&gt;&amp;gt;&amp;gt;     /^.*&#092;&#064;(.*)/; &lt;br&gt;&amp;gt;&amp;gt; насчет жручести памяти в перле будем считать тебя предупредили выше &lt;br&gt;&amp;gt; А тебя ещё чуть выше предупредили про &quot;медленный&quot; греп... В перле нет &lt;br&gt;&amp;gt; чего побыстрее для отрезания &quot;всего до вон того символа&quot;? Ну, вложенные &lt;br&gt;&amp;gt; циклы (найти вложенный - упражнение для читателей младше 2го курса #форумная-ЦС) &lt;br&gt;&amp;gt; оставим, как &quot;подарок&quot; начинающему падавану.&lt;br&gt;&lt;br&gt;Правильно! Решение на awk не будем показывать!&lt;br&gt;</description>
</item>

<item>
    <title>помогите с простенькой задачкой (Andrey Mitrofanov)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID9/10141.html#4</link>
    <pubDate>Sun, 15 Jan 2017 08:22:05 GMT</pubDate>
    <description>&amp;gt; Ну что же, сам напросился - получай )) &lt;br&gt;&amp;gt; #!/usr/bin/perl &lt;br&gt;&amp;gt;     /^.*&#092;&#064;(.*)/; &lt;br&gt;&amp;gt; насчет жручести памяти в перле будем считать тебя предупредили выше &lt;br&gt;&lt;br&gt;А тебя ещё чуть выше предупредили про &quot;медленный&quot; греп... В перле нет чего побыстрее для отрезания &quot;всего до вон того символа&quot;? Ну, вложенные циклы (найти вложенный - упражнение для читателей младше 2го курса #форумная-ЦС) оставим, как &quot;подарок&quot; начинающему падавану.&lt;br&gt;&lt;br&gt;Вот я помню, реализацию типа-грепа на авке оптимизировал по скорости... Да, именно, почти, мап-ридьюс получился. Но там была возможность на исходную задачу навесить ограничения и срезать -- после какого-то порога не проверять остальные регекспы дальше.&lt;br&gt;&lt;br&gt;--Гордый автор доморощенного неопубликованного спам-фильтра здесь, да, было по молодости.&lt;br&gt;</description>
</item>

<item>
    <title>помогите с простенькой задачкой (михалыч)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID9/10141.html#3</link>
    <pubDate>Sun, 15 Jan 2017 05:45:31 GMT</pubDate>
    <description>Ну что же, сам напросился - получай ))&lt;br&gt;&#091;code&#093;&lt;br&gt;#!/usr/bin/perl&lt;br&gt;&lt;br&gt;open (DOMAIN, /path/to/file/domain);&lt;br&gt;&#064;domain&#123;&amp;lt;DOMAIN&amp;gt;&#125;=();&lt;br&gt;&lt;br&gt;open (MAIL, /path/to/file/mail);&lt;br&gt;while (&amp;lt;MAIL&amp;gt;) &#123;&lt;br&gt;    /^.*&#092;&#064;(.*)/;&lt;br&gt;    print unless exists $domain&#123;&quot;$1&#092;n&quot;&#125;;&lt;br&gt;&#125;&lt;br&gt;&#091;/code&#093;&lt;br&gt;насчет жручести памяти в перле будем считать тебя предупредили выше&lt;br&gt;</description>
</item>

<item>
    <title>помогите с простенькой задачкой (Square1)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID9/10141.html#2</link>
    <pubDate>Sat, 14 Jan 2017 19:35:14 GMT</pubDate>
    <description>&amp;gt;&#091;оверквотинг удален&#093;&lt;br&gt;&amp;gt; 2. список доменов: &lt;br&gt;&amp;gt; domain1.com &lt;br&gt;&amp;gt; domain2.com &lt;br&gt;&amp;gt; ...&lt;br&gt;&amp;gt; domainX.com &lt;br&gt;&amp;gt; задача сосотоит в том чтобы выкинуть все мыла из листа 1 домены &lt;br&gt;&amp;gt; которых совпали с доменами из листа 2 &lt;br&gt;&amp;gt; grep -v работает ужасно долго при больших листах - уверен перл справиться &lt;br&gt;&amp;gt; намного быстрее.&lt;br&gt;&amp;gt; Спасибо!&lt;br&gt;&lt;br&gt;Иногда скорость не имеет решающего значения. Есть задачи, решение которых важно в принципиальном плане а не в частной реализации.&lt;br&gt;&lt;br&gt;Что же до скорости....&lt;br&gt;Самое быстрое решение (если объем файлов действительно велик) - будет загнать оба списка в базу данных а потом сконструировать примитивный select ... like in (select ...)&lt;br&gt;&lt;br&gt;Если объем файлов слишком велик для этого метода- то использовать шардинг.&lt;br&gt;&lt;br&gt;Если объем файлов реально велик - то вероятно надо использовать MapReduce.&lt;br&gt;&lt;br&gt;Что же до перла - то загрузка в перл больших объемов данных приводит к существенному потреблению памяти. Это надо помнить.&lt;br&gt;</description>
</item>

<item>
    <title>помогите с простенькой задачкой (Led)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID9/10141.html#1</link>
    <pubDate>Sat, 14 Jan 2017 18:27:52 GMT</pubDate>
    <description>Это в каком классе сейчас такие примитивные задачки сейчас задают?&lt;br&gt;</description>
</item>

</channel>
</rss>
