<?xml version="1.0" encoding="koi8-r"?>
<rss version="0.91">
<channel>
    <title>OpenForum RSS: Компания Yahoo выпустила свободный дистрибутив платформы Apa...</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/55795.html</link>
    <description>Компания Yahoo объявила (http://finance.yahoo.com/news/Yahoo-Raises-Commitment-to-bw-15490453.html?.v=1) о выпуске собственной версии (http://developer.yahoo.com/hadoop/) дистрибутива платформы Apache Hadoop (http://lucene.apache.org/hadoop/), предназначенной для организации распределенной обработки больших (петабайты) объемов данных с использованием парадигмы map/reduce, когда задача делится на множество более мелких обособленных фрагментов, каждый из которых может быть запущен на отдельном узле кластера. Дистрибутив включает в себя набор подготовленных в недрах Yahoo дополнений и улучшений, используется в компании непосредственно в работе поискового движка и распространяется только в исходных текстах. Код Hadoop и новый дистрибутив Yahoo распространяются под лицензией Apache 2.0.&lt;br&gt;&lt;br&gt;&lt;br&gt;Представленный код отличается высоким качеством и всесторонне протестирован в промышленной эксплуатации, так как непосредственно используется в самых больших из существующих Hadoop кластеров (Hadoop клас...&lt;br&gt;&lt;br&gt;URL: http://finance</description>

<item>
    <title>Компания Yahoo выпустила свободный дистрибутив платформы Apa... (uZver)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/55795.html#15</link>
    <pubDate>Tue, 16 Jun 2009 09:43:58 GMT</pubDate>
    <description>&amp;gt;да вы хоть читали что такое MapReduce, чтобы о транзакционной целостности говорить?! &lt;br&gt;&lt;br&gt;Да, читал и даже тестировал :)&lt;br&gt;&lt;br&gt;&amp;gt;MapReduce - это всего лишь способ обработки данных, при котором обаботка &lt;br&gt;&amp;gt;происходит в два этапа - разбитие данных на пары ключ/значение и &lt;br&gt;&amp;gt;их агрегация.&lt;br&gt;&lt;br&gt;В принципе да, только делать MR поверх одной СУБД - потеря скорости, даже по отношению к хранимкам. Преимущество MR достигается на параллельной работе с ЛОКАЛЬНЫМ (для каждого нода) данными.&lt;br&gt;&lt;br&gt;&amp;gt; Способ хранения никак не оговаривается. &lt;br&gt;&lt;br&gt;Да, но без HDFS или другой распределенной ФС MR будет медленнее PL/SQL.&lt;br&gt;&lt;br&gt;&amp;gt; Просто в Yahoo для &lt;br&gt;&amp;gt;хранения используют файловую систему HDFS и базу HBase, которая поверх этой &lt;br&gt;&amp;gt;фс работает. Все три компонента и составляют дистрибутив Hadoop. Так вот &lt;br&gt;&amp;gt;в HBase есть поддержка транзакций, но не по стандарту SQL, как &lt;br&gt;&amp;gt;мы к этому привыкли. &lt;br&gt;&lt;br&gt;А по какому стандарту идет поддержка транзакций в HBase? Сколько я не читал ни разу не видел записи о том, что HBase имеет поддержку транзакций.&lt;br&gt;&lt;br&gt;Специальн</description>
</item>

<item>
    <title>Компания Yahoo выпустила свободный дистрибутив платформы Apa... (Аноним)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/55795.html#14</link>
    <pubDate>Mon, 15 Jun 2009 07:43:01 GMT</pubDate>
    <description>да вы хоть читали что такое MapReduce, чтобы о транзакционной целостности говорить?! MapReduce - это всего лишь способ обработки данных, при котором обаботка происходит в два этапа - разбитие данных на пары ключ/значение и их агрегация. Способ хранения никак не оговаривается. Просто в Yahoo для хранения используют файловую систему HDFS и базу HBase, которая поверх этой фс работает. Все три компонента и составляют дистрибутив Hadoop. Так вот в HBase есть поддержка транзакций, но не по стандарту SQL, как мы к этому привыкли. А целостность достигается за счет использования HDFS с избытоной репликацией.&lt;br&gt;</description>
</item>

<item>
    <title>Компания Yahoo выпустила свободный дистрибутив платформы Apa... (uZver)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/55795.html#13</link>
    <pubDate>Mon, 15 Jun 2009 07:35:12 GMT</pubDate>
    <description>&amp;gt;&amp;gt; Зависит от задач. Google поисковик не критичен к потере (не учете) одной страницы в индексе&lt;br&gt;&amp;gt; особенно, если это страница майкрософт дот ком при запросе майкрософт уиндовс :)))&lt;br&gt;&lt;br&gt;Google как раз заботится о своих данных.&lt;br&gt;&lt;br&gt;проблема не в &quot;заботе о данных&quot;, а в транзакционной консистентности. Как этого добиться на основе MapReduce?&lt;br&gt;</description>
</item>

<item>
    <title>Компания Yahoo выпустила свободный дистрибутив платформы Apa... (pro100master)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/55795.html#12</link>
    <pubDate>Sun, 14 Jun 2009 06:37:48 GMT</pubDate>
    <description>&amp;gt;Зависит от задач. Google поисковик не критичен к потере (не учете) одной страницы в индексе&lt;br&gt;&lt;br&gt;особенно, если это страница майкрософт дот ком при запросе майкрософт уиндовс :)))&lt;br&gt;Google как раз заботится о своих данных.&lt;br&gt;</description>
</item>

<item>
    <title>Компания Yahoo выпустила свободный дистрибутив платформы Apa... (Щекн Итрч)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/55795.html#11</link>
    <pubDate>Sat, 13 Jun 2009 20:03:44 GMT</pubDate>
    <description>&amp;gt;&amp;gt;&amp;gt;SQoop - утопия. Не получится заменить SQL-БД на распределенные. максимум это применение &lt;br&gt;&amp;gt;&amp;gt;&amp;gt;для некритичных данных - типа обработка веба и постороение поискового индекса. &lt;br&gt;&amp;gt;&amp;gt;&amp;gt;&lt;br&gt;&amp;gt;&amp;gt;&lt;br&gt;&amp;gt;&amp;gt;Получится :) &lt;br&gt;&amp;gt;&lt;br&gt;&amp;gt;В общем тут ты прав :) &lt;br&gt;&lt;br&gt;Ну, а критики мапредуса правы, конечно же, в том, что стоимость его развертывания втрое превышает стоимость всего их бизнеса, обеих почек на продажу и бабушкиной квартиры :)&lt;br&gt;И вместо того, чтобы этот факт признать и подчеркнуть - &quot;утопией&quot; обзываются!&lt;br&gt;Пойду, гляну в словаре, что это за слово такое, &quot;утопия&quot;... Явно что-то нехорошее... :)&lt;br&gt;</description>
</item>

<item>
    <title>Компания Yahoo выпустила свободный дистрибутив платформы Apa... (User294)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/55795.html#10</link>
    <pubDate>Sat, 13 Jun 2009 05:08:36 GMT</pubDate>
    <description>Хорошо подмечено.Стандартная MSовская практика.&lt;br&gt;</description>
</item>

<item>
    <title>Компания Yahoo выпустила свободный дистрибутив платформы Apa... (ra)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/55795.html#9</link>
    <pubDate>Sat, 13 Jun 2009 01:37:34 GMT</pubDate>
    <description>Они купят себе какую-нибудь контору и делов-то. Девелоперов потом почикают, названием сменят - все как обычно.&lt;br&gt;</description>
</item>

<item>
    <title>Компания Yahoo выпустила свободный дистрибутив платформы Apa... (uZver)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/55795.html#8</link>
    <pubDate>Fri, 12 Jun 2009 21:23:06 GMT</pubDate>
    <description>&amp;gt;&amp;gt;SQoop - утопия. Не получится заменить SQL-БД на распределенные. максимум это применение &lt;br&gt;&amp;gt;&amp;gt;для некритичных данных - типа обработка веба и постороение поискового индекса. &lt;br&gt;&amp;gt;&amp;gt;&lt;br&gt;&amp;gt;&lt;br&gt;&amp;gt;Получится :) &lt;br&gt;&lt;br&gt;В общем тут ты прав :)&lt;br&gt;&lt;br&gt;&amp;gt;&quot;типа обработка веба&quot; - &quot;некритичные&quot; данные??? :) &lt;br&gt;&lt;br&gt;Зависит от задач. Google поисковик не критичен к потере (не учете) одной страницы в индексе. А бух. учет и управление складом - критичны. Наверное правильнее сказать, что есть задачи которые можно решить без транзакций. И те которые нет. OLAP - можно сделать на Hadoop, а городить поверх MapReduce OLTP - это сразу диагноз.&lt;br&gt;&lt;br&gt;&amp;gt;А вебморда к петабайтному OLAPу - тоже &quot;некритична&quot; в таком случае? Вместе &lt;br&gt;&amp;gt;с базой? &lt;br&gt;&lt;br&gt;OLAP не критичен к транзакциям. Чаще всего OLAP вообще через ETL делают - какие нафиг транзакции. А вот OLTP смогут нормально работать поверх SQL.&lt;br&gt;&lt;br&gt;&lt;br&gt;Утопия в том, что Hadoop нужен только пока hardware не позволяет реализовать эту обработку на РСУБД. Раньше 1Gb было много для СУБД. А сейчас легко до 10-20Gb одной оперативы</description>
</item>

<item>
    <title>Компания Yahoo выпустила свободный дистрибутив платформы Apa... (Щекн Итрч)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/55795.html#7</link>
    <pubDate>Fri, 12 Jun 2009 19:54:17 GMT</pubDate>
    <description>&amp;gt;SQoop - утопия. Не получится заменить SQL-БД на распределенные. максимум это применение &lt;br&gt;&amp;gt;для некритичных данных - типа обработка веба и постороение поискового индекса. &lt;br&gt;&amp;gt;&lt;br&gt;&lt;br&gt;Получится :)&lt;br&gt;&quot;типа обработка веба&quot; - &quot;некритичные&quot; данные??? :)&lt;br&gt;А вебморда к петабайтному OLAPу - тоже &quot;некритична&quot; в таком случае? Вместе с базой?&lt;br&gt;</description>
</item>

</channel>
</rss>
