URL: https://www.opennet.ru/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 109767
[ Назад ]

Исходное сообщение
"Уязвимость в Apache Hadoop"
Отправлено opennews , 29-Ноя-16 17:11

В Apache Hadoop (http://hadoop.apache.org/), свободной платформе для организации распределённой обработки больших объёмов данных, выявлена (http://seclists.org/oss-sec/2016/q4/537) критическая уязвимость (CVE-2016-5393), позволяющая злоумышленнику, аутентифицированному в HDFS NameNode, выполнить произвольный код c правами сервиса HDFS. Проблема устранена в выпусках Apache Hadoop 2.7.3 и 2.6.5, которые были опубликованы в августе и октябре (во время релизов, явно не было упомянуто об исправлении уязвимости). Уязвимость вызвана (https://issues.apache.org/jira/browse/HADOOP-13434) отсутствием экранирования (https://github.com/apache/hadoop/pull/119/commits/76aa663947...) спецсимволов при запуске команд через shell.
URL: http://seclists.org/oss-sec/2016/q4/537
Новость: http://www.opennet.ru/opennews/art.shtml?num=45580

Содержание

Уязвимость в Apache Hadoop,А, 17:11 , 29-Ноя-16
- Уязвимость в Apache Hadoop,Аноним, 18:13 , 29-Ноя-16
Уязвимость в Apache Hadoop,Фокс Йовович, 23:45 , 29-Ноя-16
- Уязвимость в Apache Hadoop,ACCA, 00:15 , 30-Ноя-16
  - Уязвимость в Apache Hadoop,Фокс Йовович, 17:41 , 30-Ноя-16
- Уязвимость в Apache Hadoop,Аноним, 10:36 , 30-Ноя-16
- Уязвимость в Apache Hadoop,Аноним, 13:29 , 30-Ноя-16
  - Уязвимость в Apache Hadoop,Фокс Йовович, 18:09 , 30-Ноя-16
    - Уязвимость в Apache Hadoop,Аноним, 20:05 , 30-Ноя-16
- Уязвимость в Apache Hadoop,alex53, 21:20 , 01-Дек-16
- Уязвимость в Apache Hadoop,SunXE, 00:39 , 12-Дек-16

Сообщения в этом обсуждении

"Уязвимость в Apache Hadoop"
Отправлено А , 29-Ноя-16 17:11

Интересно, какие права у Hadoop в типичной системе, где он используется?

"Уязвимость в Apache Hadoop"
Отправлено Аноним , 29-Ноя-16 18:13

Юзерские. Каких-то расширенных прав для нормальной работы он не требует.

"Уязвимость в Apache Hadoop"
Отправлено Фокс Йовович , 29-Ноя-16 23:45

Что Hadoop, что Spark - кривое тормозное жручее глючное ненужно. Юзали у себя в конторе, чтобы обрабатывать много данных в реальном времени. На ~1000 евентов в секунду понадобилось аж четыре железных машины под спарк-слейвы. А те вещи, которые на обычном питоне делаются в одну строчку, в спарке иногда занимают экран кода и полдня дебага. В итоге выкинули нахрен спарк и переписали всё на обычном питоне с joblib. ВНЕЗАПНО теперь вся обработка данных спокойно умещается на одну машину. Нет спарка - нет проблемы. С апачьего кладбища у нас сейчас в ходу только Kafka (плюс Zookeeper). Как только найдём, чем эту кафку заменить, выкинем и её.

"Уязвимость в Apache Hadoop"
Отправлено ACCA , 30-Ноя-16 00:15

> ходу только Kafka (плюс Zookeeper). Как только найдём, чем эту кафку
> заменить, выкинем и её.
Расскажи поподробнее - Kafka выкинуть или-таки Zookeper? Если отскочить на кого-то вроде etcd, то может оба будут не нужны?

"Уязвимость в Apache Hadoop"
Отправлено Фокс Йовович , 30-Ноя-16 17:41

Zookeeper нужен кафке, нам он нафиг не упёрся.

"Уязвимость в Apache Hadoop"
Отправлено Аноним , 30-Ноя-16 10:36

Индивидуально написанный код под обработку конкретной задачи грамотными программистами(не суперзвёздами) понимающими суть и бизнес-смыл решаемой задачи не ограниченными жёсткими временными рамками очень часто работает быстрее универсального решения, особенно для "нестандартных" задач.
А если по ваше решение разработать спецпроцессор, то можно ещё и энергозатраты снизить :)

"Уязвимость в Apache Hadoop"
Отправлено Аноним , 30-Ноя-16 13:29

Интересно... Продолжай.
Кашку можно заменить на RabbitMQ/ZMQ. Кластер кроликов я собирал, а вот про змк - не уверен, хоть это побыстрее будет. Можно конечно какафку и на Flume заменить, но MQ, как по мне - ближе всего по назначению.

"Уязвимость в Apache Hadoop"
Отправлено Фокс Йовович , 30-Ноя-16 18:09

Та хрен редьки не слаще, что жабка, что эрланг. ZMQ вообще не вариант, потому что нужна персистентность и durability. Алсо, сама архитектура кафки на удивление нравится. В отличие от всяких MQ, кафка практически ничего не делает! Она просто тупо получает бинарный блоб, дописывает в конец файла и хранит некоторое время. Можешь попросить у кафки все сообщения, начиная с определённого номера. Старые сообщения кафка через заданное время удаляет. Остальное её не касается. Как ты будешь читать сообщения, успеешь или нет их обработать - ей пофиг. Ну ладно, вру: есть ещё тупое API - потребитель может поставить отметку, до какого места он уже обработал сообщения. Но кафке всё равно пофиг - она их всё равно удалит через заданное время, отметка чисто дле тебя. Ну ещё кафка умеет всё это делать распределённо, когда одна очередь размазана по нескольким машинам, с избыточностью и параллелизмом. Больше она не делает НИЧЕГО. И это круто, прямо юникс-вей. После сраного AMQP - как небо и земля. Офигение вызывает лишь одно. На то, чтобы ничего не делать, у неё спокойно уходит два гига памяти. Жабка ж. Как только кто-нибудь перепишет на нормальном языке, так я первый в очередь.

"Уязвимость в Apache Hadoop"
Отправлено Аноним , 30-Ноя-16 20:05

Ну да, линкедин рекомендует не мелочиться и таки выдать эти 64ГБ ОЗУ %). Я сам долго офигевал, но давал не более 8ГБ.

"Уязвимость в Apache Hadoop"
Отправлено alex53 , 01-Дек-16 21:20

hadoop как бы предназначен для потоковой обработки ОЧЕНЬ большого объема данных. Если для обработки ваших данных потребовалось всего четыре сервера (у hdfs по умолчанию replication factor равен трем вообще-то, для надежности), значит вы использовали микроскоп для забивания гвоздей (или комбайн для уборки дачного огорода, если угодно).

"Уязвимость в Apache Hadoop"
Отправлено SunXE , 12-Дек-16 00:39

Смысл hadoop в том, чтобы размазанные по большему количеству серверов данные обрабатывать ярном или спарком на тех жа серверах на которых они находятся, а не выкачивать их перед обработкой. Это актуально когда данных сотни террабайт.