The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Режим отображения отдельной подветви беседы [ Отслеживать ]

Оглавление

В ядре Linux 6.3 всплыла проблема, приводящая к повреждению метаданных ФС XFS, opennews (??), 26-Май-23, (0) [смотреть все]

Сообщения [Сортировка по времени | RSS]


4. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  –2 +/
Сообщение от Аноним (4), 26-Май-23, 23:48 
И в чём её годность заключается?
Ответить | Правка | Наверх | Cообщить модератору

5. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +1 +/
Сообщение от Аноним (3), 27-Май-23, 00:01 
Она довольно надежная и производительная.
Ответить | Правка | Наверх | Cообщить модератору

6. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +5 +/
Сообщение от Аноним (6), 27-Май-23, 00:05 
"Довольно", да.
Ответить | Правка | Наверх | Cообщить модератору

8. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  –8 +/
Сообщение от Аноним (8), 27-Май-23, 00:19 
Деградирует xfs куда больше ext4. У ext4 основная проблема фрагментация свободного пространства которая эээ может быть весьма значительной. Ну и время доступа к большим каталогам какое-то не здоровое (фрагментация опять же), но это вроде у всех. У меня xfs только и делала, что портила файлы всю свою историю, пока пытался использовать, поэтому теперь только оправданные эксперименты. Вроде f2fs, но её тоже бездумно пихать нельзя и слишком уж много ограничений.
Ответить | Правка | Наверх | Cообщить модератору

9. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  –5 +/
Сообщение от Аноним (3), 27-Май-23, 00:22 
Из розетки часто дергал? Умирающий хард-убожка? Перегревающийся полуразбитый ноут?
Ответить | Правка | Наверх | Cообщить модератору

13. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +6 +/
Сообщение от birdie (ok), 27-Май-23, 00:38 
Я давным давно работал в компании, где backup сервер крутился под RHEL 5 с XFS.

В один день, придя на работу, мы не досчитались 200GB backup'ов, которые тупо исчезли.

Я дал доступ по SSH с root одному из разрабов - он больше часа ковырялся и ... ничего не нашёл. Каталог с десятками файлов по несколько гигабайт просто исчез. Следов удалённых файлов не было в метаданных, как будто исчез (или обнулился) целый блок инод. Ах, да, и место освободилось. Ошибок XFS в dmesg не было.

Нет, это не было взломом или insider work - почему я это знаю, потому что modification time и какие-то метаданные (размер? не помню уже) у головной директории был таким, какими они должны были бы быть, если бы подкаталоги не были удалены, если бы они вообще никогда не существовали. Это вручную было сделать невозможно (кроме как dd if=/dev/zero of=/dev/partition_with_xfs) - так сказал разработчик.

После этого мы переехали на ext3, потом ext4 и не имели ни одной проблемы.

Ситуация с тех пор улучшилась, XFS стала default FS для RHEL7, но осадок остался.

Ответить | Правка | Наверх | Cообщить модератору

18. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  –4 +/
Сообщение от Аноним (3), 27-Май-23, 01:02 
Страшилка интересная. Не иначе космическое излучение. Во времена RHEL 5 xfs была вполне стабильной. На уровне ext3 уж точно.
Ответить | Правка | Наверх | Cообщить модератору

48. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +7 +/
Сообщение от Гиря (?), 27-Май-23, 08:18 
>Во времена RHEL 5 xfs была вполне стабильной. На уровне ext3 уж точно.

интересно, стабильна потому-что стабильна, чел сверху хоть рассказал свою историю успеха, а у вас какое-то словоблудие.

Ответить | Правка | Наверх | Cообщить модератору

184. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +1 +/
Сообщение от Аноним (184), 27-Май-23, 21:43 
а какая может быть история, если у него, предположим, не было ни одного факапа? Типа, " - Cлушайте мой случай: За 20 лет использования ничего не потеряли" - так, что ли? Случившаяся "история успеха" - это когда что-то произошло. Это отдаленно напоминает ситуацию с хорошим и плохим админом - окружающие всегда видят как с ж.пой в мыле работает плохой админ (" - Молодец, трудяга, не зря зарплату получает - вон, постоянно что-то ремонтирует то тут то там! Пообедать некогда.") и совсем не знают что такого делает хороший админ (" - Дармоед! Ведь всё и так работает и не ломается. Даже не знаю в каком кабинете он сидит и что там делает, но зарплату, нахлебник, получает!". Т.е. твой собеседник не может тебе ничего рассказать "за работу хорошего админа", если у него всё работало, работает и ни разу не возникали проблемы.
Ответить | Правка | Наверх | Cообщить модератору

91. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  –1 +/
Сообщение от DEF (?), 27-Май-23, 11:19 
Сосайтник, дай конкретные и объективные измеримые критерии стабильности ФС. И пруфани, что XFS - стабильная ФС.
Ответить | Правка | К родителю #18 | Наверх | Cообщить модератору

294. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +/
Сообщение от Аноним (-), 30-Май-23, 01:48 
> Страшилка интересная. Не иначе космическое излучение. Во времена RHEL 5 xfs была
> вполне стабильной. На уровне ext3 уж точно.

Особенно затирание файлов нулями. Это почти мировая константа. Я думал что к 2.6.28 это, наконец, починили. Примерно 10 лет спустя от момента как проблема заявила о себе. Но нет, потом еще дочинивали ЭТО дополнительно. Представляете?! Мушкетеры, i++ лет спустя.

Ответить | Правка | К родителю #18 | Наверх | Cообщить модератору

45. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +1 +/
Сообщение от gleb (?), 27-Май-23, 08:09 
это какой год?
я плотно использую xfs с 2002, причём на довольно больших (от едениц Тб в 2002 по десятки Тб в настоящее время).
В 2002 -- 2008 наблюдалась проблема с обнулением открытых на запись файлов при внезапном пропадании питания).
Других потерь занных не было никогда.
Я бы всё-таки пошукал-бы, не было ли в этой ситуации человеческого фактора. Или отказа/сбоя, если метаданные хранились на другом устройстве.
Ответить | Правка | К родителю #13 | Наверх | Cообщить модератору

56. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +/
Сообщение от Sergey (??), 27-Май-23, 09:22 
Про время и обнуление файлов на ХФС подтверждаю. Но в те времена Шапка еще не допилиа ХФС и не рекомендовала ее юзать.

Что касается того рассказа, я после слов : дал доступ по SSH разрабу, читать перестал.
Они откуда знают как работает ФС и что это такое. Они даже маке толком осилить не могут.

Ответить | Правка | Наверх | Cообщить модератору

97. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +/
Сообщение от Аноним (97), 27-Май-23, 11:40 
Ну он сделал ls, не увидел файлов и сказал что глюкнула файловая система;))(
Ответить | Правка | Наверх | Cообщить модератору

104. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +/
Сообщение от birdie (ok), 27-Май-23, 11:57 
> Ну он сделал ls, не увидел файлов и сказал что глюкнула файловая
> система;))(

Он использовал xfs_db и другие утилиты для отладки.

Ответить | Правка | Наверх | Cообщить модератору

103. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +/
Сообщение от birdie (ok), 27-Май-23, 11:56 
> это какой год?

~ 2004

> В 2002 -- 2008 наблюдалась проблема с обнулением открытых на запись файлов
> при внезапном пропадании питания).

Очень похоже на наш case.

Ответить | Правка | К родителю #45 | Наверх | Cообщить модератору

230. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +1 +/
Сообщение от Аноним (230), 28-Май-23, 16:50 
сервер без ups?
Ответить | Правка | Наверх | Cообщить модератору

251. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +1 +/
Сообщение от Омоним (?), 28-Май-23, 20:38 
А вот у вас система никогда в кору не падала? Например, из-за сбоя железа, или ошибки в драйвере?  меня вот бывало. И знаете, UPS при этом не помогает совершенно никак.
Ответить | Правка | Наверх | Cообщить модератору

49. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +2 +/
Сообщение от kilua (?), 27-Май-23, 08:33 
Души убитых процессов мстят...
Ответить | Правка | К родителю #13 | Наверх | Cообщить модератору

95. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +1 +/
Сообщение от DEF (?), 27-Май-23, 11:35 
XFS не журналирует данные, только метаданные. Эта ФС годна только для файлопомоек, которые не жалко обнулить.
Ответить | Правка | К родителю #13 | Наверх | Cообщить модератору

144. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +3 +/
Сообщение от лютый арчешкольник (?), 27-Май-23, 15:05 
>Эта ФС годна только для файлопомоек, которые не жалко обнулить.

ext3-4 во всех режимах кроме одного тоже ) а с ним превращается в помойку по скорости

Ответить | Правка | Наверх | Cообщить модератору

318. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +1 +/
Сообщение от Аноним (-), 30-Май-23, 19:09 
>>Эта ФС годна только для файлопомоек, которые не жалко обнулить.
> ext3-4 во всех режимах кроме одного тоже ) а с ним превращается
> в помойку по скорости

Тут очень хорошо написано за что некоторые из нас любят BTRFS. Его логика эквивалентна полному журналированию - но без вот этого вот пеналти по скорости работы. Это одно из ключевых достоинств технологий на основе COW. За это воздается странноватыми свойствами, но вот этот вот момент оно обыгрывает безупречно. На самом деле идея простая: если всю площадь ФС сделать подобием журнала, записывать дважды уже не придется.

Ответить | Правка | Наверх | Cообщить модератору

25. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +/
Сообщение от Ананоним (?), 27-Май-23, 01:48 
У меня раздел ext4 1GB уже 9 лет живёт, я начинаю тихо охреневать от фрагментации. Нужна программа дефрагментации. Некоторые директории открываются 30 секунд.
Ответить | Правка | К родителю #8 | Наверх | Cообщить модератору

33. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +1 +/
Сообщение от totem (?), 27-Май-23, 04:45 
Это не фрагментация.

"Ext4 умеет на ходу увеличивать размер структур на диске, в которых хранится список файлов и директорий в ней, но не умеет уменьшать. Поэтому если создать в директории много файлов, а потом удалить, она останется большой. При доступе к такой директории приходится читать эти фрагменты, которые ещё и оказываются разбросаны по диску там и сям. Это медленно."

Создай новую директорию и перенеси файлы туда. При этом блоки данных этих файлов на диске останутся на своих местах.

Ответить | Правка | Наверх | Cообщить модератору

127. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +/
Сообщение от Виктор Федорович Полторищенко (?), 27-Май-23, 14:03 
e2fsck не решает эту проблему посредством опции optimize_extents?
Ответить | Правка | Наверх | Cообщить модератору

34. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +/
Сообщение от totem (?), 27-Май-23, 04:47 
Посмотри ls -ld . в "плохой" директории
И в хорошей.
Ответить | Правка | К родителю #25 | Наверх | Cообщить модератору

132. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +1 +/
Сообщение от ZloySergant (ok), 27-Май-23, 14:16 
>Нужна программа дефрагментации.

anyfs-tools

Ответить | Правка | К родителю #25 | Наверх | Cообщить модератору

168. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +/
Сообщение от Аноним (168), 27-Май-23, 19:20 
mkfs.ext4
Ответить | Правка | Наверх | Cообщить модератору

178. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +/
Сообщение от maximnik0 (?), 27-Май-23, 20:43 
>Нужна программа дефрагментации.

е4defrag - штатная программа. Не знали ? Правда есть недостаток-иноды плохо дефрагментирует,хорошо только экстэнты.Поэтому иногда проще перенести каталог на внешний диск а потом обратно, как делали в старые времена.

Ответить | Правка | К родителю #25 | Наверх | Cообщить модератору

31. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +/
Сообщение от Амаяк Акопян (?), 27-Май-23, 03:36 
Подозреваю, что для больших каталогов подойдёт включение опции dir_index
Ответить | Правка | К родителю #8 | Наверх | Cообщить модератору

43. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +/
Сообщение от gleb (?), 27-Май-23, 08:03 
xfs не деградирует. Проблемы со скоростью доступа начинаются только на очень сильно забитых больших разделах. Если осталось процентов 10 свободного места, тогда да, торимоза станут вполне заметны.
Ответить | Правка | К родителю #8 | Наверх | Cообщить модератору

67. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +/
Сообщение от Аноним (8), 27-Май-23, 10:36 
10% от 100тб это 10тб если что, ещё можно минимум пару файлов впихнуть. Сколько миллиардов файлов считается "очень сильно забитым" и почему ext4 норм, лишь бы не в 1 каталоге? Да и тогда вполне предсказуемо.
Ответить | Правка | Наверх | Cообщить модератору

262. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +/
Сообщение от Аноним (-), 29-Май-23, 01:40 
> xfs не деградирует. Проблемы со скоростью доступа начинаются только на очень сильно
> забитых больших разделах. Если осталось процентов 10 свободного места, тогда да,
> торимоза станут вполне заметны.

Стереть на нем торент без преаллокации... никогда не видали файло на 4.7 гига (стандартный DVD) стираемый 2 минуты? Тот неловкий момент когда удалять файлы чуть ли не дольше чем скачивать :)

Ответить | Правка | К родителю #43 | Наверх | Cообщить модератору

150. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +/
Сообщение от Всем Анонимам Аноним (?), 27-Май-23, 16:30 
xfs на нескольких десятках серверов работает в данный момент, с десяток разделов на каждом с постоянными изменениями. все работает таким образом уже не знаю сколько лет на Ubuntu, больше 8 точно.
Ответить | Правка | К родителю #8 | Наверх | Cообщить модератору

152. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +/
Сообщение от Аноним (8), 27-Май-23, 16:47 
Конечно, веселье начинается, когда паника или power outage прилетает. Но, судя по успехам xfs, достаточно и перезагрузки. Десятки серверов иногда всё же необходимо перезагружать для обновления, хотя бы раз в сезон, то что они у тебя больше 32 сезонов отпахали без обновлений тоже ничего хорошего (железо столько не живёт кстати)
Ответить | Правка | Наверх | Cообщить модератору

153. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +1 +/
Сообщение от Аноним (8), 27-Май-23, 16:49 
Кстати о повреждениях ты узнаешь сильно постфактум, скорее всего, когда исправных бекапов уже не останется. Вот и доверяй потом подобным помойкам.
Ответить | Правка | К родителю #150 | Наверх | Cообщить модератору

24. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  –1 +/
Сообщение от DEF (?), 27-Май-23, 01:46 
ФС, которая молча хавает битые данные, не имея чексумм на данные и метаданные - не может быть надежной.Btrfs, ZFS - надежные ФС. XFS, ext4 - нет.
Ответить | Правка | К родителю #5 | Наверх | Cообщить модератору

28. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +/
Сообщение от Аноним (28), 27-Май-23, 02:28 
https://wiki.archlinux.org/title/XFS#Checksumming
Ответить | Правка | Наверх | Cообщить модератору

35. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +2 +/
Сообщение от DEF (?), 27-Май-23, 05:11 
Чексуммы только на метаданные и только с убогим алгоритмом crc32. На сами данные никаких чексум нет, что у ext4, что у XFS.
Ответить | Правка | Наверх | Cообщить модератору

181. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +/
Сообщение от maximnik0 (?), 27-Май-23, 20:57 
>На сами данные никаких чексум нет, что у ext4, что у XFS.

Есть, только аппаратные,самого жёсткого диска, и уже давно.Сейчас уже выжали с жёстких все что можно,особенно с учётом черепичной записи.Это страшно,но уже используется алгоритмы по зашумленному сигналу предсказывающие вероятно идеальный сигнал.Есть поэтому у некоторых производителей серверные жёсткие с усиленной контрольной суммой,там до 3 байт ошибок на 4 мгб ченить могут на аппаратном уровне.

Ответить | Правка | Наверх | Cообщить модератору

263. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +1 +/
Сообщение от Аноним (-), 29-Май-23, 01:56 
> Есть, только аппаратные,самого жёсткого диска, и уже давно.

Там вообще-то не чексуммы а FEC - но вот там если он не выдюжил, вариантов обычно два. Оно либо отдаст наверх IO error - UNC, либо отдаст сектор "как вышло" после FEC. В зависимости от дури фирмвари железки.

Со стороны ФС и райдов проблема в том что они в результате зачастую не знают какая копия верная. Штуки типа btrfs получают очевидный плюс: на какой копии данных чексум сошелся, та и правильная. Обычный RAID вообще может вытворять что угодно если вместо полной кончины девайсы стали допустим битые данные выгружать. Дальнейшее unspecified - и если чексум данных не было вы можете довольно долго не замечать это, пока в ФС что-то не развалится фатальным образом.

Как показал опыт с btrfs - пойти не так может совершенно все.
- Может глючить RAM и в конечном итоге это тоже проблема.
- Может глючить CPU и это тоже ведет к проблемам.
- Может глючить чипсет или контроллер RAID и их фирмвар (где применимо).
- Может быть глючный провод от диска до контроллера (SATA/SAS/etc).
- Фирмвари девайсов могут вытворять все что угодно и даже больше.

Иногда это превосходит самые дикие допущения ФСов. Скажем потерять большой регион в 16-64 мега при внезапном слете питания? Всего лишь SSD кантовал RMW/GC а тут питание слетело или сглючила фирмварь. Некоторые конфигурации типа Btrfs @ RAID1 даже имеют шансы. А вот просто RAID1 совсем не готов что 2 копии будт, как живые, только - уже вот несимметричные, и догадайтесь какая из 2 верная.

А как об этом всем узнать? А вот запустить файлуху с чексуммами в эксплуатацию. И сразу столько открытий чудных, на тему глючного железа, которое как живое, но раз в час/день/месяц/год пару битиков загаживает.

> Сейчас уже выжали с жёстких все что можно,особенно с учётом черепичной записи.

Zoned в btrfs приветы передавал. Правда это для host-managed актуально.

> производителей серверные жёсткие с усиленной контрольной суммой,там до 3 байт ошибок
> на 4 мгб ченить могут на аппаратном уровне.

У почти всех заметно более мощный FEC. Типа эн байтов на каждые 4096 сектор. Собственно с 512 на 4096 перешли чтобы улучшить соотношение data/FEC. Но наружу это если и лезет то только как UNC или как мусор вместо данных если фирмварь решила вместо UNC отдать "уж что вышло". Это однако совсем не аналог чексум ФС, потому что end-to-end проверки корректности работы железа не получается и вооон то можно прошляпить.

А с btrfs вон там глючный чипсет заметили, тут глючный шнурок, там глючная RAM, а там и вообще проц кривой был, а там девайс не сообщал UNC но отдавал труху. Коллекция глюкастиков основательно пополнилась. Хорошо когда чексуммы данных есть.

Ответить | Правка | Наверх | Cообщить модератору

272. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +/
Сообщение от maximnik0 (?), 29-Май-23, 07:47 
>Со стороны ФС и райдов проблема в том что они в результате зачастую не знают какая копия верная.

Это как ? Я не беру в качестве примера ниже 5 рэйд.Там же Рида-Соломона коды корректировки,если код не совпадает значит диск дегрейд...Так уже есть рэйды где 3 диска может развалиться и данные не потеряться.

Ответить | Правка | Наверх | Cообщить модератору

292. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +1 +/
Сообщение от Аноним (-), 30-Май-23, 01:42 
>> не знают какая копия верная.
> Это как ? Я не беру в качестве примера ниже 5 рэйд.

Ну вот так. RAID1: читаем обе копии по одному смещению. Опа, они разные! И чего теперь? Мы знаем что в этом месте проблема, но понятия не имеем какая из копий правильная. В случае чексум данных все упрощается: если есть копия с неверной и копия с верной чексумой, ок, вычислили гонщика. Так можно определить проблемный накопитель/контроллер/канал/провод...

> Там же Рида-Соломона коды корректировки,

В именно RAID 5 так то всего лишь XOR. Если взять 3 девайса, и 2 блока, b1 и b2, это пишется как b1, b2, b1^b2 (XOR b1 с b2). XOR интересен тем что при вылете b1 или b2 он восстанавливается всего лишь XOR второго блока с parity. Это просто, быстро, оверхед 1/3 при 3 девайсах, меньше если девайсов больше, но - переживает только отказ 1 девайса. Если нужно больше, это уже RAID6 и вот там дополнительный parity уже будет рид соломоном. Это позволяет починить вылет и 2 устройств за раз.

> если код не совпадает значит диск дегрейд...

Для RAID5 это не сработает: мы видим что b1 ^ b2 != parity но понятия не имеем который из них неверен. Для RAID6 это уже можно попробовать. Но это ценой 2 полноразмерных блоков четности. Т.е. минимум 4 стоража, при этом оверхед 50%. Как RAID1 только тормознее и хуже. В случае например btrfs на RAID1 (и даже DUP на 1 стораже) видит какая из копий неверная и фиксит из правильной. Для большего числа дисков RAID6 может уже иметь смысл а RAID5 становится опаснее т.к. за время ребилда не должен скончаться ни 1 стораж.

У btrfs там кстати плюс есть: знает что аллоцировано а что нет. И на полупустом пуле оно ребилдить будет сильно меньше - только реально занятые блоки, сколько уж их там на проблемном девайсе было. В зависимости от - так ребилд может быть сильно резвее.

Это же касается изъятия/замены девайсов, scrub, смены схемы хранения, уменьшения ФС и т.п.. Это и есть смысл терпеть те неудобства. Безгеморное управление, можно решения переиграть, они не высечены в камне. Не нравится тот уровень RAID - конвертим в другой, лишь бы места в новом фоормате хватало для фактически записанных данных. Можно даже "мягкую" конверсию: старые блоки останутся как есть, а новые с новой схемой. Вполне валидно для той механики. А на обычном RAID такие вещи лучше даже не пытаться... как угодно но это next gen технологий хранения.

> Так уже есть рэйды где 3 диска может развалиться и данные не потеряться.

Ну да. Triple parity raid. Правда, взамен придется хранить ТРИ набора блоков parity и это не менее чем 5 девайсов, иначе бессмысленно. В принципе соотношение DATA/FEC ничем таким не ограничено, даже в RAID1 если сделать 10 копий блока то до 9 можно потерять. Проблема только в том что эффективность схемы == 1/10. Нужно ли оно такое? Врядли. Потому что не спасает от сбоев проца, рам и проч например, все 10 могут оказаться испорченными и оверхед того не стоил.

Ответить | Правка | Наверх | Cообщить модератору

305. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +/
Сообщение от maximnik0 (?), 30-Май-23, 06:36 
Вы рассматриваете устаревшие схемы раид.Сейчас эффективность и надёжность подняли, в качестве примера
читайте на хабре статью "Как разработчики сидели в Петербурге и тихо ели грибы, а потом написали ОС для систем хранения данных". Там для коррекции сбоя в отдельной области применили страйпы,т.е очень быстрая локализация ошибок. Вообще очень передовая разработка была- работает система при развале 3!!! дисков из 7 в массиве. Очень показательно что разработку этой компании в наглячку стали обходить-всплыли заявки на патенты за полгода (как в Японии в 80 х), появились в других странах аналогичные !! патенты и т.д.
Ответить | Правка | Наверх | Cообщить модератору

319. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +/
Сообщение от Аноним (-), 30-Май-23, 19:48 
> Вы рассматриваете устаревшие схемы раид.

Устаревший - относительное понятие. Если скажем всего 2 диска есть в энной системе, то чего кроме RAID 1 там будет такой уж смысл иметь? И чем это будет лучше? Особенно если с чексумами, так что мы видим на какой из 2 копий был сбой и можно осмысленно фиксить сбои. Чексуммы не так много места занимают зато улучшают свойства схемы хранения. А в случае btrfs можно еще и при душняке с местом просто добавить, просто +1 девайс. Любой. Какой был. И будет 3-девайсовый RAID1.

> Сейчас эффективность и надёжность подняли,

Кто, где, КАК ЭТО ПОЮЗАТЬ НА МОИХ СИСТЕМАХ? Сферические сказки про супербатарейки "где-то там" уже несколько надоели, извините. Я вот хочу нормальные технологии у себя на компах, ноуте, одноплатниках и проч. А не "где-то там".

> в качестве примера читайте на хабре статью "Как разработчики сидели в Петербурге и тихо ели
> грибы, а потом написали ОС для систем хранения данных".

Проблема в том что поедатели грибоа - где-то там. И операционкой у меня Linux везде. А RAID может быть не центром вселенной а 1 из фич, повышающей надеженость, до кучи. Just because I can. В этом случае меня парит чтобы менеджмент был ненапряжный, дурацких требований и допушений - минимум, а чексуммы, вот, еще и диагностируемость повышают, хайлайтя при случае проблемный хардвар. В ряде случаев это early warning вообще, когда я конечно играю в рулетку, но в режиме когда теорвер уже за меня а не против меня. В мире хлипкого железа где народ хочет емко, быстро и за копейки - это сильный аргумент. Потому что расплатой за это является текучесть, сыпучесть, глюкавость, минимальные margins, ... и по другому это можно и не заметить. А потом пожалеть когда данные - в хлам.

> Там для коррекции сбоя в отдельной области применили страйпы,т.е очень быстрая
> локализация ошибок.

Ох да, мне в btrfs примерно то же самое тоже очень нравится. Разок как-то на ноуте бэд вылез, да еще под метаданными. Очень приятно при этом "csum error, corrected" получить а не разлет системы в хлам. Только вот этот хайтек - у меня на ноуте. В повседневной работе. А не у каких-то мужиков из питера с кастомной операционкой где-то там. И вот что б вы мне имели предложить лучше? Ваш EXT4 который от такого под метаданными рассыпался бы вдрызг и я бы ос переставлял? Ну спасибо, только это - не хайтек и не апгрейд. Ну да, там 1 диск и DUP как схема. И - вот - конкретный пример почему оно так. Без всяких хабр.

> Вообще очень передовая разработка была- работает система при развале 3!!! дисков
> из 7 в массиве.

И чего? Почитайте теорию - и поймете что в принципе FEC может исправлять любой процент ошибок. Вопрос в объеме оверхеда на хранение FEC и вычислений. Ну и осмысленности полученной схемы для тех или иных задач. А что если у меня дисков всего 2-3? Там очевидно тот номер не пройдет. Более того - а у этих мужиков можно как в btrfs, просто подоткнуть 8-й диск, если 7 стало мало? И чтоб без жесткого рестрайпа всей штуки вотпрямща?

> Очень показательно что разработку этой компании в наглячку стали обходить-всплыли
> заявки на патенты за полгода (как в Японии в 80 х),

Японские патенты 80х должны бы уже истечь. На патенты обычно 25 лет срок.

> появились в других странах аналогичные !! патенты и т.д.

Большая часть патентов на технологии FEC либо истекла либо будет вышиблена prior art при ближайшем рассмотрении. И вы все это рассказываете тому кто умеет строить схемы избыточности под любые нужды. Но мы же про линуха и то что в майнлайне.

В свое время там летали забавные патчи - весьма забавный, если не ошибаюсь, ридсоломон с конфигуряемым объемом избыточности и соответственно соотношением емкости. Но столько счастья видимо народу не требовалось и тема заглохла. А вон те разговоры в пользу бедных... мне они зачем? И как это все поможет актуальные мне конфиги улучшить по свойствам? Никак? Ну тогда "let it float by itself, f...g piece of iron".

Ответить | Правка | Наверх | Cообщить модератору

331. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +/
Сообщение от maximnik0 (?), 31-Май-23, 09:22 
>Японские патенты 80х должны бы уже истечь. На патенты обычно 25 лет срок.

Это я про  книгу одного из бывших  министров промышленности,он покаялся в 15 году.Он писал как химичили и тырили технологии где возможно.И было дано указание патентному бюро  тоже мошенничать- на интересную патентную заявку специально задними числами оформляли приоритет заявку на японскую фирму.
Потом  Американцам это дело надоело- и поймали специально неправильно описанными  патентами на воровстве,ВТО не хило Японию оштрафовало.....и куча японских фирм.

Ответить | Правка | К родителю #319 | Наверх | Cообщить модератору

341. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +/
Сообщение от Аноним (-), 31-Май-23, 20:34 
> Это я про  книгу одного из бывших  министров промышленности,он покаялся в 15 году.

Это слишиом экзотичный референс чтобы на него универсально ссылаться без пояснений.

> Он писал как химичили и тырили технологии где возможно.

Да вообще так все делают. Вопрос в легальном статусе. Скажем, переизобретать лампочку накаливания каждому в своей норке независимо было бы довольно неэффективно по ресурсам. С другой стороны и совсем уж фига изобретателю как-то неправильно. В этом смысле патенты несколько адекватнее копирайта, там еще и платить за продление надо - на память о чем есть такая чудная штука как Google Patents. Кроме всего прочего это кладезь годных идей, на половину из которых их авторы все же забили, не осилив коммерциализировать. Но это ж не значит что про них надо просто забыть? Expiry патента по причине "не оплачено" прозрачно намекает :)

> И было дано указание патентному бюро  тоже мошенничать- на интересную патентную
> заявку специально задними числами оформляли приоритет заявку на японскую фирму.

А интерес в этом какой? Да и патенты обычно сразу в эн юрисдикциях хреначат на что-то реально стоящее. Первым делом в штатах, у них рынок большой и денег много.

> Потом  Американцам это дело надоело- и поймали специально неправильно описанными  
> патентами на воровстве,ВТО не хило Японию оштрафовало.....и куча японских фирм.

Заднее число имеет свойство вылезать - когда кто-то все же приперся в суд и/или нашел prior art. И если в россии объективный арбитраж штука спорная, то в большей части более-менее цивилизованных стран это чревато как минимум сливом судебного процесса с треском и неслабыми выплатами. Правда, даже в штатовских патентах - их оформляют совсем не гении и типовой клерк может сдуру выписать патент на что-то весьма общее и неконкретное. Правда, в суде это все же быстренько сливается.

Ответить | Правка | К родителю #331 | Наверх | Cообщить модератору

324. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +/
Сообщение от Аноним (324), 31-Май-23, 01:43 
Чувствуется опыт у человека
Ответить | Правка | К родителю #263 | Наверх | Cообщить модератору

335. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +/
Сообщение от maximnik0 (?), 31-Май-23, 11:26 
> Чексуммы только на метаданные и только с убогим алгоритмом crc32. На сами
> данные никаких чексум нет, что у ext4, что у XFS.

А там и НЕ НУЖНО более извращенные алгоритмы.90% Метаданных  в  XFS занимают стандартный блок 64 кб и изобретать велосипед не надо,хватает перекрестной проверки  с веретификацией Log SequenceNumber.


Ответить | Правка | К родителю #35 | Наверх | Cообщить модератору

348. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +/
Сообщение от Аноним (-), 01-Июн-23, 02:20 
Чексуммы _данных_ верифицируют работу оборудования end to end. И ловят множество факапов которое вон то "should never happen" просто не заметит. А потом всякие кадры рассказывают страшилки про плохие файлухи рассыпающиеся "сами по себе". На поверку сейчас большая часть таких репортов оказывается связана с глюками железа выходящими далеко за допущения типовых файлух. Единственное известное исключение это рейзер где убиение тома fsck - "known issue" :)
Ответить | Правка | Наверх | Cообщить модератору

362. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +/
Сообщение от maximnik0 (?), 01-Июн-23, 09:09 
>Единственное известное исключение это рейзер где убиение тома fsck - "known issue" :)

Эх,байки времен V3.5 .В 3.6 это починили -единственное исключение chroot для виртуальных томов (виртуальные машины) ,там да,обнаружив по сигнатурам знакомые файлы fsck сносило голову. Мелкие ошибки fsck нормально ремонтировало,сколько reset я пережил не счесть.Но забросили эту фс :-( ,т.к ext4 более предсказуема вела,а вариант с очень мелкими файлами в гиганских кол-вах редко распрастранен.

Ответить | Правка | Наверх | Cообщить модератору

373. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +/
Сообщение от Аноним (373), 01-Июн-23, 19:22 
> Эх,байки времен V3.5 .В 3.6 это починили -единственное исключение chroot для виртуальных
> томов (виртуальные машины)

Нормальное исключение, в переводе с кодерского на человеческий "мы не паримся валидацией найденого и втрамбовываем первое похожее на фс в вашу файлуху, так кодить проще!". Проверить что-то типа UUID - не судьба?

В современном мире это опасный факап. У лично меня образов других систем с тем же типом рутфс у есть. И если дев говорит что мой кейс ведет к разлету, чинить не бум, known issue, оок! Зачем мне такие технологии?

К тому же ядерные апи не мировая константа. С тех пор появились io_uring, folios (группы страниц, чтобы не колупать по 1 странице) и все такое. По причине появления сверхскоростного IO (что сеть, что сторажи) и нужды урезать оверхед по линии ядра соответственно. Более менее живые на это дело отрефакторились. Полутрупики на то и полутрупики и вечно держать для них легаси апи никто не будет. Выкинут вместе с дохляком.

> там да,обнаружив по сигнатурам знакомые файлы fsck сносило
> голову. Мелкие ошибки fsck нормально ремонтировало,сколько reset я пережил не счесть.

А у меня оно с высокой вероятностью вынесло бы ФС, по причине наличия файлов с rootfs, я системные образа собираю и виртуалки использую. И это как бы проблема класса showstopper.

> Но забросили эту фс :-( ,т.к ext4 более предсказуема вела,

Скорее, потому что технологически оно уже ничем таким не передовое, имеет ряд трудноустранимых проблем (да, в EXT4 fsck не склонен чужие файлухи вкатывать в починяемую), а разработчики самоустранились и пошли атаковать какие-то ветряные мельницы. С Reiser4/5. Не, сама идея редизайна ок, но если девы потом на майнтенанс положат не доведя до ума и не фикся баги, то такие файлухи мало кому надо, независимо от супер-технологий, извините. Роялит сочетание в целом и как оно с реальным миром и его задачами стыкуются, а не супертехнологии в 1 конкретном закутке.

> а вариант с очень мелкими файлами в гиганских кол-вах редко распрастранен.

Собсстно рейзер3 шустро работает с кучей мелочи вроде. Но по другим эксплуатационным параметрам не ахти. В частности known issue не от мира сего и разработчики которые где-то там, за денежку датарекавери предлагают, при этом понятное дело стимула чинить вон те факапы нет. Модель в стиле утят скруджа и бесплатных соленых крекеров, а если сушняк - рядом лимонад за бакс :)

Ответить | Правка | Наверх | Cообщить модератору

78. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +1 +/
Сообщение от Rootlexx (?), 27-Май-23, 11:04 
Эта проблема решаема на другом уровне через dm-integrity.
Ответить | Правка | К родителю #24 | Наверх | Cообщить модератору

107. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +/
Сообщение от DEF (?), 27-Май-23, 12:07 
Это должно решаться на уровне ФС, которая для этого и предназначена - гарантировать целостность данных.
Ответить | Правка | Наверх | Cообщить модератору

349. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +/
Сообщение от Аноним (-), 01-Июн-23, 02:24 
> Эта проблема решаема на другом уровне через dm-integrity.

Проблема в том что получается сложное, стремное месиво, которое при нужде переконфигурить - убиться можно. И когда вместо этого "btrfs device add -> +100500 места в пуле" вот извините но я хочу видеть управление сторажами вот так - а не тот кошмарик.

Со всеми этими dm, LVM и прочими получилось как в IPSec. Ну а btrfs сойдет за вайргад такой себе тогда. Хотя bcachefs на эту роль был бы еще убедительнее :)

Ответить | Правка | К родителю #78 | Наверх | Cообщить модератору

189. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +/
Сообщение от Kuromi (ok), 27-Май-23, 22:40 
Вы так говорите как будто бы ZFS и BTRFS были всегда, а вот дураки разработчки ext* не догадались добавить чексуммы.
На самом деле что ext, что xfs или jfs (помните?) - очень старые файловые системы. И ext и xfs получили кучу модернизаций за прошедшие годы (нынешний xfs вообще мало похож на оригинальный), но их основа - довольно древняя, невозможно там навернуть таких новшеств как в "созданной с нуля" btrfs.
И ничего люди жили с незапамятных времен с ext и xfs.
Ответить | Правка | К родителю #24 | Наверх | Cообщить модератору

252. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +/
Сообщение от Аноним (252), 28-Май-23, 21:28 
>  Она довольно надежная и производительная.

Бугага. Переполнения LVM раздера переводит ее в RO и нарушению митаданных, спасает только reboot.

Ответить | Правка | К родителю #5 | Наверх | Cообщить модератору

258. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +/
Сообщение от Аноним (-), 29-Май-23, 00:08 
> Она довольно надежная и производительная.

Ее легендарную надежность с протиранием "ненужных" файлов нолями для безопасности трудно забыть. И так цать лет к ряду. И все остальное не сильно лучше. Еще и тормозная что капец при работе с метаданными.

А вон то - это то что редхат получает разогнав всех спецов блочного уровня и заменив их на каких-то индусов. Если обратить внимание, все известные кадры вокруг ФС и блочного уровня из редхата ушли так или иначе. Последним был Bacik, после него там вообще ни 1 известного кадра не оталось, какие-то нонеймы известные хзчем.

Ответить | Правка | К родителю #5 | Наверх | Cообщить модератору

14. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +1 +/
Сообщение от Виталийemail (??), 27-Май-23, 00:40 
Скажу от себя: её основная годность - более эффективная поддержка гигантских дисков объёмом больше 4х терабайт. Ext4 да, невероятно надёжная и хорошо зарекомендовавшая себя файловая система, НО, на дисках объёмом больше 4х терабайт могут всплывать различные ограничения и замедление производительности (сильно дольше будет отзываться). Что про файловую систему XFS, то она специально создана под гигантские диски, чтобы откликалась быстро не зависимо от того, как много файлов на ней навалено, и т.п. У меня на сервере диск 6 терабайт, работает на XFS. Если коротко - XFS первым делом нужна для гигантских файлопомоек. Для всего остального Ext4 за уши хватит.
Ответить | Правка | К родителю #4 | Наверх | Cообщить модератору

44. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  –1 +/
Сообщение от gleb (?), 27-Май-23, 08:04 
все ext* начисто сливают при конкурентной работе.
Ответить | Правка | Наверх | Cообщить модератору

130. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  –2 +/
Сообщение от Аноним (8), 27-Май-23, 14:08 
Всех сливают? Ну да. На самом деле, по производительности и фичам ext4 уступает только ntfs, но ты и так прекрасно это знаешь. Зато вот по надёжности и фрагментируемости она куда лучше.
Ответить | Правка | Наверх | Cообщить модератору

62. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +3 +/
Сообщение от пох. (?), 27-Май-23, 10:01 
> Что про файловую систему XFS, то она специально создана под гигантские диски

вот сейчас SGI неистово завертелась в гробу.

Нет, конечно же, те 600мегабайтники были "гигантские", чугуниевая хреновина в full size 5" слот выглядит довольно угрожающе, при ее включении корпуса из листовой стали (на ней тогда тоже не экономили) ощутимо подпрыгивали, но вот если про объемчик занимаемых данных, а не места в корпусе, то тот у них был немного маловат по нонешним меркам.

Ответить | Правка | К родителю #14 | Наверх | Cообщить модератору

259. "В ядре Linux 6.3 всплыла проблема, приводящая к повреждению ..."  +/
Сообщение от Аноним (-), 29-Май-23, 00:13 
> вот сейчас SGI неистово завертелась в гробу.

Торент качни, хотя-бы гигов на 200, лучше на забитый диск и без преаллокации, чтоб фрагментировался уж точно хорошенько. А теперь попробуй его стереть... не забудь засечь сколько времени это займет.

У остальных ФС данное действо заканчивается за какие-то сильно более разумные врмена. Или на большие ФС большие файлы и тем более их фрагментация - не предполагаются? :)

Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру