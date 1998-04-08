The OpenNET Project / Index page

Анализ исправления ошибок в ядре Linux - в среднем ошибки замечают через 2 года

08.01.2026 09:18

Опубликованы результаты исследования времени обнаружения и устранения ошибок в коде ядра Linux. Данные получены в результате анализа исправления 125 тысяч ошибок, помеченных в Git-репозитории тегом "Fixes:", ссылающимся на коммит, в котором возникла ошибка. Среднее время обнаружения ошибок в ядре составило 2.1 года. Если рассматривать только ошибки, исправленные в 2025 году, данный показатель составил 2.8 года.

30% ошибок были исправлены теми же разработчиками, что и внесли ошибки. 56.9% ошибок устраняют в течение года. 13.5% ошибок оставались незамеченными более 5 лет (если рассматривать только ошибки, исправленные в 2025 году - 19.4%). Из-за неравномерности распределения медианное время существования ошибки в коде ядра составило 8 месяцев для выборки с 2005 года и 1 год для ошибок, исправленных в 2025 году. Наиболее долго сохранявшейся в коде ошибкой стало переполнение буфера в ethtool, устранённое спустя 20.7 лет.

Динамика обнаружения ошибок заметно отличается от среднего значения для некоторых подсистем, например, в драйвере шины CAN и стеке SCTP выявление проблем в среднем занимает около 4 лет, в IPv4-стеке - 3.6 лет, USB и TTY - 3.5, Netfilter и сетевой стек - 2.9, VM - 1.8, GPU - 1.4, BPF - 1.1 год.

Время обнаружения коррелирует с типами ошибок: среднее время обнаружения ошибок, связанных с состояниями гонки, составило 5.1 лет, целочисленным переполнением - 3.9, обращением после освобождения памяти - 3.2, переполнением буфера и утечкой памяти - 3.1, подсчётом ссылок - 2.8, разыменованием нулевого указателя и взаимными блокировками - 2.2 года.

В полученной статистике также прослеживается влияние внедрения новых инструментов для автоматизированного поиска ошибок, статического анализа и тестирования кода, таких как Syzkaller, KASAN, KMSAN и KCSAN. Например, в 2010 году не было зафиксировано исправлений ошибок, найденных в течение года. В то время, как в 2014 году в течение года выявлялось 31% ошибок, 2018 году - 54%, а в 2022 году - 69% ошибок.

Полученная статистика была использована для создания модели машинного обучения VulnBERT, позволяющей предсказывать наличие уязвимостей в коммитах. При тестировании на коммитах за 2024 год точность обнаружения ошибок составила 92.2% при уровне ложных срабатываний 1.2% (для сравнения ранее доступная модель CodeBERT выявляла 89.2% проблем при уровне ложных срабатываний 48.1%).

  1.1, Xo (?), 09:59, 08/01/2026  
    Бывает
     
     
  2.7, Аноним (7), 11:18, 08/01/2026  
    > в среднем ошибки замечают через 2 года

    В среднем за 2 года успевают решить поставленную задачу, и "погрешность" становится необязательной.

     
     
  1.2, Аноним (2), 10:17, 08/01/2026  
    Тысяча глаз!
     
     
  2.22, Аноним (22), 12:08, 08/01/2026  
    6.19 на подходе, возьмите под свой контроль:
    https://www.kernel.org
     

  1.3, Аноним (3), 10:34, 08/01/2026  
    тесты есть?)
     
     
  2.5, Tron is Whistling (?), 10:37, 08/01/2026  
    Есть :D
    "при уровне ложного срабатывания 48.1%"
    То есть результат у этой "системы" - как мамонта на улице встретить. Для "AI" нормально.
     
     
  3.6, Tron is Whistling (?), 10:38, 08/01/2026  
    А, там у новой 1.2% - натаскали на 2023-2024? Попробуйте на 2025-26 :D
     

  1.4, Аноним (4), 10:37, 08/01/2026  
    Т.е. статический анализатор кричит - смотрите USE AFTER FREE или RACE CONDITION, авторы говорят - да ну нафиг, это FALSE NEGATIVE. И начинается... В течении 5 лет решаем, что править - анализатор или ядро. Я правильно понимаю ситуацию? Ибо критика исправляется достаточно быстро. А надо ли быстро исправлять остальное - вопрос еще тот. За то как звучит... Ух - аж дух захватывает.
     

  1.9, Dzen Python (ok), 11:20, 08/01/2026  
    Есть ложь.
    Есть наглая ложь.
    Есть хуцпа.
    Есть статистика.
     
     
  2.12, Аноним (-), 11:30, 08/01/2026  
    Есть овнокодеры вроде "check if directory block is within i_size".
    Есть типикал проблемы недоязыков.

    Но результат от этого не поменяется:
    "среднее время обнаружения ошибок, связанных с ... целочисленным переполнением - 3.9, ... переполнением буфера и утечкой памяти - 3.1" лет.

     
  1.11, Аноним (-), 11:29, 08/01/2026  
    > среднее время обнаружения ошибок, связанных с состояниями гонки,
    > составило 5.1 лет, целочисленным переполнением - 3.9, обращением после
    > освобождения памяти - 3.2, переполнением буфера и утечкой памяти - 3.1,
    > подсчётом ссылок - 2.8, разыменованием нулевого указателя и взаимными
    > блокировками - 2.2 года.

    А среднее время обнаружения напр. логических ошибкок?
    Почему в списке только стандартные проблемы с памятью?
    Других что ли нет?

     
     
  2.17, Аноним (17), 11:44, 08/01/2026  
    Погодите, другие скоро будут. По мере внедрения безопастного.
     

  1.13, Аноним (13), 11:30, 08/01/2026  
    Дык когда ядро докатывается до LTS дистров, тогда и замечают.
     
  1.15, Аноним (15), 11:32, 08/01/2026  
    > в среднем ошибки замечают через 2 года

    Среднее время жизни бекдора в ядре линя - два года.
    Поправил, не благодарите.

    ЗЫ: интересно, эти два года как-то коррелируют с временем нужным на повышение очередного сотрудника АНБ? Нужно дополнительное исследование))

     
  1.16, Fyjy (?), 11:41, 08/01/2026  
    > Наиболее долго сохранявшейся в коде ошибкой стало
    > переполнение буфера в ethtool, устранённое спустя 20.7 лет.

    Это победа!
    Но нужно добавить "из найденных на данный момент" :)
    Может там остались ошибки Торвальдса из версии 0.99

     
  1.19, Аноним (-), 11:49, 08/01/2026  
    Ха, отличная статистика.
    Показывает не только качество написания кода и его тестирования.
    Но и уровень инструментов для автоматизированного поиска ошибок и статического анализа.

    Впрочем ничего нового
    "Regression testing"? What's that? If it compiles, it is good; if it boots up, it is perfect.
    Torvalds, Linus (1998-04-08)

     
  1.20, Мемоним (?), 11:58, 08/01/2026  
    Подозрительно что нет разбивки по серьезности ошибок (Severity кажется называется).
     

