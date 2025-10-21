The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Разработчик из Valve оптимизировал драйвер RADV для работы с Llama.cpp

21.10.2025 09:14

В кодовую базу, на основе которой формируется выпуск Mesa 25.3, приняты изменения, существенно увеличивающих скорость работы движка выполнения больших языковых моделей Llama.cpp при использовании Vulkan-бэкенда на системах с GPU AMD и Mesa-драйвером RADV. Оптимизированный драйвер RADV в некоторых тестах llama-bench стал быстрее драйвера AMDVLK и стека ROCm на 31% при обработке запросов (тесты "pp" - prompt processing) и на 4% при генерации токенов (тесты "tg" - token generation). Оптимизацию выполнил Рис Перри (Rhys Perry) из компании Valve, участвующий в разработке драйвера Vulkan RADV и компилятора шейдеров ACO.

  1. Главная ссылка к новости (https://www.phoronix.com/news/...)
  2. OpenNews: Выпуск ZLUDA 5, универсальной открытой реализации технологии CUDA
  3. OpenNews: В Fedora 41 планируют добавить AI-инструменты и расширить поддержку GPU NVIDIA
Автор новости: Аноним
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/64086-vulkan
Ключевые слова: vulkan, mesa, llama
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (35) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.2, Аноним (2), 09:36, 21/10/2025 [ответить] [﹢﹢﹢] [ · · · ]  
    		• –1 +/
    В синтетике это никого не удивляет, а на практике?
     
     
  • 2.4, анон (?), 09:53, 21/10/2025 [^] [^^] [^^^] [ответить]  
    		• +1 +/
    >а на практике?

    скоро увидим

     
     
  • 3.19, Аноним (19), 11:05, 21/10/2025 [^] [^^] [^^^] [ответить]  
    		• –1 +/
    Уже видим падающие облака и сервера. ИИ помогает?!
     
     
  • 4.36, ryoken (ok), 13:47, 21/10/2025 [^] [^^] [^^^] [ответить]  
    		• +/
    >>падающие облака

    поэтичненько :).

     
  • 2.6, Аноним (6), 09:58, 21/10/2025 [^] [^^] [^^^] [ответить]  
    		• +5 +/
    Эксперты как обычно. Запускались живые обычные такие модели, какая ещё синтетика?
     
  • 2.7, НяшМяш (ok), 10:03, 21/10/2025 [^] [^^] [^^^] [ответить]  
    		• +1 +/
    Лениво гоняю всякий ширпотреб типа дистиллированных дипсиков через LM Studio на своей RX 6800 XT - Vulkan бэкэнд стабильно быстрее ROCm процентов на 10-20 по скорости генерации токенов. И это ещё на месе без оптимизаций из поста.
     
     
  • 3.8, Жироватт (ok), 10:05, 21/10/2025 [^] [^^] [^^^] [ответить]  
    		• +4 +/
    > типа дистиллированных дикпиков
     
     
  • 4.15, НяшМяш (ok), 10:51, 21/10/2025 [^] [^^] [^^^] [ответить]  
    		• +1 +/
    На полноценные пока видяхи не хватает xD
     
  • 3.10, Андрей (??), 10:35, 21/10/2025 [^] [^^] [^^^] [ответить]  
    		• +/
    А вы кастомку сравниванивали или ванильную версию ? Просто вроде как есть прям отдельная версия lmstudio под amd, её анонсили с процессорами AI 395+ и даже на презентации отдельно светили и вот у неё насколько я понял ROCm должен быть затюненый.
     
     
  • 4.14, НяшМяш (ok), 10:50, 21/10/2025 [^] [^^] [^^^] [ответить]  
    		• +/
    Нет, обычную. Даже не слышал про кастомную, надо будет посмотреть.
     
  • 3.12, Аноним (12), 10:41, 21/10/2025 [^] [^^] [^^^] [ответить]  
    		• +/
    Что интересно, с актуальной версией llama.cpp на Nvidia, CUDA быстрее Vulkan процентов на 25%.
     

  • 1.3, Аноним (3), 09:46, 21/10/2025 [ответить] [﹢﹢﹢] [ · · · ]  
    		• +3 +/
    Valve реально двигает Linux!
     
     
  • 2.11, Ан339ним (?), 10:39, 21/10/2025 [^] [^^] [^^^] [ответить]  
    		• –5 +/
    Как ты можешь хвалить корпорастов, ты против щв0бодьки что ли?
     
     
  • 3.17, Аноним (17), 11:00, 21/10/2025 [^] [^^] [^^^] [ответить]  
    		• +/
    Не эти корпорасты, они типа правильные, они на другом зарабатывают, бггг
     
     
  • 4.28, Ан339ним (?), 11:53, 21/10/2025 [^] [^^] [^^^] [ответить]  
    		• +/
    На продаже мерзких пипилитарных игр "тупым хомячками"!
     
  • 2.18, Аноним (18), 11:04, 21/10/2025 [^] [^^] [^^^] [ответить]  
    		• –1 +/
    Пришел чел из Valve и сделал все за Васянов)
     
     
  • 3.29, анон (?), 11:53, 21/10/2025 Скрыто ботом-модератором     [к модератору]
    		• +/
     

  • 1.5, Аноним (5), 09:57, 21/10/2025 [ответить] [﹢﹢﹢] [ · · · ]  
    		• +/
    AMDVLK не проприетарный
     
  • 1.9, Габен (?), 10:05, 21/10/2025 [ответить] [﹢﹢﹢] [ · · · ]  
    		• +/
    На этом вашей годноте, 10 лет назад игр ААА класса небыло
     
     
  • 2.13, Ан339ним (?), 10:41, 21/10/2025 [^] [^^] [^^^] [ответить]  
    		• +4 +/
    Не было и не надо, будем и дальше в супертукса играть на некроте. Ведь корпорации - зло, и нельзя их спонсировать!!1
     
  • 2.21, Аноним (19), 11:10, 21/10/2025 [^] [^^] [^^^] [ответить]  
    		• +1 +/
    не было - и не будет. Кто пойдёт в такой зоопарк версий? Каждый год что-то ломают и переписывают. Вяленого уже лет 15 и всё доделать не могут, ничего не работает, костыли пошли уже хуже иксов.
     
     
  • 3.22, Аноним (22), 11:18, 21/10/2025 [^] [^^] [^^^] [ответить]  
    		• +/
    Вяленый в 2007 анонсировали, уже пиво может покупать.
     
  • 2.32, Аноним (32), 12:24, 21/10/2025 [^] [^^] [^^^] [ответить]  
    		• +/
    Были, целых две. Quake 3 и Unreal Tournament 2004.

    Потом Humble Bundle был. Не AAA, но тем не менее, тоже нативный код.

    Сейчас мне в нативных линукс версиях игр не нравится, что они отказываются работать с глубиной цветности, отличающейся от 24. Тогда как в винде можно выставить глубину цвета 16 бит и играть. И ладно 16 бит (кому они нужны после 2003 года?), но как же 30 бит? В винде работает!

    Иронично, что раньше это винда не умела запускать игры, если выставить 16 бит вместо 256 цветов. Теперь же, ситуация стала обратной.

     

  • 1.16, Аноним (16), 10:54, 21/10/2025 [ответить] [﹢﹢﹢] [ · · · ]  
    		• –1 +/
    А ведь можно просто использовать нвидию с божественной КУДА. Но нет, надо стоя, в гамаке и на лыжах.
     
     
  • 2.20, Аноним (20), 11:06, 21/10/2025 [^] [^^] [^^^] [ответить]  
    		• +4 +/
    И постоянно мучаиються с кривыми драйверами? Спасибо, не надо.
     
     
  • 3.23, Аноним (22), 11:19, 21/10/2025 [^] [^^] [^^^] [ответить]  
    		• –2 +/
    С кривым ядром же как-то живёте, и ничего.
     
     
  • 4.24, anonymous (??), 11:29, 21/10/2025 [^] [^^] [^^^] [ответить]  
    		• +1 +/
    Вы вот без мозгов живете и ничего.
     
  • 3.26, Аноним (16), 11:35, 21/10/2025 [^] [^^] [^^^] [ответить]  
    		• –1 +/
    о чем ты? драйвера нвидии уступают по удобству только драйверам интела. А вот видюхи АМД оставили крайне неприятное впечатление своим fglrx, до сих пор в пот бросает, когда вспоминаю. АМД всегда была крайне недружелюбна к линуксу.
     
     
  • 4.27, Аноним (27), 11:42, 21/10/2025 [^] [^^] [^^^] [ответить]  
    		• +1 +/
    Но начиная с второй половины нулевых, первая начала проявлять дружелюбность к Линуксу, открыв таки спецификации.
     
  • 4.33, Аноним (32), 12:34, 21/10/2025 [^] [^^] [^^^] [ответить]  
    		• +/
    Присоединюсь ко мнению выше. После покупки АМД-ой, ATi начал поворачиваться лицом к пользователю. Вспомнить энергосбережение на fglrx vs radeon. fglrx уже давно был легаси, а температуру ниже держал. Даже сейчас VA-API/XvBA на fglrx греет GPU меньше, а производительность имеет выше.

    У меня в данный момент связка из Linux 4.11, libdrm 2.4.97, xf86-video-amdgpu 18.1, X-Server 1.15 и Mesa 19.0. Сижу на не обновлённой системе, может в новых ОС что-то поменялось. Браузер Palemoon делает иксы чудовищно неотзывчивыми, если Гугл решил выдать ИИ-совет. Минуты 2-3 висит, после чего отвисает. Работоспособность браузера после этого может нарушиться.

    Тут конечно браузер кривоват, но иксы же не должны начать тормозить из-за плохого браузера?

    Включение аппаратного ускорения принудительно (HWE) решает все проблемы с производительностью браузера. Гугл-ИИ-советы выдаются моментально.Вот только HWE работает только с проприетарными драйверами (nvidia и fglrx, возможно AMDGPU-PRO).

     
  • 3.30, Анонисссм (?), 11:55, 21/10/2025 [^] [^^] [^^^] [ответить]  
    		• +/
    >И постоянно мучаиються с кривыми драйверами

    а ты не обновляйся. в ДЦ поставил 1 раз какой-нибудь ol/cent8 и не обновляйся по 10 лет

     
     
  • 4.34, Аноним (32), 12:43, 21/10/2025 [^] [^^] [^^^] [ответить]  
    		• +/
    Ну вот я не обновляюсь (выше расписал). Щас набигут и скажут "у тибя софт пратух!".

    Сижу на LTS-системе. Основная проблема - старый Glibc. Его конечно можно обновить... Но меня пока что выручает Steam Soldier. Запускаю через него актуальный Google Chrome, не имея в системе Glibc 2.25. Пришлось немного подпереть "костылями": --no-sandbox и указать HTTP Proxy (напрямую чё-то не хочет). Но пока стоит, держится...

     
  • 2.37, ryoken (ok), 13:50, 21/10/2025 [^] [^^] [^^^] [ответить]  
    		• +/
    И куда вы там эту вашу невидию в PPC или там RISC-V воткнете? Что за зашореннолошадное мировоззрение? :)
     

  • 1.25, Аноним (25), 11:32, 21/10/2025 [ответить] [﹢﹢﹢] [ · · · ]  
    		• +/
    Чего только нет для radv, только на qemu под винду дров нет,
    чтобы графика летала. Вот и остается только looking glasses
     
  • 1.35, игрец (?), 13:10, 21/10/2025 [ответить] [﹢﹢﹢] [ · · · ]  
    		• +/
    По поводу игр на линуксах через всякие протоны: серьёзная проблема - это античит: не нравится ему протон, а пользователей на линуксах мало, поэтому не выгодно вкладываться в разработку античита. В остальном производительность сопоставима. В общем пользователей мало, потому что их мало. Благо винда стабильно отпугивает от себя пользователей.
     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:

    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей     		Created 1996-2025 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру