В рамках проекта vramfs (https://github.com/Overv/vramfs) развивается реализация файловой системы, использующей для хранения данных видеопамять. В системах, укомплектованных современными дискретными видеокартами, но не используемых для выполнения интенсивных графических задач, видеопамять зачастую простаивает без дела, при том, что её размер может составлять несколько гигабайт. Vramfs позволяет привлечь незадействованную видеопамять для организации работы высокопроизводительного RAM-диска, который можно применять для решения системных задач, например, для хранения временных файлов, кэша или промежуточных результатов вычислений. Код файловой системы написан на языке С++ и распространяется под лицензией MIT.
Производительность vramfs на тестовой система с GPU AMD R9 290 4GB (Sapphire Tri-X) достигает 2.4 GB/s для операций чтения и 2.0 GB/s для записи, что составляет примерно 1/3 от производительности классического RAM-диска. В будущем производительность vramfs планируется довести до величин, близких к пропускной способности шины PCI-e. Кроме того, планируется реализовать подобие RAID-0, позволяющее объединять в один виртуальных диск память нескольких видеокарт с интерфейсами SLI и Crossfire.Реализация файловой системы использует механизм FUSE для создания ФС в пространстве пользователя. Для выделения видеопамяти и доступа к ней используются буферные объекты OpenCL. Для работы требуется GPU с поддержкой OpenCL 1.1 и соответствующий драйвер OpenCL. Обратной стороной использования OpenCL являются проблемы с распараллеливанием запросов - запись производится в асинхронном режиме, но операции чтения выполняются синхронно с обеспечением непротиворечивости за счёт упорядоченной обработки команд OpenCL (чтение блока не будет произведено до завершения команды записи).
В текущей виде в vramfs для большинства операций (за исключением чтения и записи) применена глобальная блокировка, которая позволяет в один момент времени только одной нити изменять ФС. Другим ограничением является минимальный размер блока в 32 Кб, так как блоки меньшего размера приведут к необходимости создания слишком большого числа буферов OpenCL (в будущем для решения данной проблемы планируется задействовать подбуферы). Наилучшая производительность достигается при размере блока в 128 Кб.<center><a href="https://camo.githubusercontent.com/f577936e5254c7abefff08088... src="https://www.opennet.ru/opennews/pics_base/0_1418587828.png" style="border-style: solid; border-color: #606060; border-width: 1px;max-width:100%;" title="" border=0></a></center>
URL: https://news.ycombinator.com/item?id=8747057
Новость: https://www.opennet.ru/opennews/art.shtml?num=41267
ну а что, круто же!
куплю
m.market.yandex.ru/model.xml?modelid=10631219&hid=91031
буду фотокотиков хранить!
> буду фотокотиков хранить!man RAM
---
WRITE: http://i68.fastpic.ru/big/2014/1215/96/a44b5902a477f54446d95...
RANDOM WRITE: http://i63.fastpic.ru/big/2014/1215/b7/3d488a9e698c5aca75597...По оси Х: Размер записи
По оси Y: Скорость.
Цвет: Размер блокаБлоки по 2048 рулят!
READ: http://i65.fastpic.ru/big/2014/1215/56/2fa3c7f02eb7a9b88f0ee...---
Нагрузка на Процессоры (2 штуки по 2 ядра) (по оси Y: CPU% )
READ: http://i67.fastpic.ru/big/2014/1215/46/445ce86a96ec3399d81be...
WRITE: http://i66.fastpic.ru/big/2014/1215/94/f77a5acf406276f6ab4b1...самое интересное, что htop показывал нагрузку от процесса vramfs - 196% :D
Было бы интересно посмотреть на аналогичные тесты (скорость/cpu) для tmpfs на обычной памяти.
> Было бы интересно посмотреть на аналогичные тесты (скорость/cpu) для tmpfs на обычной
> памяти.DDR1, PC3200, 400MHz, ECC, 128-бит, 2-канальная. (теоретическая максималка 6.4 Гб/сек.)
READ: http://i65.fastpic.ru/big/2014/1215/e5/f7a877df506a9cd1cabba...
WRITE: http://i63.fastpic.ru/big/2014/1215/04/556f694be7db2639dad4f...
RANDOM WRITE: http://i66.fastpic.ru/big/2014/1215/d4/162f90a51b64343da5135...Во, ваще сказка, до 5 Гб/с o_0
REWRITE: http://i68.fastpic.ru/big/2014/1215/af/63ba06d1e8a2afd708616...
Это старая идея (2009 год как минимум). Давно читал - Using Graphics Card Memory as Swap. Но у этого варианта есть ограничения.
Идея не 2009 года, гораздо раньше - я помню такую тему для еще старых видео-карточек образца 1992 года времен мохнатого ДОСа.
Бессмысленная в целом фича - RAM диск на обычной памяти всегда будет быстрее - да и дефицита в ней давно нет.
> Идея не 2009 года, гораздо раньше - я помню такую тему для
> еще старых видео-карточек образца 1992 года времен мохнатого ДОСа.
QEMM VidRAMFirst released in 1990-01-10, it can provide extra conventional memory in text mode programs,
by reclaiming buffers located in UMA that are used in graphics modes. It requires EGA/VGA-compatible
video card.VIDRAMEMS supports DMA-based video memory access at the expense of EMS memory for buffer.
Не такая уж и бессмысленная, ведь не у всех есть машина с туевыми хучами RAM. Если в машине всего 2-4 ГБ основной памяти и относительно новая видеокарта с 2-4ГБ, то это может быть хорошая прибавка к пенсии.
> Card Memory as Swap. Но у этого варианта есть ограничения.Да, всего ничего: дорого и бестолково, ибо мало памяти и доступ медленный. При том что видеокарта с нормальным объемом VRAM стоит прилично денег.
>> Card Memory as Swap. Но у этого варианта есть ограничения.
> Да, всего ничего: дорого и бестолково, ибо мало памяти и доступ медленный.
> При том что видеокарта с нормальным объемом VRAM стоит прилично денег.конечно, ведь намного лучше, когда видеопамять вообще никак не используется. вот это быстро и толково.
>>> Card Memory as Swap. Но у этого варианта есть ограничения.
>> Да, всего ничего: дорого и бестолково, ибо мало памяти и доступ медленный.
>> При том что видеокарта с нормальным объемом VRAM стоит прилично денег.
> конечно, ведь намного лучше, когда видеопамять вообще никак не используется. вот это
> быстро и толково.кто мешает покупать систему с интегрированной видеокартой?
>>>> Card Memory as Swap. Но у этого варианта есть ограничения.
>>> Да, всего ничего: дорого и бестолково, ибо мало памяти и доступ медленный.
>>> При том что видеокарта с нормальным объемом VRAM стоит прилично денег.
>> конечно, ведь намного лучше, когда видеопамять вообще никак не используется. вот это
>> быстро и толково.
> кто мешает покупать систему с интегрированной видеокартой?а ту, что уже есть, конечно, выкинуть на свалку. ещё толковей.
а ещё попробуй подумать над тем, что рассчёты на GPU не всегда требуют 100500 памяти. однако же купить видеокарту с приличным GPU и без хотя бы гигабайта RAM нереально. поэтому, само собой, гигабайт RAM должен тупо не использоваться — это очень по-хипстерски.
> конечно, ведь намного лучше, когда видеопамять вообще никак не используется. вот это
> быстро и толково.Не знаю, как у тебя, а у меня половина оперативной памяти практически никогда не используется. Она же по цене песка сейчас - поставил себе 8-16 Гб и радуйся. Зачем ещё видеопамять подключать в качестве RAM-диска?
Не очень понятен смысл этого прожектаhttp://www.gentoo-wiki.info/TIP_Use_memory_on_video_card_as_...
Примерные пропускные скорости интерфейсов
Сравниваю то, что есть в моём компьютере:PCIe 3.0 x16 32768 Мбайт/с
DDR3-1333 10667 Мбайт/сВ принципе очень неплохо. Но, нужно делать поправки на битность шины в видеокарте, и типе оперативной памяти.
https://ru.wikipedia.org/wiki/DDR3_SDRAM
https://ru.wikipedia.org/wiki/PCI_Express
> Примерные пропускные скорости интерфейсовя не про это - в ядре Linux и так есть возможность сделать рамдиск в памяти дискретной видеокарты
> PCIe 3.0 x16 32768 Мбайт/с
> DDR3-1333 10667 Мбайт/сэто для одноканального контроллера DDR, для двухканального х2 к тому же видеопамять это та же DDR SDRAM - не важно какая пропускная способность у PCIe. Если глубже копнуть - у DDR тоже дифференциальные сигналы как и у PCIe, так что не в пропускнойспособности интерфеса узкое место.
> в ядре Linux и так есть возможность сделать рамдиск в памяти дискретной видеокартыНасколько помню, последние эксперименты давали скорость 3 Мб/cек. :D
>> в ядре Linux и так есть возможность сделать рамдиск в памяти дискретной видеокарты
> Насколько помню, последние эксперименты давали скорость 3 Мб/cек. :Dhttp://www.phoronix.com/forums/showthread.php?111022-VRAMFS-...
родной ядерный Линукс драйвер работает напрямую с железом и по скорости рвёт VRAMFS на OpenCL.
Судя по http://en.wikipedia.org/wiki/PCI_Express предыдущий оратор ошибся. PCIe 3.0 x16 будет порядка 15.754 Gb/s, двухканальный DDR3 выдаст порядка 20-25 Gb/s в зависимости от частоты. DDR4 должен будет еще прибавить на линейных операциях, а PCIe x16 доступен далеко не всегда - если занято несколько слотов, то ты вполне можешь получить только x8. Так что узкое место - это именно PCIe, из-за чего и появляются всякие NvLink. Кстати, для сравнения, пропускная способность VRAM на современных картах на порядок выше - сотни Gb/s.
> Кстати, для сравнения, пропускная способность VRAM на современных картах на
> порядок выше - сотни Gb/s.Но, опять же, на линейных операциях, характерных для графики. А своп - не обязан быть линейным. В общем дешевле и эффективнее всего не вы..ться и купить пару DIMM. А это так, из разряда научных курьезов.
> В общем дешевле и эффективнее всего не вы..ться и купить пару DIMM.У меня вот под завязку, 8 диммов по 4 гига, больше не делали.
Ну вроде материнку заменить тоже не проблема, если средства позволяют, а ты ж именно на это намекаешь, правда?
> У меня вот под завязку, 8 диммов по 4 гига, больше не делали.А тебе 32Гб мало? Да и своп из видеокарт - это примерно как облицовка туалета пентиумами про :)
>http://www.gentoo-wiki.info/TIP_Use_memory_on_video_card_as_...метод по ссылке использует видеопамять в обход драйверов/чипа и всего. запуск любой игрули разрушит файлики. это метод для тех, кто 3д не использует вообще
метод из новости использует драйвера/чип
A nvidia поддерживает opencl или только cuda?
https://developer.nvidia.com/opencl
Редис и мемкэш переделают под это добро?
> Редис и мемкэш переделают под это добро?Форкни и переделай. Или ты только трындеть в уютненьком горазд и ждать джва года, пока другие сделают? Ты ж фанбой СПО, или только так, примазавшийся?
В спекртуме давно такое было :)
Лол, и правда ведь.
Некоторые игры хранили часть данных прямо на экране, стыдливо закрашивая цветовые знакоместа чёрным =)
Не совсем - в спектрумах видеопамять использовалась не в качестве ФС, а просто как память, так как находилась в едином адресном пространстве. И на PC такое решение встречалось (увы, за давностью лет не вспомню, какой менеджер расширенной памяти такое позволял), правда люто глючило.
Другой вопрос - насколько оно целесообразно? Как оно отработает запрос процесса (игрушки/видеоплеера) к выделению видеопамяти? Какова накладная стоимость работы с такой ФС?
Под DOS многие игры написаны под разрешение 320x200 256 цветов. Удобно - занимает один сегмент памяти в 64KB, быстро переносится на экран одной ассемблерной командой movsb/movsw/movsd.
>увы, за давностью лет не вспомню, какой менеджер расширенной памяти такое позволялvidram.com/qemm (для юных читателей: нет, это не адрес странички на сайте ))
> на PC такое решение встречалось (увы, за давностью лет не вспомню,
> какой менеджер расширенной памяти такое позволял), правда люто глючило.кагбэ ещё во времена 286-х была небольшая утилитка, которая позволяла делать highload в видеопамять. написана была энтузиастом из xUSSR, на коленке, появилась в какой-то софтпанораме, емнип. ничего не глючило, отлично работало. ну, правда, игры запускать не рекомендовалось по очевидным причинам.
В спектруме были видеокарты со своей памятью? Может я чего-то пропустил, но в оригинале об этом даже не задумывались. Единственный специализированный процессор был для звука.
Ура, у меня это будет первым полезным способом использования видеопамяти на современных картах. Сжатый своп туда - в самый раз.
Надо, чтоб сжимался своп средствами самой видеокарты...
Ну, это было бы вообще идеально, конечно. Можно было бы использовать какое-нибудь приличное сжатие. Особенно если десктоп и на энергопотребение - плевать.
Продам память. 2Гб. $200.
Есть выходы vga и hdmi.
Фишка в том, что эта память уже стоит. Один гиг, не два. Стоит меньше 50 баксов, и дешевле видеокарт просто нет.
Я видел систему, уходящую в своп лет 10 (минимум) назад. И это не считая ссд и тд (отдельный пунктик).
Как правило минимум пару Гб не используются в системе вообще (не считая мобильного сегмента. Но туда и сабж и не применим), даже для кэшей.(1Гб? 512Мб? Серьёзно? Вы из-за этого свободного места в ОЗУ майдан устроили? :D)
Зыж
сабж интересен как джаст4фан и ай_kэн. и не более.
да, просто прикольно. и "вау, я и вот так могу"... т.е. имеет право на жизнь.
Но к этому и относится нужно соответственно.
Ззыж
Эх, хохлы. Тратили бы вы вашу энергию в созидадельных целях...
Зззыж
> Фишка в том, что эта память уже стоит.Чё, жаба что ли давит? :D
Да у тебя из 16Гб половина не используется!
ну да, зимой самое то - ноги греть!
современные видяшки под 200 ватт тепла выделяют при работе, в случаях использования 2D сильно меньше, вы же предлагаете использовать их как печки
Вычислительные блоки там загружены не будут (или почти не будут, даже если и правда сжатие на них свалить), всё остальное - жрёт понты.
> Ура, у меня это будет первым полезным способом использования видеопамяти на современных
> картах. Сжатый своп туда - в самый раз.Ты уверен, что там будет достаточно хорошая надёжность? Память-то для видео не должна быть столь же надёжной, как память для основной системы.
С приходом OpenCL требования к видеопамяти столь же жесткие как и к основной. Не удивляюсь если появятся отдельные серии плат с ECC памятью.
Я два года назад слышал несколько иное - что если считать матрицы на обычной потребительской видеокарте NVidia, то расчёт работает примерно сутки, дальше попадается ошибка памяти, и считается уже чепуха.
Нет. это ненормально, может она просто перегревается, тогда все возможно.
Не сильно знаком с nvidia, уже лет 10 ими не пользуюсь, но как минимум на amd это бы считалось браком, такого на нормальных картах не увидишь.
> как минимум на amd это бы считалось браком,У нвидии большинство чипов очень горячие и работают в режимах близким к предельным. Со всеми вытекающими.
> Я два года назад слышал несколько иное - что если считать матрицы
> на обычной потребительской видеокарте NVidia, то расчёт работает примерно сутки, дальше
> попадается ошибка памяти, и считается уже чепуха.потому что охлаждать надо. они капризные, чуть перегрелись — и посыпались обидки.
> потому что охлаждать надо. они капризные, чуть перегрелись — и посыпались обидки.Не зря нвидия называется GTX, что в русской раскладке прозрачно намекает. А вот чтобы амд сглючило... у некоторых маньяков майнеры по полгода non-stop долбили. Даже такое страшило как каталист не падало.
ну бред-то не несём, да? «потребительские» видеокарты (которые часто даже не nVidia выпускает) просто не снабжают достаточно мощной вентиляцией. потому что на самом деле это действительно не нужно: предполагается, что пользователь не будет недели напролёт нон-стоп гонять крузис-666. небольшой краткосрочный перегрев же — не страшно.ваши амд потому и снабжались вентиляцией получше, что для них даже небольшой перегрев приводил к красочной заднице. потому тупо перестраховывались.
так что весь твой пост, если немного заняться анализом, утверждает только одно: «железо в видеокартах амд менее надёжное, чем железо в видеокартах нвидия». ты точно именно это хотел написать?
> Не удивляюсь если появятся отдельные серии плат с ECC памятью.Сто лет как есть. Профессиональные видеокарты кроме всего прочего отличаются еще и памятью с ECC..
Кто не в курсе, правильные хедеры OpenCL нужно тянуть с хроноса
# mkdir -p /usr/include/CL
# cd /usr/include/CL;
# wget http://www.khronos.org/registry/cl/api/1.1/cl_d3d10.h \
http://www.khronos.org/registry/cl/api/1.1/cl_ext.h \
http://www.khronos.org/registry/cl/api/1.1/cl_gl_ext.h \
http://www.khronos.org/registry/cl/api/1.1/cl_gl.h \
http://www.khronos.org/registry/cl/api/1.1/cl.h \
http://www.khronos.org/registry/cl/api/1.1/cl_platform.h \
http://www.khronos.org/registry/cl/api/1.1/opencl.h \
http://www.khronos.org/registry/cl/api/1.1/cl.hpp;
Так вот почему cgminer, скомпилированный с NVIDIA CUDA Toolkit и AMD APP SDK, имеет разные размеры... Я реально проверял: LiveCD на основеп Debian 5.0 (был 2011 год), в одной и той же системе пробовал разные видеокарты и драйверы, и результат компиляции отличался по размеру. Так вот почему!
> Так вот почему cgminer, скомпилированный с NVIDIA CUDA ToolkitА смысл на нвидии майнить, для начала? Она проcacывает амд вообще везде. На sha256 просос просто адский, на scrypt помеьше но тоже убедительный сдрист.
У Nvidi Tesla K40 ваши нищебродские атишке отсасывают причмокивая.
Поэтому не пизти и показывай видео своих бенчмарков. Конфиги, настройки, и т.п.
> У Nvidi Tesla K40 ваши нищeбродские атишке отсaсывают причмокивая.Йоу, каркуша! Первую теслу на sha256 делали вообще стобаксовые 5770/6770, которые вообще начало midrange. FAIL! Не говоря о том что они кардинально меньше теслы кушают и потому зело дешевле в эксплуатации при том же выхлопе. А более мощные амдшки вообше нвидию имеют по черному. В sha256 (и подобных по смыслу крякерах хешей) - просто беззазренно: там только массовый параллелизм надо, амдшки с их кучей дохлых но многочисленных алушек в VLIWах всем дико втыкают. Да и в GCN алушек особо меньше не стало. В scrypt еще скорость доступа к VRAM роялит, но там вообще тюнинг - слегка рокетсайнс.
> Поэтому не пизти и показывай видео своих бенчмарков. Конфиги, настройки, и т.п.
Могу показать порядка 370Mh/sec майнинга sha256 на R9 270, на открытом драйвере. Ну это я так, поизучал немного что можно потюнить. После нескольких экспериментов подобрал параметры с которыми оно вот так. Это по идее довольно близко к проприетарному каталисту, кстати - амд свое LLVMное безобразие малость подтягивает. А еще амдшники мне рассказали про render nodes и как все это без иксов запускать. Очень мило с их стороны. Как-то с трудом представляю себе такую сценку с участием проприерасов.
> wget http://www.khronos.org/registry/cl/api/1.1/{{cl...,_gl}{,_ext},_d3d10,_platform},opencl}.h,cl.hpp}не благодари
> Кто не в курсе, правильные хедеры OpenCL нужно тянуть с хроносаЧто, проприерасы из нвидии даже хидеры нормально не могут запилить?
>> Кто не в курсе, правильные хедеры OpenCL нужно тянуть с хроноса
> Что, проприерасы из нвидии даже хидеры нормально не могут запилить?Ты хоть одну программу на OpenCL написал? Нет! Ну вот заткнись тогда, и не высовывайся.
Я писал. Зеленые отсасывают
Я бы, всё-таки, докупил обычной памяти...
Так смысл в том, что бы задействовать то, что уже куплено. У меня видеокарта большую часть времени не нагружена, так пускай хоть видео память под файловый кеш используется.
>У меня видеокарта большую часть времени не нагруженаА остальное время? Что будешь делать когда понадобится?
Так под кеш же. Можно просто почистить.
Вообще, задумка интересная.
> Так под кеш же. Можно просто почистить.
> Вообще, задумка интересная.Тут две засады, даже не потенциальные. 1) за ресурс, который видеопрограммы считали своим, им придётся конкурировать. Будут ошибки. 2) сама реализация любого кэша - дело непростое, тут тоже будут ошибки. Овчинка выделки не стоит. Видеокарта с большим количеством памяти - дорогая, ставится в дорогой компьютер. 4 гига памяти сейчас стоит <3000 , надёжностью рисковать нет никакого смысла.
Если что-то исполняет только одну функцию - в это поделье могут быть ошибки на граничных режимах использования.
Если использовать ресурсы видеокарты по полной программе, то и в драйверах все недоделки и ошибки будут выпелены. Со временем.
Я всё жеза более радикальный подход. Минимальный объем памяти на видеокартах сейчас - 512, причем стоимость гиговой, считай, вообще не отличается, разница в доллар-два, а то и вообще одинаковая цена. У меня реально используется дай бог чтобы метров 80 (так как композита нет и не будет и в 3d-игрушки я не играю). Сжатый своп в видеопамяти на 800 метров не помешает вообще ничему и в том виде, что предлагается здесь, не имеет никаких проблем с рализацией кэша.В общем, с моей точки зрения - хорошая идея. Если уж впарили ненужное железо, то надо хоть польлзу из него извлечь.
В этом решении больше всего подкупает то, что можно применить его прямо сейчас ничего не переделывая.Но не нравится мне в нем то, что при достаточном количестве памяти мы затормаживаем систему как и при классическом свопе, пусть на порядок или два меньше, но все же медленнее обычной памяти. Также, насколько я понимаю, при работе с видео памятью будет дополнительно нагружаться процессор, что опять же уменьшит производительность системы и ее энергоэффективность. Можно конечно настроить так, что видео своп (надо запатентовать название :) будет использоваться только при острой нехватки памяти. Но тогда большую часть времени видео память по-прежнему будет простаивать, а при окончании основной памяти будут тормоза - ибо узким местом станет файловый кеш, который система урежет по максимуму.
Мне наиболее выгодным представляется следующий вариант.
Если памяти достаточно - не использовать видео память вообще.
Если файловый кеш заполнил всю память и его нужно чистить, то вместо удаления из основной памяти переместить его в видео память.
Если основная памяти не хватает для приложений, то кеш начинает вытесняться из видео памяти.
> Если основная памяти не хватает для приложений, то кеш начинает вытесняться из
> видео памяти.«в видеопамять» ты имел в виду?
> «в видеопамять» ты имел в виду?Нет. Я имел в виду ситуацию, когда весь кеш уже вытеснен в видеопамять, а основной памяти все равно не хватает. Только тогда и начинаем вытеснять кеш из видеопамяти.
Можно использовать видеокарту без монитора, иксов или вообще Теслу. NVIDIA и открытый драйвер Radeon умеют.
Где? На ноутбуке? Вы покупаете ноутбуки с дискретками для развёртывания на них серверов с кэшем на видяхе? Или Вы покупаете видеокарты на стационарник для организации кэша в видеопамяти?Буржуи они такие странные...
> Где? На ноутбуке? Вы покупаете ноутбуки с дискреткамиНа десктопе и сервере может иметь некий смысл. Если вы собираете числокрушилку - тогда нафига вам там иксы? Они только проблемы создают.
"Рабочая станция" и "ноутбук" - понятия не то чтобы совсем взаимоисключающие, но дружат плохо, в моём понимании. А вот на десктопе эта штуковина отлично сядет.
> Так смысл в том, что бы задействовать то, что уже куплено.Учитывая цену видеокарты с более-менее человеческим размером VRAM - если видео не надо, оптимальнее было бы купить видюшку попроще и памяти побольше. Сугубо с точки зрения эффективности расхода средств на достижение задач. А если видео надо - превращать юзеря в менеджер памяти тем более странно. Особенно при текущих ценах на DRAM.
А куда проще, чем видюха за 35 баксов? При этом у неё на борту гиг памяти, которая ни хрена не используется, если не играть в 3D-игрухи и не пользоваться композитами. Ну может браузер сколько-то сожрёт, но метров 800 останется всяко. Почему их не пустить в дело, раз уж их впарили?
> А куда проще, чем видюха за 35 баксов? При этом у неё
> на борту гиг памяти, которая ни хрена не используется,При этом как видеокарта она полное г, а гиг DDR3 можно и подешевле найти в формате модуля.
> дело, раз уж их впарили?
Странно что не впарили модули памяти.
Да, FUSE процессор конечно греет, при мелких записях частота
до максимума подымается, и при простое нагрузка ~5%.
Посаны, а какая это фича для секурити. Тут уже dd if=/dev/mem не прокатит,
да и другими утилями дамп не снимешь, особо на нвидивском блобе :D
> Посаны, а какая это фича для секурити. Тут уже dd if=/dev/mem не
> прокатит,
> да и другими утилями дамп не снимешь, особо на нвидивском блобе :DЗато невидиавский блоб поимеет твой своп/диск на блюдечке. В видеокартах _нет MMU и, соответственно, никакого аппаратного разделения доступа. Но ты ж не остановишься перед мелкими трудностями -- будешь всё, что туда выгружаешь, шифровать и подписывать?
В Кеплерах ужо есть
> Зато невидиавский блоб поимеет твой своп/диск на блюдечке. В видеокартах _нет MMUУ амдшников в новых видеокартах (6990 и все GCN) - есть. Там есть виртуальная память GPU. GPU со своей стороны подкачку умеет. Реально используется в GCN, а 6990 так умеет но там это не используется.
> и, соответственно, никакого аппаратного разделения доступа.
На дворе XXI век. И IOMMU до кучи не лишний. Хотя все-равно активной работой с GPU можно поставить другим юзерям графику колом, как ни крути. Если Вася и Петя используют 1 видеокарту и Вася запустил майнер на максимальной интенсивности - Петя получит свои три кадра в час.
> В видеокартах _нет MMU и, соответственно, никакого аппаратного разделения доступа. Но ты ж не остановишься перед мелкими трудностями -- будешь всё, что туда выгружаешь, шифровать и подписывать?В свежих картах всё есть. Правда есть вопрос в поддержке этого всего драйверами, но разработчики драйверов под линукс всегда помнят о безопасности, даже если это в ущерб производительности. Если отменить всю security-хрень, открытые драйвера могли бы быть как минимум 5-10% шустрее.
А что будет с буферами OpenCL при внезапном переключении видеорежима?
> А что будет с буферами OpenCL при внезапном переключении видеорежима?По идее ничего - драйвер должен обеспечить арбитраж ресурсов.
Буфера opencl вообще никак не связаны с фреймбуфером. Так что, ничего не будет.
Закриптованный контейнер туда расшифровывать
> Закриптованный контейнер туда расшифровыватьИ sms на коротний номер. Вместе с #11.
> высокопроизводительного RAM-диска
> использует механизм FUSE???
>> высокопроизводительного RAM-диска
>> использует механизм FUSE
> ???Ну вот такая высокая производительность - слоупочнее рамдиска.
А пофигу - зато быстрее жесткого диска и дармовое.
И зачем оно мне на сервере? :)
> И зачем оно мне на сервере? :)Зачем на сервере вообще видео? Т.наз. безголовые сервера лет 15 как выпускаются.
> Зачем на сервере вообще видео?google://mining rig например...
ну чё, разработчик маладец
> Представлен vramfs, вариант RAM-диска, использующий видеопам...И сделать в ней свап!
>> Представлен vramfs, вариант RAM-диска, использующий видеопам...
> И сделать в ней свап!... но нахура?!
> ... но нахура?!Чтобы работал быстрее.
Клоун говорит: "идиотская идея, но мне она нравится."
Использование простаивающих вычислительных ядер видеокарты -- хорошо, использование простаивающей памяти видеокарты -- плохо. Правильно?
Видеопамять имеет свойство часто глючить при перегреве видеоплаты. Своп туда кидать - это в рулетку играть.
При перегреве почти все имеет свойство глючить.Современные видеокарты уже продвигают в сегмент не графических вычислений. Некоторые на них даже суперкомпьютеры строят. Тем более что в режиме видео свопа нагрузка на видеоплату будет минимальной.
Конечно надежность системы в целом снижается по мере усложнения системы, но ИМХО если не управлять ядерными реакторами и системами жизнеобеспечения, то должно быть достаточно стабильно.
Современные карты вообще в принципе сложно перегреть, т.к. они аппаратно снижают частоты и т.д. во избежание проблем, так же как и современные CPU. То есть конечно можно наверное, если свои умелые ручки приложить, а так они не менее надежны чем все остальное.Я сам помню как разгонял древнюю видеокарту лет 10 назад, когда все кипятится, артефакты сыпятся, но сейчас как бы другая эра.
> Современные карты вообще в принципе сложно перегреть, т.к. они аппаратно снижают частоты
> и т.д. во избежание проблем,Но помогает не всегда. Ибо очень зависит от того что в VBIOS и насколько это соответствует реально навешенной системе охлаждения. Если кто думает что таблицы частот и напряжений производители не заполняют левой пяткой - вот это зря. Реально там знатная лотерея. В особо провальных случаях драйвер может даже оверрайдить таблицы на свои собственные, как софтварный воркэраунд OEMовской криворукости.
> Видеопамять имеет свойство часто глючить при перегреве видеоплаты. Своп туда кидать -
> это в рулетку играть.А ты эффекты в "рулетке" на минимум поставь - не будет перегреваться.
Модно, по молодёжному, пойдёт.
молодцы. всё больше убеждаюсь, что терпение великая вещь: если достаточно долго ждать — твои хотелки кто-нибудь напишет за тебя. главное — дождаться.
всё норм ввидиокарту клодут не 128 бит на герц как компе двухканальном рижыме када а клодут по 192 и по 256 и по 384 и по 512 могут где 192 трёхканал 256 четырёхканал 384 шестиканал 512 восьмиканал суперже!ето када опиротивка ddr4 2600 мгц а gddr5=5000 - gddr6=8000 мгц но увеличиный в 1.5 раза (192) иль в 2 раза (256) и тд что по скорости крайне обгоно
помимо того тчо сам gddr5=5000 уже 2 раз быстрей дополнительно скоростя далжны бут высачайшиешие
2600 мега герц / 2 * 128 бит двухканал на один герц * 1000000 / 8 / 1024 / 1024 = минимум 19836 до двух и двухсполовиной раз может железо усилить эту скорость у каждого по разному
а если вместо 2600 сделать 5000 и вместо 256 скорости ппц