Проект Minotaur развивает оптимизатор векторных инструкций для LLVM ,
opennews (??), 16-Июл-23, (0) [смотреть все]
- много человекочасов, пропукали не один стул, построили целую науку, добились пов,
Аноним (1), 10:43 , 16-Июл-23, (1) –21 //
- Прогресс в навязывании avx2,
Аноним (3), 10:58 , 16-Июл-23, (3) +3
- Ты шутишь Это целые 1 3 Нука шляпу сними ,
Аноним (9), 11:36 , 16-Июл-23, (9) +12 //
- Так потратили человекочасы одна группа и один раз, а 1 3 прироста теперь будут ,
Аноним (29), 14:45 , 16-Июл-23, (29) +17 //
- для всех, кто ЭТО использует А кто будет использовать прилепленныетсбоку васяно,
Аноним (51), 17:08 , 16-Июл-23, (51)
- Например, любой крупный облачный оператор Да и в целом, сэкономить 1 денег чер,
Аноним (58), 18:17 , 16-Июл-23, (58) +4
- для некоторых задач и ускорение на 0 1 это миллионы доларов экономии в год ,
Я (??), 23:03 , 16-Июл-23, (72)
- Ага - полезность науки это растет как длина фрактала к ометаемой площади ,
AKTEON (?), 13:19 , 16-Июл-23, (23) //
- Ты пропукал свой комментарий, это прогресс я считаю ,
Аноним (27), 13:41 , 16-Июл-23, (27) +7
- На больших масштабах это могут быть огромные деньги К счастью они будут потраче,
Anonymous1917 (?), 09:18 , 17-Июл-23, (86) +1
- Для каких-нибудь видеоигр один процент - это целый кадр, если метишь в 120 FPS ,
Аноним (87), 09:33 , 17-Июл-23, (87) //
- А они учитывают то что многие процессоры тут же включают троттлинг от таких инст,
Аноним (2), 10:58 , 16-Июл-23, (2) –4 //
- околесицу и чушь про тротлинг при вызове таких инструкций не несите, хорошо спа,
Аноним (6), 11:29 , 16-Июл-23, (6) +2 //
- Может троттлинг и не точное определение, но то, что ядра снижают частоту при исп,
Аноним (7), 11:33 , 16-Июл-23, (7) –1 //
- Это то же самое и по той же причине Своеобразный преемптивный троттлинг, avx ле,
Аноним (2), 12:33 , 16-Июл-23, (15)
- То, что это в принципе самый долгособираемый пакет, вопрос отдельный, троттлить ,
Аноним (2), 12:37 , 16-Июл-23, (16)
- Пользуйтесь процессорами AMD, у них частоты одинаковые при любых инструкциях ,
Аноним (41), 15:48 , 16-Июл-23, (41) +2
- Это было на самых первых реализациях от интела Этого уже нет, если укладывается,
Аноним (29), 14:48 , 16-Июл-23, (30) +4
- В процессорах нет инструкций для копирования произвольных кусков памяти ,
Аноньимъ (ok), 15:27 , 16-Июл-23, (36) +1
- Нету, проще каждое поколение наращивать количество ядер и продавать Ой, уже дав,
Oe (?), 18:15 , 16-Июл-23, (57)
- Есть, начиная с 16-ти разрядных 8086 rep movsВ какие-то периоды времени она рабо,
n00by (ok), 08:02 , 17-Июл-23, (81) +2
- Зачем тогда avx используют для копирования И разве это не просто способ повторен,
Аноньимъ (ok), 11:26 , 17-Июл-23, (90)
- Не знаю, зачем Может маркетинг, или очередной выигрыш на уровне погрешности изм,
n00by (ok), 12:36 , 17-Июл-23, (91) +1
- Там целая эпопея https stackoverflow com questions 43343231 enhanced-rep-movsb,
Аноним (118), 21:38 , 03-Янв-24, (118)
- Ага, такой лёгкой болячкой оказалось, что вообще нафиг выпилили из новых процесс,
Аноним (46), 16:51 , 16-Июл-23, (46) +1
- В zen4 avx512 выполняется в 2 инструкции так как ширина канала 256 По факту avx,
S22 (?), 21:44 , 16-Июл-23, (69)
- Phoronix потестил и смысл очень даже есть https www phoronix com review amd-z,
анонимус (??), 22:44 , 16-Июл-23, (71)
- Увеличение скорости на 10 против нормативных 2х раз Avx512 там добавили для гал,
S22 (?), 07:29 , 17-Июл-23, (79) +1
- uwothttps www phoronix com review rocket-lake-avx512https www phoronix com r,
анонимус (??), 08:10 , 17-Июл-23, (83)
- Чего только не прочитаешь в комментах ,
Аноним (98), 00:35 , 18-Июл-23, (99)
- Не туда смотрите Вот вам в TensorFlow и в два раза прирост https www phoroni,
Stax (ok), 07:42 , 18-Июл-23, (103)
- А многие не включают ,
Аноним (65), 14:53 , 16-Июл-23, (32) +3 //
- Вроде, это каждый раз повторяется Добавляют новые SIMD, не вывозят по тепловыде,
Аноним (2), 15:10 , 16-Июл-23, (33) //
- У АМД была похожая история с совместными блоками -- вроде, ядер много, а использ,
Аноним (2), 15:14 , 16-Июл-23, (34)
- Всё лучше чем проц сгорает если снять кулер ,
Аноним (27), 15:35 , 16-Июл-23, (38)
- Они тогда решили сэкономить на блоках для плавающей запятой 1 на 2 ядра В бул,
An2 (?), 17:03 , 16-Июл-23, (49)
- Работало вообще оно отлично для обычных задач Да, на всяких расчётах не очень хо,
Аноньимъ (ok), 22:08 , 16-Июл-23, (70) +3
- А вы посмотрите обзоры и сравнения тех времен, и перестанет казаться Разделяемый,
Аноним (98), 01:02 , 18-Июл-23, (100)
- Смотрел обзоры, видел много некомпетентности И успешно использовал эти апушки мн,
Аноньимъ (ok), 02:39 , 18-Июл-23, (101)
- Первой их апушкой у меня былAMD A10-5800KРазгонялся вообще отлично При этом был ,
Аноньимъ (ok), 02:48 , 18-Июл-23, (102)
- расчитанный на высокую пропускную способность throughput в ущерб задержке la,
n00by (ok), 09:13 , 18-Июл-23, (106)
- Да нет, всё прилеплено куда надо Да, NetBurst был расчитан на высокие частоты,
Аноним (98), 12:57 , 18-Июл-23, (108) +1
- Но толку не было, потому она архитектура NetBurst и породила мем кукурузные г,
n00by (ok), 09:01 , 19-Июл-23, (111)
- Относится Почитайте статьи по ссылкам ,
Аноним (98), 11:27 , 19-Июл-23, (114)
- Вот сам читай их, подбирай цитаты и подтверждай своё заявление Мне достаточно к,
n00by (ok), 15:17 , 19-Июл-23, (115)
- Всё понятно, удачи с вашим багажом знаний ,
Аноним (98), 23:04 , 19-Июл-23, (116)
- Бгг, но ведь ты как то живёшь, не понимая индукцию ,
n00by (ok), 09:18 , 20-Июл-23, (117)
- очень медленно будет ,
Аноним (3), 10:59 , 16-Июл-23, (4) //
- Rewrite Generator - Rewrites - Rewrite Rules - Rewrite,
Аноним (17), 12:43 , 16-Июл-23, (17) //
- Интересно было бы сравнить с GCC O3 pgo ,
Аноним (2), 12:56 , 16-Июл-23, (20) //
- Это очень круто, но бывает эти avx инструкции нужны для всяких векторных вычисле,
Аноньимъ (ok), 13:05 , 16-Июл-23, (22)
- Может я чего-то недопонимаю, но зачем в LLVM вообще для if --p припле,
Аноним (24), 13:21 , 16-Июл-23, (24) //
- Они цикл разворачивают, как я понимаю Но многое остаётся загадкой да ,
Аноньимъ (ok), 13:30 , 16-Июл-23, (26) +2
- Внезапно, это прямое назначение векторных инструкций - выполнить одну операцию н,
Аноним (65), 14:51 , 16-Июл-23, (31) +1 //
- Стоит ли вообще такое делать без явного указания программиста что именно так нуж,
Аноньимъ (ok), 15:40 , 16-Июл-23, (39) //
- Конкретно в этом примере не весь цикл, а только оператор сравнения Фактически в,
Tim (??), 16:41 , 16-Июл-23, (44)
- Но откуда программисту знать, на каком процессоре код будет выполняться Можно л,
An2 (?), 17:08 , 16-Июл-23, (50)
- Очевидно, он известен, т к p указывает на конец, а name - на начало Никаких чуд,
Аноним (65), 19:39 , 16-Июл-23, (67)
- Скрыто модератором,
YM2608 (?), 15:21 , 16-Июл-23, (35) –1 //
- Ауч, кэшу больно,
uis (??), 16:51 , 16-Июл-23, (45) //
- Кто Генту хаял из-за ничтожных 3 прироста производительности Наука - понимать ,
Аноним (55), 18:00 , 16-Июл-23, (55) +2
//
- Не, я к этим ребятам не зайду Пример уж слишком весел do if --p p,
Tron is Whistling (?), 23:09 , 16-Июл-23, (74) +2 //
- Да и если p start - тоже внезапно окажется не менее весело ,
Tron is Whistling (?), 23:13 , 16-Июл-23, (76) +1
- Но если до проверки p start или установки p start X догонит каждый второй ,
Tron is Whistling (?), 23:14 , 16-Июл-23, (77)
- Это будет означать, что один из указателей не выровнен, что значит UB и косяк пр,
Аноним (65), 02:47 , 17-Июл-23, (78) //
- Он имел ввиду не кратна размеру операнда SIMD инструкции , но сформулировал оши,
n00by (ok), 08:21 , 17-Июл-23, (84) +1 //
- А кто сказал, что там char Из вырванных из контекста строк не видно ,
Tron is Whistling (?), 08:09 , 18-Июл-23, (104)
- Я читаю то, что написано, и написано там было совсем не то, что у вас И сдаётся,
Аноним (98), 12:59 , 18-Июл-23, (109)
- Там наверняка отдельных два цикла один обрабатывает байты пачкой, а второй оста,
n00by (ok), 08:26 , 17-Июл-23, (85) +1
- Открою секрет, чтоб подсчитать определитель матрицы иль повернуть тело на 146 , ,
pavlinux (ok), 12:45 , 17-Июл-23, (92)
- Cейчас кто-нибудь, вообще, ещё считает такты процессора А то ж окажется, что 25,
pavlinux (ok), 12:48 , 17-Июл-23, (93)
- Талантливые программисты в среднем ускорение составило 2 2 При тестировании на,
Аноним (94), 13:01 , 17-Июл-23, (94) +4
1,2,4,17,20,22,24,45,55,74,92,93,94
|