forum.opennet.ru

Форум Разговоры, обсуждение новостей
Вариант для распечатки		Пред. тема \| След. тема
Режим отображения отдельной подветви беседы		[ Отслеживать ]

Оглавление

Для ядра Linux предложена реализация функции memchr, работающая до 4 раз быстрее, opennews (??), 12-Июл-22, (0) [смотреть все]

Я думал и так уже оптимизировали все что можно для 64бит, Аноним (1), 09:26 , 12-Июл-22, (1) +6 //

Оно и оптимизировано уже более 10 лет Называется аппаратная предвыборка данных , n00by (ok), 10:06 , 12-Июл-22, (8) –7 //

Вы немного ошибаетесь Никакие prefetch и прочие не избавят числодробилку от поб, _hide_ (ok), 10:11 , 12-Июл-22, (10) +6 //

А ещё я немного смотрю, чего оно там числодробит nl memchr line, n , end -, n00by (ok), 10:24 , 12-Июл-22, (14) –1
Сразу видно человека не разбирающегося в теме, Аноним (158), 02:09 , 16-Июл-22, (158)

Когда-то давно сравнивал свою реализацию strlen это почти memchr, только чуть д, Аноним (-), 12:51 , 12-Июл-22, (29) +2 //

То есть не догадались посчитать теоретический предел чтения из памяти и сравнить, n00by (ok), 13:13 , 12-Июл-22, (35) –2

А в Эльбрусах, Итаниках и прочих VLIW такой есть , Аноним (48), 14:34 , 12-Июл-22, (48) –3 //

Попробуйте дочитать моё сообщение до конца - там вся суть Что касается вопроса,, n00by (ok), 14:49 , 12-Июл-22, (54) –1

Интересно, а как предвыборка может изменить тот факт что телепать по 1 байту за , Аноним (-), 03:25 , 13-Июл-22, (89) //

Для недочитавших моё сообщение повторяю цитату автора for long strings Больша, n00by (ok), 09:16 , 13-Июл-22, (92) +1

Насколько помню, этот вариант проиграл варианту на условных переходах Продолжа, Аноним (-), 11:19 , 13-Июл-22, (105)

Как бы не важно, кто и что там якобы помнит, когда вот код из реального мира co, n00by (ok), 11:30 , 13-Июл-22, (106)

Это было сказано про мое сравнение реализаций strlen В ядре линукс мало кого инт, Аноним (-), 11:49 , 13-Июл-22, (108)

Нет никакого сравнения ни цифр, ни подробностей о железе А на самом деле аноним, n00by (ok), 12:06 , 13-Июл-22, (113)

производительностью которого заинтересовались и предлагают варианты , Аноним (-), 12:17 , 13-Июл-22, (115)

Пока нет никаких измерений производительности С какой целью Вы упорно пишете чу, n00by (ok), 13:49 , 13-Июл-22, (127)

Может, он и там тупил, ну они его и того , ммнюмнюмус (?), 22:46 , 13-Июл-22, (144)

Я что-то не уверен что ядро в принципе таким оперирует Там длинное это наверное, Аноним (-), 16:15 , 13-Июл-22, (132)

Разумеется, не оперирует Но автор написал long Вспоминаем определение кеш-памя, n00by (ok), 20:05 , 13-Июл-22, (139)

Тут, курица или яйцо Работает медленно -- ищем решение без поиска в лоб, не исп, _hide_ (ok), 10:08 , 12-Июл-22, (9)
Наоборот всегда было главное единообразие чтобы обеспечить переносимость Наопти, Аноним (12), 10:12 , 12-Июл-22, (12) //

Обычно имеются в начичии и оптимизированные варианты для известных архитектур, и, Аноним (45), 14:17 , 12-Июл-22, (45)

Раздуто, а не оптимизированно , Ананас (?), 10:54 , 12-Июл-22, (17) +2 //

Было бы оптимизировано, то не получилось бы сделать раздуто Было бы супермегане, Аноним (12), 10:55 , 12-Июл-22, (19) +2
В итоге получат, что толстое ядро тормозит сильнее, чем микроскопическое ускорен, Аноним (42), 13:46 , 12-Июл-22, (42)

Оно оптимизировано Просто надо ещё мест, где можно очереднус спектр запустить п, Аноним (79), 20:54 , 12-Июл-22, (79)

Как в glibc 129303 , pashev.ru (?), 09:29 , 12-Июл-22, (2) //

Там разве не sse и avx 512 с до 64 байтами за раз , Аноним (-), 09:39 , 12-Июл-22, (4) //

avx 512 в здравом уме в ядре использовать никто не будет, потому что на интелах, Онаним (?), 12:50 , 12-Июл-22, (28) +1 //

Это монолит, нет смысла апеллировать к здравому смыслу , Аноним (-), 12:59 , 12-Июл-22, (33)

Ну, бОльшая часть ядра до последнего времени таки здравому смыслу соответствовал, Онаним (?), 19:11 , 12-Июл-22, (69) +1

Что за урина Это uring чтоли так назвали Оно может и брейнфак, но ОЧЕНЬ БЫСТРЫ, Аноним (-), 03:28 , 13-Июл-22, (90)

спасибо за инфу смысул этих инструкций и новых процев околонулевой пожалуй , п, иисус господь евреев (?), 19:34 , 12-Июл-22, (73) –1

https colfaxresearch com skl-avx512 , Аноним (135), 16:32 , 13-Июл-22, (135)

Английского не знаю Судя по тексту Я сайт перевёл хорошо если не отлично , Аноним (135), 16:33 , 13-Июл-22, (136)

А что правда не так с avx-512 Я то наоборот стараюсь использовать векторизацию,, ммнюмнюмус (?), 15:17 , 14-Июл-22, (147)

Когда контекст исполнения поток переключается, регистры процессора надо сохран, n00by (ok), 17:18 , 14-Июл-22, (148)
Не так в нём то, что оно превращает в кипятильник весь камень, и частоты падают , Онаним (?), 22:11 , 15-Июл-22, (156)
и это не так из эксплуатационного Ещё с ним не так то, что разные процы поддерж, Онаним (?), 22:11 , 15-Июл-22, (157)

А так да, скорее всего оптимизации касаются как раз SSE 2 и AVX 2 - но честно , Онаним (?), 12:51 , 12-Июл-22, (30) //

В принципе и даже на стандартных регистрах можно через поиск нуля после вычитани, Онаним (?), 12:52 , 12-Июл-22, (31) +1

В принципе даже просто выровненный забор и 4-8 сравнений на стандартных регистра, Онаним (?), 12:54 , 12-Июл-22, (32)

В ядре не используются команды фпу, ссе и авх, с22 (?), 19:30 , 12-Июл-22, (70) +1 //

glibc используется , Аноним (-), 19:32 , 12-Июл-22, (72) +1
Первый найденный случайный файл https git kernel org pub scm linux kernel git , Аноним (-), 19:43 , 12-Июл-22, (74) +1

Нашёл баш-программиста ядра Смотрим не Makefile, а первый найденный случайный к, n00by (ok), 09:33 , 13-Июл-22, (93)

напечатай из ядра sin M_PI 19 , pavlinux (ok), 10:39 , 13-Июл-22, (102)

В ядре не используются команды печати , Аноним (-), 11:08 , 13-Июл-22, (104)

открой для себя printkhttps www opennet ru man shtml topic printk DESCRIPTION, pavlinux (ok), 12:53 , 13-Июл-22, (120)

Вот, чёрт , Аноним (122), 12:59 , 13-Июл-22, (122)

Ну вывести 0 16459459028 как бы не проблема Вопрос был к утверждавшим, что FPU , n00by (ok), 13:45 , 13-Июл-22, (125)

Еще как используются, всякие там хеш-функции и прочие подобные вещи в нескольких, 67332 (?), 21:43 , 12-Июл-22, (82)

Посмотрите, _как_ оно во всяких там используется Человек прав в принципе, но , n00by (ok), 09:40 , 13-Июл-22, (94)

Специально скопирую сюда из glibc string memchr cчто бы люди могли почитать ком, n00by (ok), 11:22 , 12-Июл-22, (22) –1 //

Покажи ещё sysdeps x86_64 multiarch memrchr-evex Shttps sourceware org git p g, Аноним (-), 12:25 , 12-Июл-22, (26) //

Суть вот где Handle the first few bytes by reading one byte at a time , n00by (ok), 13:15 , 12-Июл-22, (36) +1

Давай так Напиши свой наивный побайтовый алгоритм memchr можешь даже префетч п, Аноним (-), 13:35 , 12-Июл-22, (38) +1

Ещё раз, для не уловивших суть предлагаемое в ядро в общем случае НЕ РАБОТАЕТ, , n00by (ok), 14:51 , 12-Июл-22, (55) +1

Вернемся к нашим скачущим баранам Тогда зачем в ветке про glibc ты приводишь ко, Аноним (-), 16:38 , 12-Июл-22, (58)

В ответ на заявление Как в glibc 129303 я показал, что оно - ложно Затем, ч, n00by (ok), 17:13 , 12-Июл-22, (60) +1

как в glibc , было сказано на счет позволяет за раз сравнивать как минимум 4 б, Аноним (-), 17:32 , 12-Июл-22, (62)

Ещё раз в данном случае оно не сравнивает, оно даже прочитать память не может, , n00by (ok), 09:44 , 13-Июл-22, (96)

У тебя вообще ничего не работает, и ты сидишь на оффтопе и рассуждаешь, что долж, Аноним (-), 10:37 , 13-Июл-22, (101)

Дублирую цитаты I think you re missing the point Loads at unaligned addresses m, n00by (ok), 14:01 , 13-Июл-22, (128)
Тем временем существует оптимизированный memchr_inv, Аноним (-), 14:07 , 13-Июл-22, (129)

ох уж эта сишка и ее проблемы с типами на разных архитектурах , achtosluchilos (ok), 21:26 , 12-Июл-22, (81) –1 //

Хрустик как-то спасёт тебя от разного размера регистров в проце , Онаним (?), 09:42 , 13-Июл-22, (95) +1
Кстати, может ли Rust защитить от реальной проблемы предлагаемого ускорения - , n00by (ok), 09:51 , 13-Июл-22, (97) +1

А вот не факт Скорее всего исключение от железки поймает в тыкву и не факт что , Аноним (-), 16:20 , 13-Июл-22, (133) –1

Интересно, можно ли нарушение alignment requirements поймать на этапе трансляции, n00by (ok), 19:20 , 13-Июл-22, (137)

Скрыто модератором, pashev.ru (?), 09:31 , 12-Июл-22, (3) –3
Такого количества багов, костылей и рудиментов не было даже в ранней винде после, Аноним (5), 09:39 , 12-Июл-22, (5) –19 //

а что ты хотел, 31 год идёт ядру, его ещё причёсывают хотя бы хоть как-то, Аноним (6), 10:05 , 12-Июл-22, (6) –1 //

а что ты хотел, 1031 год идёт ядру, его ещё причёсывают хотя бы хоть как-тоP S , Аноним (5), 14:41 , 12-Июл-22, (51)

Ну да, в то время люди задавались вопросом какие такие строки, как часто и заче, n00by (ok), 10:12 , 12-Июл-22, (11) +1
Ты ещё исходники индусской 11 не видел , КО (?), 10:14 , 12-Июл-22, (13) +3 //

Я нормальный линукс десктоп не видел хотя бы на уровне XP, Аноним (5), 12:08 , 12-Июл-22, (24) –11 //

Ага, мы уже все видел тулчейн в исходниках XP, можешь не продолжать, вот где кос, commiethebeastie (ok), 12:13 , 12-Июл-22, (25) +3

Плохому линуксоиду виндоус мешает, Аноним (5), 12:47 , 12-Июл-22, (27) +2

ЛЮБОМУ линуксоиду виндоуз мешает , Аноним (6), 13:00 , 12-Июл-22, (34) +5
А виндузоид не видел десктопа лучшего, чем XP , Аноним (45), 14:12 , 12-Июл-22, (44)

Это классика, это знать надо, Аноним (5), 14:36 , 12-Июл-22, (49)

Да знаю - синдром утёнка , Аноним (45), 14:46 , 12-Июл-22, (53) +1

Переходи на армянский алфавит Как не хочешь У тебя синдром утёнка Логика , Тот_Самый_Анонимус (?), 22:24 , 12-Июл-22, (84)

Это некрофилия а не классикаТупой ты баран , Конь Антон (?), 06:08 , 16-Июл-22, (159)

Кстати Я, старый линуксовод не помню XP, то есть перешёл до появления XP неда, Аноним (59), 16:47 , 12-Июл-22, (59) –1 //

В поддержанных неттопах Windows 7 есть, 11-я в новых Будь осторожен это начало п, Аноним (-), 18:36 , 12-Июл-22, (65) +1

Это что-то со скрижалей фанатиков , Тот_Самый_Анонимус (?), 22:25 , 12-Июл-22, (85)

Тебе M тогда исходники показывал ранней Венды , Аноним (45), 14:26 , 12-Июл-22, (46) //

Уж лучше чем у этой студенческой подделкиJust for fun Как говорится , Аноним (5), 14:38 , 12-Июл-22, (50) –3 //

Ну так показывал или фантазёр , Аноним (45), 14:43 , 12-Июл-22, (52) +1

На изучай сколько угодно хоть вин2000 хоть нт4magnet xt urn btih 66a26447f563c3, Аноним (63), 17:32 , 12-Июл-22, (63) +3 //

Лютое не нужно , Аноним (-), 18:37 , 12-Июл-22, (66) –1
Гораздо новее есть исходники, windows server 2003 , commiethebeastie (ok), 12:39 , 13-Июл-22, (118)

Это ты погорячился и просто не видел в Win3 x 9x их типа-кернелы - настолько раз, Аноним (-), 16:22 , 13-Июл-22, (134)

Очень интересно, и каким же образом это делается с учётом что ожидается некотора, Бывалый смузихлёб (?), 10:43 , 12-Июл-22, (16) //

Он ифдефов конечно же напихал Но ничего хорошего в этом нет имхо , Аноним (12), 10:54 , 12-Июл-22, (18) +2
Способ назван сломаным Exactly The initial code is broken, NAK P S At least yo, n00by (ok), 10:58 , 12-Июл-22, (20) +1
параллельный аппаратный компоратор, хотя тут есть один момент для строк вида, ab, Sw00p aka Jerom (?), 11:59 , 12-Июл-22, (23)
С помощью ifdef else , Аноним (45), 14:32 , 12-Июл-22, (47) –1

Осталось понять, что он там оптимизировал grep -R e __HAVE_ARCH_MEMCHR arch, n00by (ok), 11:11 , 12-Июл-22, (21)
Это же не реклама, зачем употребтять до Тем более, что в оригинале написано , Аноним (37), 13:30 , 12-Июл-22, (37) //

Каков радиус этого эраунда , Аноним (42), 13:41 , 12-Июл-22, (40) //

Это не важно, главное что центр в районе 4х, Аноним (37), 13:44 , 12-Июл-22, (41) //

Точно-точно центр Судя по цифрам из топика - это теоретический край , Аноним (42), 01:32 , 13-Июл-22, (87)

В 4 раза - что планируем получить Максимум 20 - мягко сказать, уже далеко не , Аноним (42), 13:40 , 12-Июл-22, (39) +3 //

С какого потолка взял Русским языком же написано пока не оценивался , какие бук, Аноним (37), 13:48 , 12-Июл-22, (43) –1 //

Эта тема обещает быть самой весёлой переписью экспертов If you fix the issue,, n00by (ok), 15:06 , 12-Июл-22, (57) –1
Перечитай сабж внимательно , Аноним (42), 01:33 , 13-Июл-22, (88) +1

Хоспадя Сами в 2022 году писать не умеют, так хоть бы списывать учились http , Аноним (56), 15:06 , 12-Июл-22, (56) –1 //

Эти тоже в Стэнфорде спионерили 1997-2005 Шон Эрон Андерсон https graphic, pavlinux (ok), 18:58 , 12-Июл-22, (68)

А зачем в новой реализации исходная строка указатель двигается , Аноним (61), 17:23 , 12-Июл-22, (61) +1 //

Имя автора северокорейского засланца прочитай и всё поймешь, Аноним (63), 17:34 , 12-Июл-22, (64) –1

code void memchr const void p, int c, size_t length u64 mask, val co, pavlinux (ok), 18:53 , 12-Июл-22, (67) //

Ну наверное для MEMCHR_MASK_GEN, Аноним (56), 22:35 , 12-Июл-22, (86)

Я уж испугался Думал на расте переписали и уделали Си , Аноним (71), 19:32 , 12-Июл-22, (71) +1
А я уж думал, что подобное давно оптимизировали Интересно, а компиляторы хотя б, qwe (??), 20:02 , 12-Июл-22, (75) +1 //

Давно оптимизировали Предлагаемый код пока вообще не работает -Wno-strin, n00by (ok), 10:33 , 13-Июл-22, (100) //

И как сие работает Сдается мне, что эта опция совсем не для этого Я имею ввиду, qwe (??), 15:26 , 13-Июл-22, (131) //

Да, опция для другого Задействованный механизм позволяет иногда оптимизировать , n00by (ok), 19:40 , 13-Июл-22, (138)

Чуть лучше, только если строка - это константа Что же касается строкиstrlen s , qwe (??), 20:38 , 13-Июл-22, (140)

Мне не очевидно, даже не знаю, когда такое может потребоваться и почему в реальн, n00by (ok), 17:28 , 14-Июл-22, (149)

Что если длина строки 2 а память, где хранится строка, перед этим была обнулена , qwe (??), 18:43 , 14-Июл-22, (153)

Вот поэтому и пишу в реальной задаче Могу придумать гипотетическую задачу, гд, n00by (ok), 06:33 , 15-Июл-22, (154)

Я спрашиваю про конкретную оптимизацию при использовании конкретной функции из с, qwe (??), 13:16 , 15-Июл-22, (155) +1

А я увидел человека, кто не может сгенерировать ассемблерный листинг и изучить е, n00by (ok), 07:17 , 16-Июл-22, (160)

А если человек сгенерировал, изучил, но вам не доложил, как вы его отличите от т, qwe (??), 12:31 , 16-Июл-22, (161) +1

Очень просто - априори я верю человеку на слово Если он пишет Интересно, а ком, n00by (ok), 13:18 , 16-Июл-22, (162)

По мне, слишком редкая операция - сравнение длины строки с заранее известной кон, Аноним (141), 20:59 , 13-Июл-22, (141)

Сколько раз в секунду ядро линукса ищет символ в массиве Чисто для понимания,, Атон (?), 20:03 , 12-Июл-22, (76) +1 //

В файловых системах должна часто использоваться Например, для поиска отсутстви, Аноним (-), 20:28 , 12-Июл-22, (78) //

Теперь прикиньте длину среднего имени файла и затраты на подготовку его быстрой , n00by (ok), 10:09 , 13-Июл-22, (99) //

Теоретик, ты даже не знаешь какие затраты Насколько затраты больше, чем побайто, Аноним (-), 10:55 , 13-Июл-22, (103)

Конечно, не знаю Пока есть два нерабочих варианта быстрой функции , и один Ано, n00by (ok), 11:46 , 13-Июл-22, (107)

Теоретик, как раз на нем REP SCASB или другие стрковые инструкции с префиксом RE, Аноним (-), 12:01 , 13-Июл-22, (110)

Ну то есть цифр никаких так и нет, один трындёж , n00by (ok), 13:34 , 13-Июл-22, (124)

Если бы анонимный эксперт отвечал за свои слова, то поиск в тексте ext4 выдал бы, n00by (ok), 11:53 , 13-Июл-22, (109) //

Спасибо, что отвечаешь за мои слова, а то было лень искать примеры , Аноним (-), 12:05 , 13-Июл-22, (112) +1

Отвечаю Вы, сударь, пустозвон memchr_inv - Find an unmatching character in a, n00by (ok), 13:29 , 13-Июл-22, (123)

кстати, оптимизированный, не побайтовый, Аноним (-), 13:46 , 13-Июл-22, (126)

Логика в чем по твоему Если каждое звено по отдельности не в носит существенног, thhh (?), 07:04 , 13-Июл-22, (91)
Это просто чувак захотел стать знаменитым Там стоит почитать ответы Он как бы , n00by (ok), 10:05 , 13-Июл-22, (98) //

20 лет никто не замечал что код не работает этим не рабочим кодом никто не поль, Атон (?), 21:36 , 13-Июл-22, (142) +1 //

Пишу же - там читайте ответы Исходная - в смысле в предлагаемом ускорении был, n00by (ok), 17:40 , 14-Июл-22, (151)
Вся суть линукса в одной фразе, Аноним (163), 14:06 , 16-Июл-22, (163)

Вся суть анонимных экспертов Код не видели, ничего не поняли, но уже что-то мня, n00by (ok), 14:39 , 16-Июл-22, (164)

Fedora 36 uname -aLinux 5 18 10-200 fc36 x86_64 1 SMP PREEMPT_DYNAMIC Thu Jul 7, Аноним (77), 20:21 , 12-Июл-22, (77)
Хмм А что интенсивный поиск в больших строках в ядре делает Ну, если экзотическ, _kp (ok), 21:00 , 12-Июл-22, (80)
Да, растишке такое и не снилось , кубрик (?), 22:04 , 12-Июл-22, (83)
чот я не нашёл профита a outARRAY SIZE 1048576LIB 20754NEW 25628 code , pavlinux (ok), 12:02 , 13-Июл-22, (111) //

Что с чем сравниваешь При чем тут ядро линукс Угадай с 3 раз, какая в glibc реал, Аноним (-), 12:12 , 13-Июл-22, (114) //

Да пофиг, быстрее и всё , pavlinux (ok), 12:26 , 13-Июл-22, (116) //

Согласен, надо glibc запихать в ядро , Аноним (-), 12:30 , 13-Июл-22, (117)

Не, просто поступил запрос на возможность впаять эту фичу в юзерспейс Чтоб, pavlinux (ok), 12:44 , 13-Июл-22, (119)

Облом, кто-то оказался шустрее В musl такая же пословная реализация memchr, врод, Аноним (-), 12:53 , 13-Июл-22, (121)

Если чего ещё не нашли - они там ускоряют drivers misc lkdtm heap c то есть во, n00by (ok), 14:34 , 13-Июл-22, (130) +1 //

printk выкинули бы, вот это был бы профит , pavlinux (ok), 00:17 , 14-Июл-22, (146) //

Я вообще в шоке А если партия даст миллиону китайцев задание отправить такие, n00by (ok), 17:38 , 14-Июл-22, (150)

Я посмотрел код, непонятная магия сравнения байта со словом, если кто может, объ, Непростое кино (?), 22:38 , 13-Июл-22, (143) //

Вот тут почитай https graphics stanford edu seander bithacks html ValueInWor, pavlinux (ok), 23:48 , 13-Июл-22, (145) +3
На русском есть книга Генри С Уоррен мл Алгоритмические трюки для программист, n00by (ok), 17:53 , 14-Июл-22, (152)

Сообщения [Сортировка по времени | RSS]

8. "Для ядра Linux предложена реализация функции memchr, работаю..." –7 +/–

Сообщение от n00by (ok), 12-Июл-22, 10:06

Оно и оптимизировано уже более 10 лет. Называется аппаратная предвыборка данных (prefetch). Почему заявивший "The optimized "memchr()" is nearly 4x faster than the original one for long strings" не знает, что на больших блоках узким местом является скорость чтения из памяти - это другой вопрос.

Ответить | Правка | Наверх | Cообщить модератору

10. "Для ядра Linux предложена реализация функции memchr, работаю..." +6 +/–

Сообщение от _hide_ (ok), 12-Июл-22, 10:11

Вы немного ошибаетесь. Никакие prefetch и прочие не избавят числодробилку от побайтового перебора. Ну да, память надо прочитать и загнать в кэш, но никто не говорит, что ядро стало работать в 4 раза быстрее, просто -1 узкий момент.

Ответить | Правка | Наверх | Cообщить модератору

14. "Для ядра Linux предложена реализация функции memchr, работаю..." –1 +/–

Сообщение от n00by (ok), 12-Июл-22, 10:24

А ещё я немного смотрю, чего оно там числодробит:
        nl = memchr(line, '\n', end - buffer);

Ответить | Правка | Наверх | Cообщить модератору

158. "Для ядра Linux предложена реализация функции memchr, работаю..." +/–

Сообщение от Аноним (158), 16-Июл-22, 02:09

Сразу видно человека не разбирающегося в теме

Ответить | Правка | К родителю #10 | Наверх | Cообщить модератору

29. "Для ядра Linux предложена реализация функции memchr, работаю..." +2 +/–

Сообщение от Аноним (-), 12-Июл-22, 12:51

Когда-то давно сравнивал свою реализацию strlen (это почти memchr, только чуть другой)
Побайтовый наивный алгоритм проиграл по скорости около 4 раз 8-байтовому. Еще написал не совсем правильный sse-алгоритм, он еще в 1.5-2 раза быстрее.
Это к разговору про скорость подсистемы памяти.

Ответить | Правка | К родителю #8 | Наверх | Cообщить модератору

35. "Для ядра Linux предложена реализация функции memchr, работаю..." –2 +/–

Сообщение от n00by (ok), 12-Июл-22, 13:13

То есть не догадались посчитать теоретический предел чтения из памяти и сравнить с ним результаты измерений? Это к разговору об измерениях. Про год и тип процессора не спрашиваю, как и про использование команды prefetchnta.

Ответить | Правка | Наверх | Cообщить модератору

48. "Для ядра Linux предложена реализация функции memchr, работаю..." –3 +/–

Сообщение от Аноним (48), 12-Июл-22, 14:34

>Называется аппаратная предвыборка данных (prefetch).
А в Эльбрусах, Итаниках и прочих VLIW такой есть?

Ответить | Правка | К родителю #8 | Наверх | Cообщить модератору

54. "Для ядра Linux предложена реализация функции memchr, работаю..." –1 +/–

Сообщение от n00by (ok), 12-Июл-22, 14:49

Попробуйте дочитать моё сообщение до конца - там вся суть. Что касается вопроса, если нет аппаратной предвыборки - можно обеспечить программную, как делали раньше на IA32. Для этого есть либо специальная команда, либо читают память с шагом равным размеру линейки кеша.

Ответить | Правка | Наверх | Cообщить модератору

89. "Для ядра Linux предложена реализация функции memchr, работаю..." +/–

Сообщение от Аноним (-), 13-Июл-22, 03:25

> Называется аппаратная предвыборка данных (prefetch).
Интересно, а как предвыборка может изменить тот факт что телепать по 1 байту за раз вместо 4 означает в 4 раза больше инструкций на это самое? Инструкции все моментально чтоли выполняются, такты не занимают? Без предвыборки вы еще и память бонусом к этому дофигища подождете. И там упоминабтся строки до 512 байтов, чтоли. Это наверное не настолько ужасно?

Ответить | Правка | К родителю #8 | Наверх | Cообщить модератору

92. "Для ядра Linux предложена реализация функции memchr, работаю..." +1 +/–

Сообщение от n00by (ok), 13-Июл-22, 09:16

> И там упоминабтся строки до 512 байтов, чтоли.
Для недочитавших моё сообщение повторяю цитату автора "for long strings". Большая строка - это не 512 байт. В современных реалиях это, должно быть, гигабайты. Разницу скорости чтения из кеша и ОЗУ ищите сами. Чувак копировал пояснения из копии Агнер Фога или Генри Уоррена и не усёк этот нюанс, ему простительно. ;)
> Интересно, а как предвыборка может изменить тот факт что телепать по 1
> байту за раз вместо 4 означает в 4 раза больше инструкций
> на это самое? Инструкции все моментально чтоли выполняются, такты не занимают?
А подготовительные операции мы не считаем, зачем это - вдруг разрушит нашу стройную гипотезу. И статистику по длине строк не собрали. Просто голословно посчитаем себя умнее автора существующей реализации через REP SCASB, но напишем про это не ему, а вот тут.

Ответить | Правка | Наверх | Cообщить модератору

105. "Для ядра Linux предложена реализация функции memchr, работаю..." +/–

Сообщение от Аноним (-), 13-Июл-22, 11:19

> REP SCASB
Насколько помню, этот вариант проиграл варианту на (условных) переходах.
Продолжай теоретизировать.

Ответить | Правка | Наверх | Cообщить модератору

106. "Для ядра Linux предложена реализация функции memchr, работаю..." +/–

Сообщение от n00by (ok), 13-Июл-22, 11:30

>> REP SCASB
> Насколько помню, этот вариант проиграл варианту на (условных) переходах.
Как бы не важно, кто и что там якобы помнит, когда вот код из реального мира:

#ifdef __HAVE_ARCH_MEMCHR
void *memchr(const void *cs, int c, size_t count)
{
    int d0;
    void *res;
    if (!count)
        return NULL;
    asm volatile("repne\n\t"
        "scasb\n\t"
        "je 1f\n\t"
        "movl $1,%0\n"
        "1:\tdecl %0"
        : "=D" (res), "=&c" (d0)
        : "a" (c), "0" (cs), "1" (count)
        : "memory");
    return res;
}
EXPORT_SYMBOL(memchr);
#endif
> Продолжай теоретизировать.
Гипотетически Аноним уделал разрабов ядра, а практически он сравнивает свой воображаемый мега-код с "ускорением в 4 раза", которое уже дважды отклонили, как нерабочее.

Ответить | Правка | Наверх | Cообщить модератору

108. "Для ядра Linux предложена реализация функции memchr, работаю..." +/–

Сообщение от Аноним (-), 13-Июл-22, 11:49

Это было сказано про мое сравнение реализаций strlen.
В ядре линукс мало кого интересует производительность, особенно мало используемых дублирующих функций.
Специально искал этот допотопный memscan?

Ответить | Правка | Наверх | Cообщить модератору

113. "Для ядра Linux предложена реализация функции memchr, работаю..." +/–

Сообщение от n00by (ok), 13-Июл-22, 12:06

> Это было сказано про мое сравнение реализаций strlen.
Нет никакого сравнения: ни цифр, ни подробностей о железе.
> В ядре линукс мало кого интересует производительность, особенно мало используемых дублирующих
> функций.
А на самом деле анонимный эксперт не осилил поискать __HAVE_ARCH_MEMCHR
> Специально искал этот допотопный memscan?
Да, специально искал и нашёл memchr. Тема же про memchr. ;)

Ответить | Правка | Наверх | Cообщить модератору

115. "Для ядра Linux предложена реализация функции memchr, работаю..." +/–

Сообщение от Аноним (-), 13-Июл-22, 12:17

> __HAVE_ARCH_MEMCHR
производительностью которого заинтересовались и предлагают варианты.

Ответить | Правка | Наверх | Cообщить модератору

127. "Для ядра Linux предложена реализация функции memchr, работаю..." +/–

Сообщение от n00by (ok), 13-Июл-22, 13:49

Пока нет никаких измерений производительности. С какой целью Вы упорно пишете чушь в ответ на мои сообщения? Вы ещё вчера хотели вернуться к своим баранам.

Ответить | Правка | Наверх | Cообщить модератору

144. "Для ядра Linux предложена реализация функции memchr, работаю..." +/–

Сообщение от ммнюмнюмус (?), 13-Июл-22, 22:46

Может, он и там тупил, ну они его и того?

Ответить | Правка | Наверх | Cообщить модератору

132. "Для ядра Linux предложена реализация функции memchr, работаю..." +/–

Сообщение от Аноним (-), 13-Июл-22, 16:15

> Для недочитавших моё сообщение повторяю цитату автора "for long strings". Большая строка
> - это не 512 байт. В современных реалиях это, должно быть, гигабайты.
Я что-то не уверен что ядро в принципе таким оперирует. Там длинное это наверное PATH_MAX какой-нибудь. Хоть я и не смотрел какой там наихучший случай конечно.
> Разницу скорости чтения из кеша и ОЗУ ищите сами.
Спасибо, Капитан Очевидность.
> А подготовительные операции мы не считаем, зачем это - вдруг разрушит нашу
> стройную гипотезу.
Ну, э, подготовительные операции или нет, а по эн байтов за раз обычно эффективнее чем по одному.
> И статистику по длине строк не собрали. Просто голословно
> посчитаем себя умнее автора существующей реализации через REP SCASB,
Ммм а как сие на ARM и RISCV?
> но напишем про это не ему, а вот тут.
Ага. Усомнившись в некоторых аспектах спича. И автор наверное все же не полный рак и побенчил свое добро? И что там реально будет лучше - ну я не настолько хорошо все варианты микроархитектур x86 знаю чтобы рассуждать чего в каком случае лучше и для кого из подвидов.

Ответить | Правка | К родителю #92 | Наверх | Cообщить модератору

139. "Для ядра Linux предложена реализация функции memchr, работаю..." +/–

Сообщение от n00by (ok), 13-Июл-22, 20:05

>> Для недочитавших моё сообщение повторяю цитату автора "for long strings". Большая строка
>> - это не 512 байт. В современных реалиях это, должно быть, гигабайты.
> Я что-то не уверен что ядро в принципе таким оперирует.
Разумеется, не оперирует. Но автор написал long. Вспоминаем определение кеш-памяти - это маленькая быстрая память. Значит не попадает в кеш.
> Там длинное
> это наверное PATH_MAX какой-нибудь. Хоть я и не смотрел какой там
> наихучший случай конечно.
Там ускоряют drivers/misc/lkdtm/heap.c
то есть вот это:
    if (memchr(val, 0xAB, 512) == NULL) {
        pr_info("Memory appears initialized (%x, no earlier values)\n", *val);
    } else {
        pr_err("FAIL: Slab was not initialized\n");
        pr_expected_config_param(CONFIG_INIT_ON_ALLOC_DEFAULT_ON, "init_on_alloc");
    }
...
    if (memchr(val, 0xAB, PAGE_SIZE) == NULL) {
        pr_info("Memory appears initialized (%x, no earlier values)\n", *val);
    } else {
        pr_err("FAIL: Slab was not initialized\n");
        pr_expected_config_param(CONFIG_INIT_ON_ALLOC_DEFAULT_ON, "init_on_alloc");
    }
>> Разницу скорости чтения из кеша и ОЗУ ищите сами.
> Спасибо, Капитан Очевидность.
>> А подготовительные операции мы не считаем, зачем это - вдруг разрушит нашу
>> стройную гипотезу.
> Ну, э, подготовительные операции или нет, а по эн байтов за раз
> обычно эффективнее чем по одному.
На одном байте особенно эффективно будет, ага.
Assembly/Compiler Coding Rule 5. (MH impact, MH generality) Selectively inline a function if
doing so decreases code size or if the function is small and the call site is frequently executed.
Assembly/Compiler Coding Rule 8. (ML impact, ML generality) Favor inlining small functions that
contain branches with poor prediction rates. If a branch misprediction results in a RETURN being
prematurely predicted as taken, a performance penalty may be incurred.
>> И статистику по длине строк не собрали. Просто голословно
>> посчитаем себя умнее автора существующей реализации через REP SCASB,
> Ммм а как сие на ARM и RISCV?
$ grep -R "e __HAVE_ARCH_MEMCHR" *
arch/powerpc/include/asm/string.h:#define __HAVE_ARCH_MEMCHR
arch/s390/include/asm/string.h:#define __HAVE_ARCH_MEMCHR    /* inline & arch function */
arch/arm/include/asm/string.h:#define __HAVE_ARCH_MEMCHR
arch/alpha/include/asm/string.h:#define __HAVE_ARCH_MEMCHR
arch/x86/include/asm/string_32.h:#define __HAVE_ARCH_MEMCHR
arch/arm64/include/asm/string.h:#define __HAVE_ARCH_MEMCHRuProf
arch/sh/include/asm/string_32.h:#define __HAVE_ARCH_MEMCHR
>> но напишем про это не ему, а вот тут.
> Ага. Усомнившись в некоторых аспектах спича. И автор наверное все же не
> полный рак и побенчил свое добро? И что там реально будет
> лучше - ну я не настолько хорошо все варианты микроархитектур x86
> знаю чтобы рассуждать чего в каком случае лучше и для кого
> из подвидов.
Как бы он это сделал? Вот реально, без синтетики. С тех пор как AMD CodeAnalyst превратился в uProf, не понятно, как симулировать исполнение и посмотреть что там сколько занимает в тактах.

Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема

Партнёры:

Хостинг:

Закладки на сайте
Проследить за страницей

Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру


	8. "Для ядра Linux предложена реализация функции memchr, работаю..."	–7 +/–
	Сообщение от n00by (ok), 12-Июл-22, 10:06
	Оно и оптимизировано уже более 10 лет. Называется аппаратная предвыборка данных (prefetch). Почему заявивший "The optimized "memchr()" is nearly 4x faster than the original one for long strings" не знает, что на больших блоках узким местом является скорость чтения из памяти - это другой вопрос.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	10. "Для ядра Linux предложена реализация функции memchr, работаю..."	+6 +/–
	Сообщение от _hide_ (ok), 12-Июл-22, 10:11
	Вы немного ошибаетесь. Никакие prefetch и прочие не избавят числодробилку от побайтового перебора. Ну да, память надо прочитать и загнать в кэш, но никто не говорит, что ядро стало работать в 4 раза быстрее, просто -1 узкий момент.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	14. "Для ядра Linux предложена реализация функции memchr, работаю..."	–1 +/–
	Сообщение от n00by (ok), 12-Июл-22, 10:24
	А ещё я немного смотрю, чего оно там числодробит: nl = memchr(line, '\n', end - buffer);
	Ответить \| Правка \| Наверх \| Cообщить модератору


	158. "Для ядра Linux предложена реализация функции memchr, работаю..."	+/–
	Сообщение от Аноним (158), 16-Июл-22, 02:09
	Сразу видно человека не разбирающегося в теме
	Ответить \| Правка \| К родителю #10 \| Наверх \| Cообщить модератору


	29. "Для ядра Linux предложена реализация функции memchr, работаю..."	+2 +/–
	Сообщение от Аноним (-), 12-Июл-22, 12:51
	Когда-то давно сравнивал свою реализацию strlen (это почти memchr, только чуть другой) Побайтовый наивный алгоритм проиграл по скорости около 4 раз 8-байтовому. Еще написал не совсем правильный sse-алгоритм, он еще в 1.5-2 раза быстрее. Это к разговору про скорость подсистемы памяти.
	Ответить \| Правка \| К родителю #8 \| Наверх \| Cообщить модератору


	35. "Для ядра Linux предложена реализация функции memchr, работаю..."	–2 +/–
	Сообщение от n00by (ok), 12-Июл-22, 13:13
	То есть не догадались посчитать теоретический предел чтения из памяти и сравнить с ним результаты измерений? Это к разговору об измерениях. Про год и тип процессора не спрашиваю, как и про использование команды prefetchnta.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	48. "Для ядра Linux предложена реализация функции memchr, работаю..."	–3 +/–
	Сообщение от Аноним (48), 12-Июл-22, 14:34
	>Называется аппаратная предвыборка данных (prefetch). А в Эльбрусах, Итаниках и прочих VLIW такой есть?
	Ответить \| Правка \| К родителю #8 \| Наверх \| Cообщить модератору


	54. "Для ядра Linux предложена реализация функции memchr, работаю..."	–1 +/–
	Сообщение от n00by (ok), 12-Июл-22, 14:49
	Попробуйте дочитать моё сообщение до конца - там вся суть. Что касается вопроса, если нет аппаратной предвыборки - можно обеспечить программную, как делали раньше на IA32. Для этого есть либо специальная команда, либо читают память с шагом равным размеру линейки кеша.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	89. "Для ядра Linux предложена реализация функции memchr, работаю..."	+/–
	Сообщение от Аноним (-), 13-Июл-22, 03:25
	> Называется аппаратная предвыборка данных (prefetch). Интересно, а как предвыборка может изменить тот факт что телепать по 1 байту за раз вместо 4 означает в 4 раза больше инструкций на это самое? Инструкции все моментально чтоли выполняются, такты не занимают? Без предвыборки вы еще и память бонусом к этому дофигища подождете. И там упоминабтся строки до 512 байтов, чтоли. Это наверное не настолько ужасно?
	Ответить \| Правка \| К родителю #8 \| Наверх \| Cообщить модератору


	92. "Для ядра Linux предложена реализация функции memchr, работаю..."	+1 +/–
	Сообщение от n00by (ok), 13-Июл-22, 09:16
	> И там упоминабтся строки до 512 байтов, чтоли. Для недочитавших моё сообщение повторяю цитату автора "for long strings". Большая строка - это не 512 байт. В современных реалиях это, должно быть, гигабайты. Разницу скорости чтения из кеша и ОЗУ ищите сами. Чувак копировал пояснения из копии Агнер Фога или Генри Уоррена и не усёк этот нюанс, ему простительно. ;) > Интересно, а как предвыборка может изменить тот факт что телепать по 1 > байту за раз вместо 4 означает в 4 раза больше инструкций > на это самое? Инструкции все моментально чтоли выполняются, такты не занимают? А подготовительные операции мы не считаем, зачем это - вдруг разрушит нашу стройную гипотезу. И статистику по длине строк не собрали. Просто голословно посчитаем себя умнее автора существующей реализации через REP SCASB, но напишем про это не ему, а вот тут.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	105. "Для ядра Linux предложена реализация функции memchr, работаю..."	+/–
	Сообщение от Аноним (-), 13-Июл-22, 11:19
	> REP SCASB Насколько помню, этот вариант проиграл варианту на (условных) переходах. Продолжай теоретизировать.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	106. "Для ядра Linux предложена реализация функции memchr, работаю..."	+/–
	Сообщение от n00by (ok), 13-Июл-22, 11:30
	>> REP SCASB > Насколько помню, этот вариант проиграл варианту на (условных) переходах. Как бы не важно, кто и что там якобы помнит, когда вот код из реального мира: #ifdef __HAVE_ARCH_MEMCHR void memchr(const void cs, int c, size_t count) { int d0; void *res; if (!count) return NULL; asm volatile("repne\n\t" "scasb\n\t" "je 1f\n\t" "movl $1,%0\n" "1:\tdecl %0" : "=D" (res), "=&c" (d0) : "a" (c), "0" (cs), "1" (count) : "memory"); return res; } EXPORT_SYMBOL(memchr); #endif > Продолжай теоретизировать. Гипотетически Аноним уделал разрабов ядра, а практически он сравнивает свой воображаемый мега-код с "ускорением в 4 раза", которое уже дважды отклонили, как нерабочее.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	108. "Для ядра Linux предложена реализация функции memchr, работаю..."	+/–
	Сообщение от Аноним (-), 13-Июл-22, 11:49
	Это было сказано про мое сравнение реализаций strlen. В ядре линукс мало кого интересует производительность, особенно мало используемых дублирующих функций. Специально искал этот допотопный memscan?
	Ответить \| Правка \| Наверх \| Cообщить модератору


	113. "Для ядра Linux предложена реализация функции memchr, работаю..."	+/–
	Сообщение от n00by (ok), 13-Июл-22, 12:06
	> Это было сказано про мое сравнение реализаций strlen. Нет никакого сравнения: ни цифр, ни подробностей о железе. > В ядре линукс мало кого интересует производительность, особенно мало используемых дублирующих > функций. А на самом деле анонимный эксперт не осилил поискать __HAVE_ARCH_MEMCHR > Специально искал этот допотопный memscan? Да, специально искал и нашёл memchr. Тема же про memchr. ;)
	Ответить \| Правка \| Наверх \| Cообщить модератору


	115. "Для ядра Linux предложена реализация функции memchr, работаю..."	+/–
	Сообщение от Аноним (-), 13-Июл-22, 12:17
	> __HAVE_ARCH_MEMCHR производительностью которого заинтересовались и предлагают варианты.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	127. "Для ядра Linux предложена реализация функции memchr, работаю..."	+/–
	Сообщение от n00by (ok), 13-Июл-22, 13:49
	Пока нет никаких измерений производительности. С какой целью Вы упорно пишете чушь в ответ на мои сообщения? Вы ещё вчера хотели вернуться к своим баранам.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	144. "Для ядра Linux предложена реализация функции memchr, работаю..."	+/–
	Сообщение от ммнюмнюмус (?), 13-Июл-22, 22:46
	Может, он и там тупил, ну они его и того?
	Ответить \| Правка \| Наверх \| Cообщить модератору


	132. "Для ядра Linux предложена реализация функции memchr, работаю..."	+/–
	Сообщение от Аноним (-), 13-Июл-22, 16:15
	> Для недочитавших моё сообщение повторяю цитату автора "for long strings". Большая строка > - это не 512 байт. В современных реалиях это, должно быть, гигабайты. Я что-то не уверен что ядро в принципе таким оперирует. Там длинное это наверное PATH_MAX какой-нибудь. Хоть я и не смотрел какой там наихучший случай конечно. > Разницу скорости чтения из кеша и ОЗУ ищите сами. Спасибо, Капитан Очевидность. > А подготовительные операции мы не считаем, зачем это - вдруг разрушит нашу > стройную гипотезу. Ну, э, подготовительные операции или нет, а по эн байтов за раз обычно эффективнее чем по одному. > И статистику по длине строк не собрали. Просто голословно > посчитаем себя умнее автора существующей реализации через REP SCASB, Ммм а как сие на ARM и RISCV? > но напишем про это не ему, а вот тут. Ага. Усомнившись в некоторых аспектах спича. И автор наверное все же не полный рак и побенчил свое добро? И что там реально будет лучше - ну я не настолько хорошо все варианты микроархитектур x86 знаю чтобы рассуждать чего в каком случае лучше и для кого из подвидов.
	Ответить \| Правка \| К родителю #92 \| Наверх \| Cообщить модератору


	139. "Для ядра Linux предложена реализация функции memchr, работаю..."	+/–
	Сообщение от n00by (ok), 13-Июл-22, 20:05
	>> Для недочитавших моё сообщение повторяю цитату автора "for long strings". Большая строка >> - это не 512 байт. В современных реалиях это, должно быть, гигабайты. > Я что-то не уверен что ядро в принципе таким оперирует. Разумеется, не оперирует. Но автор написал long. Вспоминаем определение кеш-памяти - это маленькая быстрая память. Значит не попадает в кеш. > Там длинное > это наверное PATH_MAX какой-нибудь. Хоть я и не смотрел какой там > наихучший случай конечно. Там ускоряют drivers/misc/lkdtm/heap.c то есть вот это: if (memchr(val, 0xAB, 512) == NULL) { pr_info("Memory appears initialized (%x, no earlier values)\n", val); } else { pr_err("FAIL: Slab was not initialized\n"); pr_expected_config_param(CONFIG_INIT_ON_ALLOC_DEFAULT_ON, "init_on_alloc"); } ... if (memchr(val, 0xAB, PAGE_SIZE) == NULL) { pr_info("Memory appears initialized (%x, no earlier values)\n", val); } else { pr_err("FAIL: Slab was not initialized\n"); pr_expected_config_param(CONFIG_INIT_ON_ALLOC_DEFAULT_ON, "init_on_alloc"); } >> Разницу скорости чтения из кеша и ОЗУ ищите сами. > Спасибо, Капитан Очевидность. >> А подготовительные операции мы не считаем, зачем это - вдруг разрушит нашу >> стройную гипотезу. > Ну, э, подготовительные операции или нет, а по эн байтов за раз > обычно эффективнее чем по одному. На одном байте особенно эффективно будет, ага. Assembly/Compiler Coding Rule 5. (MH impact, MH generality) Selectively inline a function if doing so decreases code size or if the function is small and the call site is frequently executed. Assembly/Compiler Coding Rule 8. (ML impact, ML generality) Favor inlining small functions that contain branches with poor prediction rates. If a branch misprediction results in a RETURN being prematurely predicted as taken, a performance penalty may be incurred. >> И статистику по длине строк не собрали. Просто голословно >> посчитаем себя умнее автора существующей реализации через REP SCASB, > Ммм а как сие на ARM и RISCV? $ grep -R "e __HAVE_ARCH_MEMCHR" * arch/powerpc/include/asm/string.h:#define __HAVE_ARCH_MEMCHR arch/s390/include/asm/string.h:#define __HAVE_ARCH_MEMCHR /* inline & arch function */ arch/arm/include/asm/string.h:#define __HAVE_ARCH_MEMCHR arch/alpha/include/asm/string.h:#define __HAVE_ARCH_MEMCHR arch/x86/include/asm/string_32.h:#define __HAVE_ARCH_MEMCHR arch/arm64/include/asm/string.h:#define __HAVE_ARCH_MEMCHRuProf arch/sh/include/asm/string_32.h:#define __HAVE_ARCH_MEMCHR >> но напишем про это не ему, а вот тут. > Ага. Усомнившись в некоторых аспектах спича. И автор наверное все же не > полный рак и побенчил свое добро? И что там реально будет > лучше - ну я не настолько хорошо все варианты микроархитектур x86 > знаю чтобы рассуждать чего в каком случае лучше и для кого > из подвидов. Как бы он это сделал? Вот реально, без синтетики. С тех пор как AMD CodeAnalyst превратился в uProf, не понятно, как симулировать исполнение и посмотреть что там сколько занимает в тактах.
	Ответить \| Правка \| Наверх \| Cообщить модератору