The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Режим отображения отдельной подветви беседы [ Отслеживать ]

Оглавление

Компания AMD выпустила оптимизирующий C/C+ компилятор AOCC 1.0, opennews (??), 20-Май-17, (0) [смотреть все]

Сообщения [Сортировка по времени | RSS]


19. "Компания AMD выпустила оптимизирующий C/C+ компилятор AOCC 1..."  –2 +/
Сообщение от Аноним (-), 21-Май-17, 08:59 
Недавно задавал вопрос на форуме. Не на эту тему. И среди прочих вещей, узнал немного о векторизации в компиляторе GCC:

> Под neon, компилер часто генерит не слишком хороший код, и наибольший прирост утдаётся получить, написав на ассемблере. Но это сильно зависит от задачи. Но однозначно даже при просто компиляции, при включённой векторизации, если завекторизовалось нормально - будет быстрее. К сожалению с векторизацией в последних компиляторах как-то не очень, во времена gcc-3.x было повеселее. Ещё надо учитывать что многие инструкции neon требуют строгого выравнивания, и новый gcc (>= 4.x) если не может выровнять, кладёт болт. Если оптимизация важна, нужно вручную постараться через __attribute__. Там достаточно много тонкостей.
> Типичный случай - если gcc не знает заранее, что аргументы функции выровнены, он не будет векторизовать код с этими аргументами, их нужно специально маркировать, и иногда сплясать с бубном. Раньше это всё само делалось компилятором, но видать пришел кто-то умный и сказал, что так низзя и надо заставить народ работать.
>> If the selected floating-point hardware includes the NEON extension (e.g. -mfpu=‘neon’), note that floating-point operations are not generated by GCC’s auto-vectorization pass unless -funsafe-math-optimizations is also specified. This is because NEON hardware does not fully implement the IEEE 754 standard for floating-point arithmetic (in particular denormal values are treated as zero), so the use of NEON instructions may lead to a loss of precision.
> Векторизация перпендикулярна floating point, но да, и это тоже. Когда я этим активно занимался всё было гораздо проще - включаешь neon и векторизацию и получаешь ускорение в 5 раз на 1-ядерном Cortex-A8. Сейчас уже всё не так. Консерваторы, блин.

Ответить | Правка | Наверх | Cообщить модератору

22. "Компания AMD выпустила оптимизирующий C/C+ компилятор AOCC 1..."  +/
Сообщение от Аноним (-), 21-Май-17, 11:01 
"Векторизация перпендикулярна floating point" - спецы, б**ь
Ответить | Правка | Наверх | Cообщить модератору

35. "Компания AMD выпустила оптимизирующий C/C+ компилятор AOCC 1..."  +/
Сообщение от Vkni (ok), 21-Май-17, 16:19 
> "Векторизация перпендикулярна floating point" - спецы, б**ь

А что - нет?

Ответить | Правка | Наверх | Cообщить модератору

48. "Компания AMD выпустила оптимизирующий C/C+ компилятор AOCC 1..."  +/
Сообщение от Аноним (-), 21-Май-17, 22:24 
>> "Векторизация перпендикулярна floating point" - спецы, б**ь
> А что - нет?

Вообще-то, FP-вычисления, особенно в циклах, векторизуются в первую очередь и наиболее эффективно. А вот с целочисленными вычислениями с их изменяющейся шириной и обилием экзотических операций типа сдвига на runtime-величину зачастую возникают проблемы и эффективность падает.

Ответить | Правка | Наверх | Cообщить модератору

54. "Компания AMD выпустила оптимизирующий C/C+ компилятор AOCC 1..."  +/
Сообщение от Vkni (ok), 21-Май-17, 23:12 
> Вообще-то, FP-вычисления, особенно в циклах, векторизуются в первую очередь и наиболее
> эффективно. А вот с целочисленными вычислениями с их изменяющейся шириной и
> обилием экзотических операций типа сдвига на runtime-величину зачастую возникают проблемы
> и эффективность падает.

Ну да, не совсем перпендикулярна.

Ответить | Правка | Наверх | Cообщить модератору

47. "Компания AMD выпустила оптимизирующий C/C+ компилятор AOCC 1..."  +/
Сообщение от Аноним (-), 21-Май-17, 22:17 
> К сожалению с векторизацией в последних компиляторах как-то не очень, во времена gcc-3.x было повеселее.

Векторизация появилась только в 4.x. Первая версия в 4.0, но более-менее юзабельная заметно позже, где-то после 4.2.

Ответить | Правка | К родителю #19 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру