Intel C++ Compiler 11.0 and Intrinsics
Используя ICL 11.0 for Linux вдруг обнаружил значительное замедление по таймингу при использовании SSE-векторизации (manual) по сравнению с версией 10, но под Windows. Оказалось что соотв. SSE-интринсики не инлайнятся, -opt-report специфицирует их как EXTERNAL(?). Работаю удаленно и не могу посмотреть что там реально в коде, хотя под виндами дизассемблерный код для MS VC & Intel 10.0 был вполне нормальный - инлайный.
Не подскажет ли кто-нибудь, чего там компилятору не хватает? Может какой-нибудь библиотеки?
И можно ли как-то посмотреть дизассемблерный код в терминальном режиме?
:confused: