оптимизация под SSE и 3DNow
Написал математическую библиотеку под SSE и 3DNow, но результат не может радовать, потому что скорость некоторых операйий (например, сложение векторов) мало отличается от скорости на FPU (процессор: Athlon XP). Может кто-нибудь имел опыт написания подобных приложений и знает, в чём лаг?
Цитата:
Originally posted by alexeyvnikitin
Написал математическую библиотеку под SSE и 3DNow, но результат не может радовать, потому что скорость некоторых операйий (например, сложение векторов) мало отличается от скорости на FPU (процессор: Athlon XP). Может кто-нибудь имел опыт написания подобных приложений и знает, в чём лаг?
Написал математическую библиотеку под SSE и 3DNow, но результат не может радовать, потому что скорость некоторых операйий (например, сложение векторов) мало отличается от скорости на FPU (процессор: Athlon XP). Может кто-нибудь имел опыт написания подобных приложений и знает, в чём лаг?
IA-32 Intel® Architecture Optimization(Reference Manual) с сайта интела - там все написано, а где узкие места в твоей либе смотри профайлером, VTune например.