AVX-512 и RPCS3 вместе творят чудеса - 30% прирост производительности по сравнению с процессорами с AVX2

Разработчик эмулятора RPCS3 опубликовал подробный блог, в котором подчеркивается преимущество AVX-512 на современных процессорах. Сообщение в блоге помогает понять, как работает AVX-512 и чем он полезен для эмулятора для тех, кто хочет получить дополнительную производительность.

Блог был опубликован Whatcookie, одним из многих разработчиков проекта эмулятора RPCS3, и сравнивает, как AVX-512 помогает по сравнению со стандартными инструкциями AVX2. Вы можете прочитать полный блог здесь или, для простоты, основные преимущества AVX-512 заключаются в следующем:

  • Увеличенный регистровый файл
  • Новые формы старых инструкций
  • Регистры маски

Разработчик показывает, как все это помогает повысить производительность в RPCS3. Для тестирования использовался процессор Intel Core i9-12900K на частоте 5,2 ГГц с включенным AVX-512. Используя стандартные инструкции SSE2, игра показала только 5 кадров в секунду, а переход на SSE 4.1 дал огромный прирост 160 кадров в секунду. Утверждается, что причина этого связана с отсутствием инструкций SSSE3, которые необходимы для эмулятора PlayStation 3.

Переходя на AVX2/FMA, вы получаете дополнительный прирост производительности на 13%, а переходя с AVX2 на AVX-512, вы получаете прирост производительности на 30% до 242 кадров в секунду.

51
18
Комментарии: 18
Ваш комментарий

"Для тестирования использовался процессор Intel Core i9-12900K" LOL. Ну конечно, какой же ещё может быть.

О да, как много радости для рядового пользователя, без процессора i9 с поддержкой AVX-чётотам. Просто австралию открыли, сказав, что на более мощных процах эмулятор эмулирует лучше, чем на менее мощных

Тут дело скорее в том, как давно проц был выпущен. Так SSE 4.1 уже присутствует в процах, минимум с 2008 года. Разумеется частота/кол-во ядер процессора влияет, однако разница 5 и 160 FPS, больше про возможности SSE 4.1/AVX-512, в сравнении их более древним стандартом

Бесполезная информация. И так понятно что, нужен мощный проц и будет прирост.

А как Vulkan и FSR заставить работать лучше так уже "не могут" ! У меня такое ощущение они на зарплате сидят и пилят под одно железо, причем саму суть эмуляции не понимают "на любом железе" !

Стадо нубья удивляется, что мощный многоядерный процессор с поддержкой обработки массивов*структур по 512-бит даёт пропорциональный прирост производительности, но нам самом деле это действительно достижение и неочевидная вещь. Многопоточность вычислений — отдельная парадигма программирования со своими ограничениями и требованиями, и ни один компилятор в стоке не даст программу, которая будет работать на 100500 ядер. Как и поддержка AVX/FMA не предполагается из коробки для любого кода. Поэтому респект разработчикам, которые пишут так, что все фишки современных процов раскрываются по полной.

Разработки эмулятора не умеют во флаги компилятора? Какой дурак будет стоковые настройки использовать для чего-то сложнее калькулятора?

Какими флагами GCC добиться распараллеливания однопоточного кода в 8 -16 потоков?

Или обратный вопрос. Как добиться многопоточности с нереентерабельными функциями?

Либо на инструкции: как добиться использования SIMD в цикле с ветвлениями?

Так в Alder'ах же Intel выпускала заплатку которая отключает avx512... или то не интел был, а производители мат. плат.
Да тут и нижнего поколения хватит... с 9-го вроде пихали инструкции

Покупаешь старую мат плату, не обновляешь биос и всякие ME. Вуаля — у тебя есть avx-512 на 12 поколении. Либо покупай 11700к/11900к.

Проблема даже не в стоимости процессора, а в том что под современные видеокарты (даже топовые) процессор берут который её вывезет и это всегда значительно проще, чем то что на чём летают эмуляторы. Никто ведь не будет брать проц в 3 раза мощнее чем необходимо, ради игры на эмуляторе.