Shadow of the Tomb Raider

Лара, AMD и асинхронные вычисления

©

В 2016 году компания AMD программно с помощью драйвера отключила асинхронные вычисления на графических картах с архитектурой GCN 1.0. Таким образом, начиная с версии драйвера 16.9.2 графические карты с ядрами Oland, Tahiti, Pitcairn Cape, Verde, Curaçao (Radeon HD 7850, HD 7970, HD 7990, R9 270/270X, R9 280/280X и др.) не поддерживают асинхронные вычисления при работе с рендером API DirectX 12. При этом, аппаратно поддержка есть.
Компания AMD оправдывает данное решение тем, что первая версия архитектуры GCN плохо работает с асинхронными вычислениями, что в свою очередь не эффективно или даже идёт в ущерб производительности.

Асинхронные вычисления являются приоритетным решением для увеличения вычислительной мощности  в расчете графики c использованием API DirectX 12.

В целях определения необходимости использования асинхронных вычислений на графических картах с GCN 1.0 был выполнен небольшой тест на рендерах API DirectX 11 и API DirectX 12 в Shadow of the Tomb Raider с разными версиями драйверов:
16.9.1 (асинхронные вычисления включены)
18.8.2 (асинхронные вычисления выключены)
18.9.1 (оптимизирована работа данной игры) 

Конфигурация ПК:
ЦП: AMD FX 8320E
ГП: AMD (Sapphire) R9 270X (2ГБ)
ОЗУ: 2*4ГБ
ОС: Windows 10 Pro x64

Настройки игры:

Спойлер

Результаты теста оказались интересными:

DirectX 11 (баллы и FPS):
16.9.1 - 4662 (FPS 30) 
18.8.2 - 4782 (FPS 31)
18.9.1 - 4880 (FPS 32)

Спойлер

DirectX 12 (баллы и FPS):
18.8.2 - 4439 (FPS 28)
18.9.1 - 4501 (FPS 28)
16.9.1 - 5190 (FPS 33) 

Спойлер

Графические карты с архитектурой GCN 1.0 начиная с версии драйвера 16.9.2 работают с API DirectX 12 на уровне API DirectX 11.1.

Исходя их полученных результатов можно сделать несколько выводов.

Выводы (второстепенные):
     1. С более новыми драйверами наблюдается более высокая производительность при работе с API DirectX 11.
     2. Выпущенный драйвер версии 18.9.1, вносящий оптимизацию для игры, действительно немного увеличил производительность, по сравнению с драйвером 18.8.2.
     3. С использованием новых драйверов игра на рендере API DirectX 11 работает лучше, чем на API DirectX 12.

Вывод (основной):
При включении асинхронных вычислений, достигается максимальная производительность игры. Другими словами, с использованием драйвера 16.9.1 и API DirectX 12 игра имеет наибольшую частоту кадров.
Аппаратная поддержка асинхронных вычислений, реализованных для увеличения производительности, оправдывает себя, позволяя увеличить вычислительную мощность графического процессора.

Подобная тенденция с увеличением производительности при работе графических карт GCN 1.0 с использованием драйвера 16.9.1, скорее всего, будет наблюдаться во всех играх на API DirectX 12.

Компания AMD не очень хорошо поступила, программно отключив некоторые функции своих графических процессоров на архитектуре GCN 1.0, так как их наличие хоть и в малой степени, но оправдывают себя.

Brannan
об авторе
Пользователь пока ничего не написал о себе.
Нравится12
Комментарии (17)
  • maksik-haha #
    6
    Это давно понятно уже наверно всем что разрабы г@ндоныны
  • Grandshot #
    13
    Ну конечно производительность низкая будет, раз на фикусе тестируют. Тестировали бы ту же видеокарту на рязани, возможно и фпс бы играбельней был.
  • Brannan #
    9
    Grandshot
    Тема не о том, какая производительность у тестовой конфигурации.
    Основная идея в том, что новые драйвера для более старых видеокарт отключают некоторые особенности DirectX 12, что только ухудшает производительность.

    Конечно, был бы проц мощнее и видеокарта, то прирост был бы ещё больше.
  • Ruv1k #
    7
    Grandshot
    Grandshot написал:
    Ну конечно производительность низкая будет, раз на фикусе тестируют. Тестировали бы ту же видеокарту на рязани, возможно и фпс бы играбельней был.

    А ты явно не шаришь, да? Вот как раз для теста нужен вообще какой-нибудь Атлон.

    Brannan
    Brannan написал:
    Конечно, был бы проц мощнее и видеокарта, то прирост был бы ещё больше.

    И ты туда же.

    Вы оба вообще вкурсе что Mantle, DX12 и Vulkan разгружают ЦП и менее зависимы от него? Результаты может и будут выше, только разница между процами будет менее заметной чем на DX11.
  • X_ray_83 #
    5
    Brannan
    Пробуй более старые дрова мне кажется что можно выжать 38-40 фпс !
    Либо у тебя оперативка ddr3 1600 тут надо ddr3 1866/2133 сразу 5-7 фпс автоматом,
  • andy_ko44 #
    6
    Автору респект. Работа большая проделана. У меня правда 1060, но для кого-то будет и практическая польза.
    Вот пример реально полезного блога, а то "патч первого для вышел... возрадуйтесь" тьфу, мля.
  • Brannan #
    0
    Ruv1k
    То, что Mantle, Vulkan, DirectX 12 разгружают ЦП, перекладывая часть вычислений на ГП - это известно (я очень даже в курсе, хех). И даже видно на скринах под наименованием "ГП зависимость".
    Читая твоё сообщение, вижу, что ты согласился со мной по поводу прироста производительности при использовании более мощного проца, только добавил мнение о небольшом росте результатов. С таким мнением я согласен ещё до его появления.
  • Brannan #
    3
    X_ray_83
    Ещё более старые дрова, возможно, прироста не дадут. Так как из результатов видно, что с более новыми дровами игра чувствует себя лучше. Старые драйвера в данном случае взяты только из-за асинхронных вычислений.

    У меня DDR3 1866 МГц. И я тебе скажу, что разницу между 1600 МГц и 1866МГц не увидишь. 5-7 FPS плюсом оперативка не даст - слишком круто.
  • Ruv1k
    Тут не совсем корректно.DX12 проц разгружает, НО если идет поддержка не через железо а через драйвер (применительно ко всем картам зеленых 9ого поколения и старше) то работает видеокарта все равно "тише". Но 10м поколении - да там все ок.
    Кста еще и поэтому DX12 так "невхож" в люди. У большинства игроков на ПК производительность всегда упирается в видюху - проц хоть уразгружайся тольку нуль.
    У красных проще - у них HD5000-6000 вообще отсеклись нет там DX12, а все карты с HD 7000 - уже имеют прирост в DX12.
    Но блог к сожалению ниочем. При всем уважении к аффтару - ну показали вы что на 1!!! карте из семейства и на 1!! игре все работает типа хорошо, и чо? Один случай вообще ни разу не показатель. Я сильно сомневаюсь что АМД отключила эту опцию просто так - значит прецеденты реально были и компания сделала из этого выводы.
    Да и проблема 7000 и 200ого поколения не в том что там чет в драйвере отключили, а в том что тупо памяти всего 3-4 гектара. Это в первую очередь сейчас карты и "тормозит".
  • X_ray_83 #
    0
    Brannan
    На FX8320 дает от 1833/2100 особенно разгон по шине ! Проверенно неоднократно !
    Так же разгон видеокарты всегда дает +5фпс . Так что можно вытянуть эти 40фпс легко было б желание )))
  • X_ray_83 #
    1
    seriypes
    Это в первую очередь сейчас карты и "тормозит".
    Только в реальности 1060 3 гиг идет на равне с 970 3,5 гиг, память не решает на высоких настройках вообще !
  • Brannan #
    0
    X_ray_83
    Это уже речь про разгон компа.
    Идея данной темы про драйвера.
  • X_ray_83 #
    0
    Brannan
    FX8320е идет с пониженной частотой то есть меньше FX8300, куда уже меньше ?
    Е версию в стоке юзать это мрак не более !
    У игр сейчас требования FX8350 сравни частоту ! Потом подумай почему я тебе указал именно это.
    У тебя фпс в Dx11 практически равен Fx6300 при такой частоте а это ДНО называется (((
  • Brannan #
    0
    X_ray_83
    К чему весь этот разговор? Железо железом, а тема блога совсем о другом.
  • X_ray_83 #
    0
    Brannan
    К тому что в Dx11 проц ботлнечит а в Dx12 НЕТ ! Тесты с Dx11 на мусорку посмотри на максимальный фпс FX8320e на самых низких настройках и поймешь о чем я ))))
    У тебя тесты тупо с упором в CPU в Dx11 !
  • Vasek Vasekk #
    1
    Бред пишете теоретики ...О ДХ 12 который разгружает проц.

    Тестировал Девижку и Райз оф Томбрайдер(в геотермалке) спецом на старье - Феном 945 @3,6 с gtx 960 на ДХ 12 с залоченным фпс в 30 для наглядности (там все равно больше 33 фпс не выдавало).
    Проц ботлнечил в 100% на ДХ 11 но иногда все же переходил в 96%.
    На Дх 12 я думал ага сейчас будет 85-90% разгрузки и больше будет брать видяха.
    Ага болт там - большой и стальной.Та же фулл нагрузка 100% так еще и фризы.Толку никакого для слабого железа.Даже хуже бывало при резких поворотах камеры.
  • X_ray_83 #
    0
    Vasek Vasekk
    У тебя память значит ddr3 1333 или 1066 ! Вот тест там 40фпс средний в ларке 2015 года !
    Спойлер
B
i
u
Спойлер