Обзор AMD Radeon RX 480 8GB. Часть 1

Краткое содержание статьи:Видеокарта Radeon RX 480, построенная на базе новой архитектуры Polaris 10, претендует на звание лучшего игрового ускорителя в сегменте среднего класса и способна полноценно взаимодействовать с гарнитурами виртуальной реальности.

Восемь месяцев назад AMD начала раскрывать возможности GPU следующего поколения, начав с обновлённого контроллера дисплея с поддержкой HDMI 2.0b и DisplayPort 1.3 HBR3, FreeSync по HDMI и HDR-совместимый конвейер. Позже стала появляться дополнительная информация, в которой говорилось о выпуске двух разных GPU, один из которых разработан специально для рынка массовых настольных систем, а другой для мобильных решений, предлагающих производительность уровня консолей в тонких и лёгких форм-факторах.

Второй продукт включает 16 вычислительных блоков (CU), 128-битную шину памяти и ускоренное кодирование/декодирования 4K-видео. Пока он не доступен. ВидеокартаAMD Radeon RX 480 использует более крупный процессорный дизайн Polaris 10. В плане физических размеров он не больше процессора Nvidia GP100 с 15,3 млрд. транзисторов, но его возможностей достаточно, чтобы управлять лучшими гарнитурами виртуальной реальности. По уровню производительности карта находится в одном ряду с AMD Radeon R9 290 и Nvidia GeForce GTX 970.

Средний уровень производительности карты трудно назвать сногсшибательным, особенно на фоне нового графического процессора Nvidia GP104. Однако AMD Radeon RX 480 стоит заметно дешевле аналогичных по скорости решений, а потребляемая мощность ограничена 150 Вт. Таким образом, AMD рассчитывает сделать виртуальную реальность доступной для более широкой аудитории геймеров (хорошо, если бы ей подыграли компании, которые продают HMD за $800 и $600).

Polaris 10 состоит из 5,7 миллиардов транзисторов на кристалле площадью 230 мм2. Для сравнения, кристалл Hawaii имеет 6,2 миллиардов транзисторов и площадь 438 мм2. Несмотря на меньшее число транзисторов и пониженную примерно на 55% потребляемую мощность, RX 480 в большинстве тестов находится между R9 290 и 390. Во многом, это заслуга техпроцесса FinFET 14 нм от GlobalFoundries, который обеспечивает AMD заметные преимущества в производительности и энергопотреблении по сравнению с планарными транзисторами, изготовленными с использованием техпроцесса 28 нм. FinFET даёт более высокую частоту при любом уровне потребляемой мощности, и наоборот, при любой тактовой частоте чип с 14 нм потребляет меньше энергии. В случае Polaris AMD использовала оба преимущества, увеличив тактовые частоты и понизив энергопотребление. Так ей удалось превзойти более мощный в плане ресурсов GPU Hawaii сохранив потолок мощности в 150 Вт (хотя наши измерения показывают, что эта цифра немного преуменьшена).

Несмотря на новое кодовое имя, Polaris 10 основан на архитектуре AMD Graphics Core Next четвёртого поколения. Поэтому строительные блоки процессорного дизайна Polaris многим энтузиастам покажутся знакомыми, а нам будет проще его описать.

За диспетчеризацию очерёдности графических инструкций в шейдерные блоки (Shader Engine) по-прежнему отвечает один командный процессор (GCP-Graphics Command Processor). Очерёдностью вычислительных инструкций занимаются асинхронные вычислительные блоки (ACE - Asynchronous Compute Engine). Только вместо восьми блоков ACE логика исполнения команд теперь состоит из четырёх ACE и двух аппаратных планировщиков (Hardware Scheduler), выполняющих задачи приоритизации очередей, управления временными/пространственными ресурсами и разгрузки задач планирования драйвера режима ядра ЦП. По сути, это не отдельные или новые блоки, а скорее дополнительный режим, в котором могут работать существующие конвейеры. Дэйв Нэлэско, старший управляющий AMD по технологическим процессам в графике, дал следующий комментарий:

"HWS (Hardware Workgroup/Wavefront Schedulers) в сущности являются конвейерами ACE без контроллеров диспетчеризации. Их задача заключается в разгрузке ЦП путём управления процессом планирования очередей, заданных пользователем/драйвером, на доступных аппаратных слотах очереди. Это программируемые процессоры с микрокодом, к которым могут применяться различные политики планирования. Мы использовали их, чтобы реализовать функции Quick Response Queue и CU Reservation. Также удалось портировать эти изменения на видеокарты с архитектурой GCN третьего поколения с помощью обновления драйверов."

Функция Quick Response Queues позволяет разработчикам приоритизировать определённые задачи, которые выполняются асинхронно, не вытесняя другие процессы полностью. Более подробное объяснение можно найти (англ.). Если коротко, AMD хочет добиться гибкости. Её архитектура даёт возможность использовать разные подходы для оптимизации загрузки ресурсов и сведения задержки рендеринга к минимуму, а оба этих фактора крайне важны для приложений виртуальной реальности.

Хорошо знакомые нам вычислительные блоки CU состоят из 64 шейдерных модулей, совместимых со стандартом IEEE 754-2008, разделённые на четыре векторных модуля, скалярного блока и 16 модулей загрузки/хранения выборки текстуры. Кроме того, в каждый CU входят четыре блока текстурирования, 16 Кбайт кэша L1, 64 Кбайт локального пространства для обмена данными и регистровое пространство для векторных и скалярных единиц. В AMD утверждают, что внесли много корректировок для улучшения эффективности CU, включая добавление поддержки FP16 (и Int16), оптимизацию доступа к кэшу и улучшение упреждающей выборки команд. В совокупности, эти изменения обеспечивают прирост производительности CU до 15% по сравнению с GPU Hawaii (GCN 2-го поколения).

Девять CU образуют крупный шейдерный блок (SE - Shader Engine). Видеочип Polaris 10 имеет четыре таких SE и нам известно, что это максимум для этой архитектуры. Всего получается 2304 потоковых процессора и 144 блока текстурирования (64 шейдеров х 9 CU х 4 SE).

Каждый шейдерный блок связан с блоком геометрии (GE - Geometry Engine). По информации AMD, в геометрический блок был добавлен ускоритель отсеивания геометрических примитивов (primitive discard accelerator), он отсеивает простейшие геометрические элементы, которые не растеризуются в пиксель до сканирующего преобразования, таким образом, увеличивается пропускная способность. Это автоматическая функция этапа предварительной растеризации графического конвейера и она является новшеством для Polaris. Кроме того, появился индексный кэш для клонированной геометрии, хотя мы не знаем его объём и степень влияния при клонировании.

По аналогии с видеочипом Hawaii, процессор Polaris 10 способен отрисовывать четыре простейших элемента за такт. Однако, по сравнению с графическими процессорами Hawaii/Grenada с частотой до 1050 МГц (в случае R9 390X), AMD подняла базовую частоту AMD Radeon RX 480 до 1120 МГц, а частоту в режиме Boost до 1266 МГц. Выходит, что потерю ресурсов на кристалле компания компенсирует повышенной частотой. Производительность вычислений одинарной точности с плавающей запятой у Radeon R9 290X составляет 5,6 TFLOPS, а RX 480 достигает в режиме Boost 5,8 TFLOPS

Обзор AMD Radeon RX 480 8GB | Особенности конструкции кулера и платы AMD

На первый взгляд, новая видеокарта AMD очень похожа на Radeon R9 Fury Nano. Она весит 685 г, длина от панели ввода-вывода до противоположного конца составляет 24,2 см, высота от верхней части слота до вершины карты – 10,5 см, ширина – 3,5 см.

Чёрный пластмассовый кожух представляет собой одну деталь. Из-за четырёх винтов с шестигранной головкой кажется, что составных деталей больше, этот эффект усиливают покрытия с разной структурой и текстурами.

На верхней части новой карты AMD виден логотип Radeon, подсветки нет. Также есть один 6-контактный разъём дополнительного питания. На наш взгляд, конструкторам AMD следовало бы использовать 8-контактный разъём, причину этого вы узнаете в разделе с тестами энергопотребления.

По задней части RX 480 видно, что длина самой платы составляет только 18 см. Торчащая за пределы платы часть кожуха предназначена для охлаждения. Любопытно, что раньше мы видели подобную конструкцию… у карт Nvidia.

Графический процессор Polaris на плате ориентирован диагонально - это характерно для видеокарт AMD. Интересно, что на GPU нет никаких обозначений.

Обзор AMD Radeon RX 480 8GB | Методика тестирования

Видеокарты AMD Radeon RX 480 и GeForce GTX 1080 с GTX 1070 относятся к разных классам, поэтому тесты, проведенные в их обзорах, в данном случае не актуальны. В рамках этого обзора мы полностью отказались от тестов в 4K, и в дополнение к разрешению 2560x1440 взяли 1920x1080. Тестовая платформа на базе процессора Skylake не изменилась. Из обзора Nvidia GeForce GTX 1080 Pascal:

"Вместо Core i7-5930K (Haswell-E) с частотой 3,5 ГГц мы используем процессор Core-i7-6700K 4 ГГц на архитектуре Skylake, который обладает более современной логикой работы IPC и дополнительными 500 МГц к базовой тактовой частоте, что позволяет избежать возможных узких мест. Естественно, процессор с интерфейсом LGA 1151 потребовал новой системной платы. Для всех игровых тестов мы использовали модель MSI Z170A Gaming M7, в которую также установили набор памяти G.Skill F4-3000C15Q-16GRR, состоящий из четырёх модулей DDR4-3000 по 4 Гбайт. Накопитель Crucial MX200SSD мы не меняли, как и процессорный кулер Noctua NH-12S и блок питания be quiet! Dark Power Pro 10 850W.

Мы отказались от Windows 8.1 в пользу Windows 10 Professional. Перед тестами мы установили чистую версию ОС. Также мы подобрали новый комплект популярных игр класса AAA в разных жанрах, часть из которых используют DirectX 12".

Было не так просто определить соперников для AMD Radeon RX 480, поэтому мы много экспериментировали, прежде чем сформировать финальный список участников. Естественно, нам хотелось включить в него GeForce GTX 970 и Radeon R9 290, поскольку HTC и Oculus рекомендуют обе карты для своих VR-гарнитур. Учитывая, что в презентации RX 480 AMD делала большой акцент на VR, эта карта по скорости как минимум должна быть равна двум моделям предыдущего поколения. Также имеет смысл сравнить новую карту с Radeon R9 390 и 390X, а также GeForce GTX 980. Нижний уровень в данном тестировании представляет Nvidia GeForce GTX 960.

вывод

В общих чертах, AMD Radeon RX 480 немного уступает R9 390X и выходит на один уровень производительности с разогнанной видеокартой R9 390. В некоторых тестах выигрывают конкурирующие карты от Nvidia. Хочется отметить преимущества, которые даёт новая версия AMD Catalyst Pro. В отдельных случаях прирост скорости по сравнению со старым драйвером исчисляется двузначными числами.

Нравится20
Комментарии (12)
B
i
u
Спойлер