Раскрыты подробности о графическом ядре NVIDIA Ada Lovelace, на котором будут основаны видеокарты серии GeForce RTX 4000

Информация об архитектуре графического процессора NVIDIA Ada Lovelace появилась не так давно, в конкретных конфигурациях будут задействованы чипы серии AD10* следующего поколения для видеокарт серии GeForce RTX 40 которые также просочились. Теперь можно поговорить исключительно о самом графическом чипе следующего поколения.

Блок-схема NVIDIA GA102 Ampere
Блок-схема NVIDIA GA102 Ampere

Сетевой детектив Kopte7kimi поделился деталями о блок-схеме архитектуры следующего поколения, он сравнивает топовый графический процессор AD102 с различными другими графическими процессорами NVIDIA.

А именно Ampere GA102 и Turing TU102, ориентированные на игры, в то время как в список добавлены Hopper GH100 и Ampere GA100, ориентированные на высокопроизводительные рабочие станции. В сравнении идёт AD102 только с его игровыми предшественниками, поскольку чипы, ориентированные на суперсистемы, сильно отличаются от предложений, ориентированных на потребителя.

Блок-схема NVIDIA AD102 Ada Lovelace
Блок-схема NVIDIA AD102 Ada Lovelace

Графический процессор NVIDIA Ada Lovelace AD102 будет иметь до 12 кластеров обработки графики (GPC). Это увеличение на 70% по сравнению с GA102, который имеет только 7 GPC. Каждый чип будет состоять из 6 TPCs и 2 SMS, которые идёт в той же конфигурацией, что и существующий чип. Каждый потоковый мультипроцессор (SM) будет содержать четыре подъядерных процессора, которые также совпадают с GPU GA102.

Что изменилось, так это конфигурация ядра FP32 и INT32. Каждое подъядерное ядро будет включать 128 блоков FP32, но комбинированные блоки FP32 + INT32 увеличенные до 192. Это потому, что блоки FP32 не имеют одного и того же подъядерного ядра, что и блоки IN32. Ядра 128 FP32 отделены от ядер 64 INT32.

Таким образом, в общей сложности каждое подъядерное ядро будет состоять из 128 FP32 плюс 64 INT32 единиц в общей сложности 192 единиц. Каждый SM будет иметь в общем 512 FP32 единиц плюс 256 INT32 единиц в общем 768 единиц. И поскольку существует в общей сложности 24 единицы SM (2 на GPC), получается на 12 288 единиц FP32 и 6 144 единицы INT32 для общего количества ядер 18 432. Каждый SM также будет включать две схемы обработки (32 потока / CLK) для 64 вычислений на SM. Это увеличение на 50% ядер (FP32 + INT32) и увеличение на 33% при ядрах / потоках по сравнению с GA102.

Предварительные спецификации NVIDIA Ada Lovelace
Предварительные спецификации NVIDIA Ada Lovelace

NVIDIA сделала большой прорыв в манипуляциях с кэшем по сравнению с существующими графическими процессорами Ampere. Ada Lovelace будут содержать 192 КБ кэша L1 на SM, что на 50% больше, чем Ampere. Это в общей сложности 4,5 МБ кэша L1 на топовом графическом процессоре AD102. Кэш L2 будет увеличен до 96 МБ, как упоминалось в утечках. Это 16-кратное увеличение по сравнению с графическим процессором Ampere, который содержит всего 6 МБ кэша L2 и он будет разделен между графическим процессором.

Также есть данные об элементах отвечающих за запись пикселей в память (ROPS), которые также увеличены до 32 на GPC, в 2 раза увеличенные по сравнению с Ampere. На флагмане следующего поколения будет до 384 ROPs против всего 112 на самом быстром графическом процессоре Ampere в Geforce RTX 3090 Ti.

Кроме того, на графических процессорах Ada Lovelace будут установлены новейшие ядра 4-го поколения Tensor и 3-го поколения RT (Raytracing), которые помогут повысить производительность DLSS и Raytracing до следующего уровня. В целом, графический процессор Ada Lovelace AD102 предложит:

  • 2x GPCs против Ampere.
  • 50% больше ядер по сравнению с Ampere.
  • 50% больше кэша L1 по сравнению с Ampere.
  • 16x больше кэша L2 по сравнению Ampere.
  • Удвоение ROPs против Ampere.
  • 4-тое поколение Tensor и 3-е поколение ядер Raytracing.

Стоит упомянуть что тактовые частоты, которые, как говорят, находятся в диапазоне 2-3 ГГц, не учитываются в уравнении, поэтому они также будут играть важную роль в улучшении производительности на ядро по сравнению с Ampere.

Видеокарты серии NVIDIA GeForce RTX 4000 с игровыми графическими процессорами Ada Lovelace следующего поколения скорее всего будут выпущены во второй половине 2022 года на том же технологическом процессе TSMC 4N, что и Hopper H100.

Предварительные характеристики графического  ядра  NVIDIA
Предварительные характеристики графического ядра NVIDIA
Комментарии: 95
Ваш комментарий

А на деле будут быстрее 3080 ti и 3090 ti на процентов 10-15, но никак не в два раза)

32

В 4к да в 2к по больше прирост думаю

13

Вряд ли - даже по терафлопсам она в два раза мощнее. Тут скорее есть вопрос как они этого зверя будут охлаждать и что по потреблению питания. Ну процентов 50 точно будет прирост.

8

Говорят до 900 ватт тдп будут 4090 и выше)

6

это какой же толщины будет охлад

0

Количество терафлопс не означают что она будет в два раза мощней! вот пример в rtx 3070 20терафлопс, а в 2070 super около 10 терафлопс, так вот производительность в играх выше не в два раза, а где то 20-30% завися от игры!

7

да кому они всрались теперь, из за долбаных майнеров по цене бюджетного авто из салона

4

"Кроме того, на графических процессорах Ada Lovelace будут установлены новейшие ядра 4-го поколения Tensor и 3-го поколения RT (Raytracing), которые помогут повысить производительность DLSS и Raytracing до следующего уровня."

Душевно.

Очередной непобедимый монстр вырисовывается, что логично, однако ж, посмотрим, как новая архитектура от NVidia будет работать в реальности, а не на картинках. Но что-то мне подсказывает, что всё у NVidia будет хорошо, в отличии от подражателей, хотя, окончательно всё встанет на свои места, когда выйдут новые видяйки и от NVidia, и от AMD, уляжется очередной маркетинговый угар и будут опубликованы реальные, более-менее честные, тесты в играх, а не проплаченные маркетинговые портянки хвалебных завываний и красивых, но бесполезных графиков, AMD, категорический привет :)

2

Amd везде врет… что в процах, что в видюхах.

-2

Я года 3 назад брал 2080 super и честно говоря, с тех пор я вижу довольно мало игр которые требуют такую видеокарту. Ну Doom eternal мне зашёл, ну Elden ring. А больше я и не вспомню, но в любом случае игр слишком мало, а без них и видяха не нужна.

2

Судя по таблице, будет как раз около 2 раз быстрее, чем 2080ти, а не 3090ти.

1

Абсолютно правильно так и будет!

0

Где то так и будет. 4090Ti, это, как две 2080ti.

0

600W жуть. Это, что получается, охлад нужно ставить азотный?

1

А толку? или кто-то собирается брать по ценам в 300к+?

1

С таким аппетитом вы еще систему охлаждения должны поставлять в комплекте на жидком металле...)

0

Теперь майнить больше можно !

0

Заинтриговали!
Жду тесты в играх )))

-1

Больше интересуют младшие модели линейки, условные 4050 и 4060/ti. 3060Ti на 8 гб в 2022 году - смешно, даже для 1080p уже. А если я захочу монитор обновить? Впритык вообще будет. По этому пока пересижу на 1070 а там уже видно будет. С другой стороны, на 30х серию после выхода 40х будет скидка, особенно за рубежом. Нужно ждать.

-1

Ну и зачем оно если не игр под это ни самих карт у нас не будет скорей

-2

серый ввоз никто не отменял, к тому же они ведь не только для нас свои карточки выпускают)

2

Игры уже есть давно для такой карты. Очень давно! Проблема в том, будет ли доступна карта у нас в России.

0

Сколько можно про эти хари писать уже? Одно и тоже. Когда реально цены скажут, что знать и к чему готовиться? Это ведь самое главное!

-2

Очередной фейл будет с памятью, Nvidia не может не зафейлить память это традиция !

-11

это амдешник, у него nvidia сплошной фейл

6

У меня вопрос! А де ты фейл видел? карты от амд - вот это пздц...

-1

Ты наверное зашореный и не знаешь проблем Nvidia на протяжении 20 лет ???

Nvidia FX дерьмовая линейка 2003 года которая не смогла в dx 9,0 и сливала Radeon 9700Pro везде.

Nvidia 8800/9800 официально признанный брак GPU c отвалами.

Nvidia 480 устаревший кусок хлама с Dx11 и греющийся до 100 градусов тоже касается 580 отвал на отвале.

Nvidia 660 1,5 гига памяти и 512 мег медленной ))) "Нет проблем" ))

Nvidia 970 3,5 гига и суд, по которому выплаты компенсаций уже за вранье )))

Nvidia 1070 бракованная память Micron

Nvidia 2080TI бракованная память Micron

Nvidia 3080/3090 Проблемы с питанием !

Действительно где тут фейлы ?!? Давай поспорим что будет очередной !? )))

-2

возьму пожалуй либо 4080ти, либо 7900xt на замену старушке 3080ти

-15

Не сказал бы, что 3080ti старушка) А вот 2080ti, да, лоу сегмент. Хотел бы я глянуть 4090ti против двух 2080ti. Либо 4080 против 2080. Особенно в Киберпанке на запредельных ультрах.

-4

2080TI быстрее 3070 сказочник форумный ! Ты хоть бы характеристики по ядрам посмотрел и не писал бы бред на форумах.

-1

Оу, Икс рейка прибыл, нубло амдэшное))) Здрасте! Не проснулся ещё? Бывает. Я вроде бы ничего не писал про 3070. При чём тут она, я хз. Сонный ещё? Ну, если на то пошло, то 3070 чуточку быстрее 2080ti, сказочник)

0

А вот 2080ti, да, лоу сегмент. Хотел бы я глянуть 4090ti против двух 2080ti

Я понял пишешь и не понимаешь что пишешь, клоун не иначе )))

3070 чуточку быстрее 2080ti, сказочник)

Сказочник тут ты, быстрее токо у РЕФа ! А про 8 гиг (Bandwidth 448.0 GB/s) "быстрей" 11 гиг (Bandwidth 616.0 GB/s) в 4k, это даже не смешно а грустно от глупости твоей )))

Главный параметр в работе Dx12 Ultimate это "RT cores" их 68 у 2080TI, а у 3070 всего 46 подумай хотя б хоть раз в жизни головой.

К примеру у Radeon RX 6800 XT "RT cores 72" у 3080 те же 68 !

Cейчас карты меряют не фпс, а способностью "тянуть" RTX.

-1

Много букав. Даже читать лень твой высер. Залезь обратно откуда вылез)))

0