Nvidia официально представила самый мощный графический процессор для ИИ - Blackwell

Вместе с уверенной доминацией на рынке видеокарт для ПК, компания Nvidia продолжает свое завоевание отрасли нейросетей. Чипы компании уже несколько лет подряд используются в самых продвинутых системах машинного обучения, и с новой разработкой их присутствие только усилится. На GTC генеральный директор Nvidia Дженсен Хуанг объявил о следующем поколении графических процессоров, которые в десятки раз превосходят поколение Hopper B100 и значительно снижают потребление электроэнергии.

Новый чип от Nvidia получил название Blackwell B200 в честь известного статистика и игрового теоретика Дэвида Гарольда Блэквелла. По словам Хуанга, это поколение GPU обладает самыми мощными показателями производительности и не имеет подобных аналогов. Blackwell работает быстрее прошлых чипов в 7-30 раз и при этом потребляет в 25 раз меньше электроэнергии даже при самой высокой нагрузке. Общая мощность чипа достигает 20 петафлопс, что стало возможным благодаря 208 миллиардам транзисторам и уникальному процессу производства.

Для демонстрации возможностей Blackwell B200, компания привела в пример популярный ИИ-чат GPT-4. Как сообщается, эта версия нейросети со всеми ее возможностями была создана на базе вычислительной мощности 8 тысяч старых чипов Hopper B100, которые работали более 90 дней. Новому поколению понадобится всего 2000 чипов и 4 мегаватта энергии.

Комментарии: 51
Ваш комментарий

Такое впечатление, что зелёные придумали железа лет на 10-20 вперёд и каждый сезон просто делают очередные вбросы, что новая их технология превосходит предыдущую в тыщу миллионов раз. Каждый раз такие восторженные новости на эту тему, что это даже выглядит уже неестественно) Типо зацените! Это прорыв прорывов, который мы придумали несколько лет назад, но короче только щас вам рассказываем как будто мы вот только прям вчера изобрели этот наш новый графический чып.

8

ну на самом деле ты недалёк от истины, ну там конечно речь не о 10-20 лет вперёд, но пару лет точно, куртка занимается этим с начала нулевых

0

на 2-3 поколения наверно вперед железо разрабатывается и примерно понятно какое там железо будет и какие технологии.

0
Такое впечатление, что зелёные придумали железа лет на 10-20 вперёд

Думаю, скорее лет на 4–6 вперед. Но да, так и есть. И это абсолютно здравый и логичный подход с точки зрения бизнеса.
Выбрасывать же на рынок сырой и только что придуманный продукт. Ну это только подвальные китайцы так могут.

1

ну само собой я утрирую с 10-20, так, для контраста ляпнул, но в итоге да - И правда выгодный ход.

0

Хуанг продает гиммики со времен физикса. Правда физикс подох, а куртка живой (к сожалению).

-3

Быстрее в 7 - 30 раз. Как понимать

1

Ладно, но...

8000 тысяч чипов на 90 дней... Как же это оказывается затратно. Ну любые запросы за Ваши деньги.

0

чудо чип наверное по мощней будет чем 750 тыбу

0

а помойкам вроде сбера и яндекса, достаточно Pentium 4. Судя по тому, какие там тупые боты..

-1

Не хочу тебя расстраивать, но дело абсолютно не в том, что им этого достаточно)))) Если ты вдруг не заметил, то уже два года, как зеленые официально ушли с рынка))))

1

Официально ушли, но тем не менее их продукция есть на рынке и цена практически не изменилась. Печально

-2

В смысле ушли? А ланцеты как по твоему на чипах нвидиа клепают полным ходом.

2

Прикольно будет, когда это станут домашние системы, а не находящиеся "где-то"

-1

только в качестве ускорителя ии. видеокартам бы скорее наоборот не помешало завести 64 битную точность. а этот чип думаю достигает такой производительность за счет низкой точности.
а так ускоритель ии вместе в видюхой в обязательных системных требований было бы очень желательно чтоб игры даше развивались. еще скоростной рам диск в еще один 16-краный псл е 5.0 пек-пек тогда точно некстген наступит.

1
Видеокартам бы скорее наоборот не помешало завести 64 битную точность

Зачем бытовой карточке операции над double? В играх, браузере и даже в большинстве профессиональных задач - нет потребности в наращивании dops.

0

для больших открытых миров и большой дальности видимости и буфера глубины конечно. можно просто 3х планарными текстурами по большим опенволдам текстурирование пускать и математику разную в больших пространствах. такая проблема когда всякая вода и близко расположенные плоскости на расстоянии шумят уйдет просто на 10-50 километров подальше наверно. смотря сколько там заков после запятой.
64 флоаты у шейдеров открывают реально крутые фантастические возможности. если еще видеокарты будут физически с этими 64 разрядными проциками а не 2 по 32. можно и так но тогда больше половины производительности срежется так только тдп сильно возрастет и прирост вычислительных блоков правда то замедлится.

0

Большие опенворлды и без того успешно работают без double, хотя уже давно перевалили за предел точности float.
Чаще всего это делается через fixed point и/или деления мира на "чанки".
Формально, такой подход также займёт 64 бита на значение.

Дефолтной точности float хватает для того, чтобы представить локацию 500х500 метров с точностью до 1 мм.
Если переключать целую часть с помощью int - мы получаем int.max * 500 / 1000 = 1 073 741 824 км, покрываемых с точностью до 1мм.

Что касается буфера глубины - флотовой точности более чем достаточно для любой дистанции отрисовки, т.к. на расстоянии, где повалят ошибки - любая геометрия будет равна или меньше пикселя.

Так что увеличение количества dops у бытовых карт - ничего нового играм не даст.

0

не согласен. да, игры в основном застряли в 2000х годах с 32 битной точностью и решается это чанками и локальными корзинами, которые по мере движения по миру меняют локальность, поэтому непрерывные вычисления там по настоящему невозможны, хотя движки начинают отходить от 32 разрядных кордиант в пользу 64 шейдеры нет. и с точностью буфера глубины это работает не совсем так. в кратце типичный случай проблемы 32 буфера глубины с которым я столкнулся - мне нужен был дальний ландшафт на польской земле. сама по себе атмосфера ограничена где-то 60 км в уе4. т.е все объекты больше и дальше будут поверх атмосферы. выход - использование прозрачны материалов для которых можно задать сортинг в ручную и там собственно будут проблемы низкой точности из-за чего числа будет расти нелинейно чтоб как то комплексовать это на расстояниях. так же другой проблей будет порядок сортировки геометрии в объекте ( у прозрачных объектов и современном рендере эта проблема может быть на любых масштабах). и вот эу штуку можно решить либо маршированием луча либо буфером глубины и вот тут нужна высокая точность. так же старых играх можно было заметить такой баг что подводный туман при удалении от поверхности постепенно становится более прозрачным а потом вовсе моет сломаться из-за недостатка цифер после запятой. и столкнулся значится с проблемой, когда у меня планета в небе неправильно отображалась примерно как это было в каких то старых бида старситизена но это можно пофиксить. а вот страдает кольцо кольцо сложно пофиксить и для этого нужен нетривиальный метод. и чтобы горы на расстоянии пофиксить так же нует такой нетривиальный метод когда прозрачность будет рассчитывается не в мировых а в текстурных координатах просто и там же тени придется считать итд и птп. а если бы значится тупо 64 бита у шейдеров было все бы это убралось сразу. а потом ааааааа почему в старкфилде нет космоса и посадки на планету.

я уж не гво чо для большого открытого мира моно было тупо погоду рачивать и осади без костылей на видеокарте просто зная длинные числовые ряды и зависимости меду ними и всякие ветра и зависимости времени а не корячится с циклическим временем к масштабу текстур при смешении что игрок бы успел состарится прежде чем шейдер начнет ломаться и можно бло туп годичные цикл реального времени на 10-летия рассчитать не обращаюсь к процессору для промежуточного запекания.

0

самый мощный калографический процессор

-1

Твоя аватарка говорит о тебе всё:)

-2

Да! Не перевелись еще долб...ёбы. Заходи сюда ещё, нам без дураков скучно!

1

Графическая архитектура Blackwell весьма не дурно. Тем более учитывая что наращивать тупо растровую производительность становится все сложнее. Даже если использовать принцип выпускать сырое а потом под лапшу маркетологов. Говорить о повышении производительности в очередной работе над ошибками в последующих псевдоарихтектурах вроде той же RDNA №. Да и тех-процессы уже не пекутся как пирожки у компаний которые занимаются конечным производством кристаллов для Nvidia,Advanced Micro Devices и частично для Intel. Вроде той же TSMC. Нужно как-то производительность увеличивать другими способами. Например спаринг партнер в лице Advanced Micro Devices насыпает все больше лошадиную дозу кэша. Дабы нивилировать как использование устаревшей памяти так и технологическую отсталость и сырость подситемы памяти и архитектуры в целом.Nvidia использует ИИ. Тем более ИИ еще и двойное назначение имеет кроме профи еще ширпотреб. История с физиксимом короче повторяется. Разумеется не будем забывать что и физикс как и ИИ существует и аппаратно и программно. Последнее впрочем рано или поздно берет вверх над аппаратным решением. Мощность программных решений растет а программные алгоритмы совершенствуются. Так случилось с физиксом. Ибо сейчас физикс существует практически везде в движках исключительно в программном режиме. Ибо смысла его продолжать аппаратного нет и так мощности программной реализации хватает уже для аппаратного качества. Думаю и с ИИ произойдет тоже самое и его качество будет аналогичным как в аппаратной реализации так и в программной. Но это лет через 10-15 будет.

p.s. касательно физикса поддерживает ли его игра и какую именно реализацию владельцы карт Нвидиа могут включив настройку в драйвере

Спойлер
-1
Blackwell работает быстрее прошлых чипов в 7-30 раз

была создана на базе вычислительной мощности 8 тысяч старых чипов Hopper B100, которые работали более 90 дней. Новому поколению понадобится всего 2000 чипов

2000 это меньше чем 8000 именно в 7-30 раз, точно так. Вонючий зеленый маркетинг, что не слово то пи....жь.

-2

Наконец то ты вылез из помойки, а то скучно стало

1

Ну этот-то потянет киберпанк в нативе с лучами?

-3

Думаю в 4к да. Для 8к будем ждать следующее поколение самого мощного графического процессора для ИИ😁

-5

Это для искусственного иди𝅹ота, а не игр.

2

Нет, даже с длсс и фг не потянет, как и 4090, как и 5090 скорее всего.

-2

"Nvidia официально представила самый мощный графический процессор для ИИ - Blackwell"

Крутая железяка для ИИ у NVidia вырисовывается, что тут скажешь, могучие-могучане, заслуженно, умеют делать лучшие в мире железяки для игр и не только.

Дюже интересно будет посмотреть, что у NVidia будет для игрового сегмента, на новой архитектуре. Не так уж и долго осталось, поживём, увидим.

-6

ты ж все равно не купишь, в чем интерес? порадоваться за куртку?

1

Он же его личный очколиз. Не заметил?

1

Так заметил конечно. Как же такое можно не заметить!

1

Ахаха, чётко xD
NVidia как всегда respect.

1