Вспоминаем поколение видеокарт NVIDIA часть 5

и так встерчаем Ферми микроархитектуру  разработанной Nvidia в качестве преемника Tesla микроархитектуры. Это был основной микроархитектуры используется в серии GeForce 400 и GeForce 500 серии. Все настольные графические процессоры Fermi были изготовлены в 40 нм, мобильный Ферми графических процессоров в 40 нм и 28 нм. Архитектура названа в честь Иоганна Кеплера , немецкий математик и ключевой фигурой в 17 веке научной революции 

400 Series GeForce является 11 - м поколением Nvidia 's GeForce графических процессоров цель предыдущей архитектуры Nvidia была конструкция направлена на повышение производительности на вычислительных и тесселяции с архитектурой Kepler Nvidia ориентированы свое внимание на эффективности, программируемости и производительности

Целью эффективность была достигнута за счет использования единой GPU часы, упрощенное статическое планирование обучения и выше акцент на производительности на ватт.Отказавшись часы затенения нашли в своих предыдущих проектах GPU, эффективность увеличивается, даже если это требует дополнительных ядер для достижения более высоких уровней производительности.Это не только потому, что сердечники больше энергии дружественных (два Kepler ядер с использованием 90% мощности одного ядра Ферми, в соответствии с номерами от Nvidia), но и переход к единой схеме GPU часы обеспечивает снижение на 50% потребления электроэнергии в эта область.

Программируемость цель была достигнута с помощью Hyper-Q Кеплера, Dynamic параллельности и несколько новых функциональных возможностей Compute потенциале 3.x. С его помощью , более полное использование GPU и упрощенное управление код был достижимо с таким образом GK графических процессоров позволяет большую гибкость при программировании для графических процессоров Kepler. И, наконец , с целью исполнения, дополнительное исполнение ресурсов (более CUDA ядра, зарегистрируйтесь и кэш) и с возможностью Кеплера , чтобы достичь частоты памяти скорость 6 ГГц, повышает производительность Kepler , когда по сравнению с предыдущим графических процессоров Nvidia.

в качестве следующего важного шага в своей линейке графических процессоров следующего за Тесла (микроархитектура) используется с G80 . GF100, первый Ферми-архитектуры продукта, велика: 512 потоковых процессоров , в шестнадцать групп 32, и 3,0 млрд транзисторов, изготовленных TSMC в процессе 40 нм. Это первый чип от Nvidia для поддержки OpenGL 4.0 и Direct3D 11 . Нет продуктов с полностью включенным GF100 GPU были когда - либо проданы. GTX 480 была одна потокового многопроцессорных отключена. GTX 470 было два потоковых мультипроцессоров и один контроллер памяти отключен. GTX 465 было пять потоковых мультипроцессоров и два контроллера памяти отключены. Потребительские GeForce карты пришли с памятью 256 МБ, прикрепленной к каждому из включенных контроллеров памяти GDDR5, в общей сложности на 1,5, 1,25 или 1.0GB; Тесла C2050 имел 512 Мб на каждый из шести контроллеров, а Tesla C2070 был 1024MB каждого контроллера. Обе карты Tesla было четырнадцать активных групп потоковых процессоров.

в качестве следующего важного шага в своей линейке графических процессоров следующего за Тесла (микроархитектура) используется с G80 . GF100, первый Ферми-архитектуры продукта, велика: 512 потоковых процессоров , в шестнадцать групп 32, и 3,0 млрд транзисторов, изготовленных TSMC в процессе 40 нм. Это первый чип от Nvidia для поддержки OpenGL 4.0 и Direct3D 11 . Нет продуктов с полностью включенным GF100 GPU были когда - либо проданы. GTX 480 была одна потокового многопроцессорных отключена. GTX 470 было два потоковых мультипроцессоров и один контроллер памяти отключен. GTX 465 было пять потоковых мультипроцессоров и два контроллера памяти отключены. Потребительские GeForce карты пришли с памятью 256 МБ, прикрепленной к каждому из включенных контроллеров памяти GDDR5, в общей сложности на 1,5, 1,25 или 1.0GB; Тесла C2050 имел 512 Мб на каждый из шести контроллеров, а Tesla C2070 был 1024MB каждого контроллера. Обе карты Tesla было четырнадцать активных групп потоковых процессоров.

Теоретическая одинарной точности мощности обработки Ферми GPU в GFLOPS вычисляется как 2 (операции на инструкцию FMA на CUDA ядра за один цикл) ? количество ядер CUDA ? затенения тактовой частотой (в ГГц). Обратите внимание , что предыдущее поколение Тесла мог двойной выпуск MAD + MUL для ядер CUDA и SFUs параллельно, но Ферми утратил эту способность , как он может выдавать только 32 инструкций за такт в СМ , который удерживает только его 32 ядер CUDA в полной мере. [2] Таким образом, не представляется возможным эффективно использовать SFUs достичь более 2-х операций на ядро ??CUDA за один цикл.

Теоретический двойной точности обработки мощность Ферми GPU равна 1/2 от одной производительности точности на GF100 / 110. Тем не менее, на практике это двойной точности питания доступна только на профессиональных Quadro и Tesla карт, в то время как потребитель GeForce карты ограничен до 1/8

30 сентября 2009 года Nvidia выпустила белый документ , описывающий архитектуру: чип имеет 16 'Streaming многопроцессорных' каждый с 32 'CUDA Cores' способны одной одинарной точности операции за один цикл или одну операцию с двойной точностью каждый цикл , 40-битный виртуальное адресное пространство , которое позволяет памяти хоста должен быть отображен в адресное пространство чипа, а это означает , что есть только один вид указателя и сделать C ++ поддержки значительно проще, а также широкий 384-битный GDDR5 интерфейс памяти. Как и с G80 и GT200 , нитки планируется в 'перекосов', наборы 32 потоков каждое из которых работает на одном ядре затенения. В то время как GT200 имел 16 КБ 'разделяемой памяти', связанный с каждым шейдерных кластера, а также необходимые данные для чтения через текстурных блоков, если кэш был нужен, GF100 имеет 64 Кб памяти, связанной с каждого кластера, который может быть использован либо как 48 KB кэш плюс 16 KB разделяемой памяти, или в качестве кэш-памяти 16 КБ плюс 48 КБ общей памяти, наряду с 768 КБ L2 кэша совместно используемой всеми 16 кластеров.

6 ноября 2009 года корпорация NVIDIA объявила о выходе GPGPU плат NVIDIA Tesla C2050 и C2070 с 3072 Мб и 6144 Мб видеопамяти соответственно, предназначенных для математических вычислений. Новое поколение акселераторов Tesla использует архитектуру NVIDIA Fermi. Выход продуктов на рынок намечен на первый и второй квартал 2010 года для NVIDIA Tesla C2050 и C2070 соответственно.

16 января 2010 года был снят запрет на распространение информации о NVIDIA GF100. Благодаря этому общественности стал доступен ряд демонстрационных видеороликов, в которых новый чип демонстрируется в игре Far Cry 2, а также видеодемонстрации технологий рейтрейсинга и тесселяции. В этот же день NVIDIA официально заявила, что предоставит детальную информацию

18 января 2010 года, как и было обещано, появилось множество подробностей и деталей об архитектуре GF100, которая расшифровывается какGraphicsFermi100

2 февраля 2010 года стало известно официальное название первых продуктов на основе чипа GF100. Флагманские продуктыNVIDIA GeForce GTX 480иNVIDIA GeForce GTX 470

26 марта 2010 года состоялся анонс первой пары видеокарт на основе чипа GF100 — GeForce GTX 480 и GeForce GTX 470. Были опубликованы технические характеристики продуктов, а также первые синтетические и игровые тесты, 

GF100 GeForce GTX 480

GF100 GeForce GTX 470

12 июля 2010 года в продажу официально поступил NVIDIA GeForce GTX 460 — первый доступный представитель микроархитектуры NVIDIA Fermi, который основан на более дешевом в производстве графическом процессоре NVIDIA GF104

GF104 GeForce GTX 460

31 мая 2010 года на выставке Computex 2010 состоялся анонс третьего представителя архитектуры Fermi — NVIDIA GeForce GTX 465, NVIDIA GF100

GeForce 500 Series представляет собой семейство графических процессоров , разработанных Nvidia , на основе частоты обновления Ферми GF-кодовое название чипов , используемых в предыдущей серии 400 . Nvidia официально анонсировала 500 серию GeForce 9 ноября 2010 года с запуском GeForce GTX 580. представленная 9 ноября 2010 года.

В Nvidia GeForce 500 Series видеокарт существенно модифицированные версии Nvidia серии GeForce 400 видеокарт, с точки зрения производительности и управления питанием. Подобно серии графических карт Nvidia GeForce 400, то Nvidia GeForce 500 Series видеокарт поддерживают DirectX 11.0, OpenGL 4.5 и OpenCL 1.1. Эта серия поддерживает DirectX 12, но не может поддерживать все возможности Direct3D 12.

Nvidia GeForce GTX 580 видеокарта является первым в серии Nvidia GeForce 500, чтобы использовать полностью включен чип, основанный на обновленной архитектуре Ферми, со всеми 16 потоковых многопроцессорных кластеров и все шесть 64-битных контроллера памяти активными. Новый GF110 GPU была увеличена с полной скорости FP16 фильтрации (предыдущее поколение GPU GF100 может сделать только половину скорости фильтрации FP16) и улучшенными г-отсечение единиц

Флагманские же GPU GTX 580 и GTX 570, основанные на чипах GF110, кроме разблокировки всех блоков, подверглись и архитектурным изменениям. Так, скорость обработки текстур формата FP16x4, часто применяемых в современных играх, была доведена до уровня скорости для fp16x2 (у GF100 в два раза ниже), ускорен также алгоритм отбрасывания невидимых треугольников, и разрешено изменение конфигурации кеша для графических приложений (у GF100 — только для вычислительных задач). По данным NVIDIA, все эти архитектурные изменения, при равных частоте и количестве функциональных блоков с GF100, дают прирост до 15 %. С учетом возросшей частоты и большего количества функциональных блоков — до 30 %.

GF110 GTX 570 

GF110 GTX 570 

С 25 января 2011 года Nvidia выпустила GeForce GTX 560 Ti, С его улучшения более чем на 30% по сравнению с GTX 460

24 марта 2011 года, GTX 590 был запущен в качестве флагманской видеокарты для Nvidia.GTX 590 является двухчиповой карты

28 ноября 2011 года Nvidia запустила "GTX560Ti 448 Cores». Тем не менее, он не использует кремний серии GTX560: это чип GF110 с двумя шейдерных блоков отключены. Самая мощная версия серии 560, эта карта была широко известен как "ограниченное производство" и карта была использована в качестве использования решений маркетинговый инструмент популярности бренда GTX560 для 2011 курортного сезона. Производительность карты находится между обычной 560Ti и 570.

так и закончилась  микроархитектура Ферми   разработанной Nvidia в качестве преемника Tesla 

Нравится17
Комментарии (22)
B
i
u
Спойлер