Архитектура Pascal

Датой официального анонса новой архитектуры Nvidia Pascal можно считать 5 апреля 2016 года, когда были представлены профессиональные ускорители вычислений Tesla P100 в составе суперкомпьютера DGX-1. Игровые же решения задержались на месяц, но уже 7 мая 2016 года во время презентации Nvidia Editors Day в Остине (Техас) компания продемонстрировала публике видеокарты GeForce GTX 1080 и GTX 1070. При этом выпуск младшей версии немного задержался, и на рынке она появилась 10 июня 2016 года.

Но прежде чем переходить к линейке самих видеокарт, стоит вкратце рассмотреть архитектуру Pascal на примере старшего потребительского чипа GP102.

При взгляде на схему полной версии чипа GP102 сразу бросается в глаза наличие пяти Потоковых Мультипроцессоров (SM) в одном Кластере Обработки Графики (GPC), тогда как в Maxwell их было четыре. Самих GPC здесь шесть, и внутри каждого из них вычислительные блоки дополнительно сгруппированы в пять Кластеров Обработки Текстур (TPC). Внутри SM находятся 64 потоковых процессора (CUDA-ядра) и 4 текстурных модуля, что в итоге дает 3840 шейдерных процессоров и 240 текстурных модулей. По бокам размещены двенадцать 32-битных контроллеров памяти, складывающихся в 384-битную шину.

Чип GP102 в полной версии

Блок SM чипа GP102

Существенному изменению подвергся движок полиморфинга, ответственный за обработку тесселяции. Он дорос до версии 4.0 и переехал из SM в TPC, в результате чего получил возможность работать сразу с несколькими Потоковыми Мультипроцессорами. Кроме того, в его состав был добавлен новый модуль Одновременного Мульти-Проецирования (SMP), отвечающий за генерацию нескольких окон проекции (Viewport) для одного потока геометрии. Каждый блок SMP обрабатывает до 16 заранее симулированных проекций или репликации 32-х проекций, разделенных на два независимых экрана. Это оказывается полезно при использовании многомониторных конфигураций или при подключении шлемов ВР.

Далее следует упомянуть про улучшенную работу асинхронных вычислений. Алгоритм динамических асинхронных вычислений применяется в двух случаях. Первый – когда необходимо распараллелить задачи обработки графики и вычислений общего назначения, которые в видеопроцессоре выполняются разными аппаратными блоками. Для этого алгоритм передает ту или иную задачу на исполнение простаивающим в данный момент блокам. Второй случай предполагает быстрое переключение между критичными по времени исполнения задачами, например, при просчете искажения времени в ВР. Для этого в архитектуру Pascal был внесен алгоритм пиксельного прерывания операций, который следит за конвейером рендеринга и при необходимости приостанавливает закраску полигонов, чтобы чип мог выполнить другую, более важную на данный момент операцию.

В Pascal были реализованы два новых метода сжатия изображений: один с соотношением сторон 4:1 и другой с соотношением 8:1. Метод 4:1 используется в том случае, когда цвета соседних пикселей отличаются несильно. Иначе активируется метод 8:1, который сначала применяет алгоритм 4:1 к блокам 2×2 пикселя, а затем выполняет двукратное сжатие для дельты между ними. Это позволяет сэкономить на 20% больше памяти, чем в Maxwell с его методом 2:1.

Также во время презентации Editors Day был представлен новый инструмент для снятия скриншотов в играх Nvidia Ansel. Он позволяет в любой момент поставить игру на паузу и через окно оверлея настроить ракурс камеры, изменить её параметры и добавить различные фильтры и постэффекты.

Пример работы Ansel в игре The Witcher 3: Wild Hunt

Всего в семейство Pascal вошли 15 моделей настольных видеокарт GeForce (в хронологическом порядке):

1-2) 7 мая 2016 года были представлены первые носители чипа GP104: GTX 1080 и GTX 1070. Старшая модель получила 2560 CUDA-ядер, 160 текстурных модулей и новую памяти типа GDDR5X, а младшая ограничилась 1920-ю ядрами, 120-ю модулями TMU и классической GDDR5.

3-4) Вслед за флагманами подоспел и средний сегмент. 8 июля 2016 года появилась видеокарта GTX 1060 с 6 ГБ памяти, а еще через месяц, 18 августа, к ней присоединилась модель GTX 1060 с 3 ГБ GDDR5. Обе были основаны на чипе GP106, но у старшей карты он имел полную конфигурацию с 1280-ю активными CUDA-ядрами, тогда как у младшей работали только 1152 процессора.

5) 2 августа все пользователи, уже купившие себе GTX 1080, внезапно перестали считаться обладателями флагманской видеокарты, поскольку Nvidia представила нового Titan X на базе ядра GP102 и установила на него цену в $1200. Это создало некоторую путаницу между Titan X (Maxwell) и Titan X (Pascal), но различить их всё же было можно и без взгляда на сами карты. Так, у новой версии из названия исчезла приставка GTX. Кроме того, все Titan X (Pascal) распространялись исключительно в оригинальных коробках Nvidia без дополнительного брендирования от партнеров. Тем не менее, известны случаи, когда пользователи вместо новой карты приобретали старый «Титан» по существенно завышенной цене.

6-7) В октябре 2016 года к расширяющейся линейке Pascal подключился нижний сегмент в лице видеокарт GTX 1050 и GTX 1050 Ti. Они получили чип GP107 с 640/768-ю активными процессорами соответственно. Стоит отметить, что по производительности GTX 1050 Ti смогла тягаться с некогда флагманской GeForce GTX 680, несмотря на гораздо более скромные аппаратные характеристики.

8) 10 марта 2017 года рядовые потребители наконец-то дождались релиза игрового аналога Titan X – видеокарты GeForce GTX 1080 Ti. И хотя она получила на 1 ГБ памяти меньше «Титана» (с соответствующим снижением числа активных блоков растровых операций), Nvdia разрешила партнерам выпуск нереференсных модификаций GTX 1080 Ti, чем те с радостью воспользовались. Новый игровой флагман оказался на 35% производительнее GTX 1080 при цене в $699, а в разгоне даже обгонял Titan X.

9) 6 апреля 2017 года на смену Titan X пришел более мощный Titan Xp, основанный на том же чипе GP102. Абсолютный флагман среди потребительских видеокарт Pascal получил 3840 активных ядер CUDA, в то время как у «обычного» Titan X их было только 3584 штук. Titan Xp запомнился ещё и двумя лимитированными коллекционными версиями, выпущенными специально для фанатов «Звездных войн» к релизу игры Star Wars: Battlefront II. Одна из них была посвящена ордену джедаев, а вторая ситхам.

10-11) 17 мая 2017 года была представлена самая бюджетная видеокарта семейства Pascal – GeForce GT 1030, основанная на чипе GP108 с 384-я CUDA-ядрами. Изначально эта карта оснащалась памятью GDDR5, однако в марте 2018 года также появились удешевленные модели GT 1030 с более медленной DDR4.

12) 2 ноября 2017 года Nvdia сделала подарок «майнерам», представив GTX 1070 Ti. Карта получила полноценный чип GP104 с 2560-ю CUDA-ядрами и память GDDR5, которая демонстрировала более высокие результаты чем более современная GDDR5X, использовавшаяся в GTX 1080. Однако для лучшей дифференциации модельного ряда Nvidia также серьезно ограничила возможности разгона GTX 1070 Ti.

13) Наконец, в октябре 2018 года, как это часто бывает под конец жизненного цикла архитектуры, Nvidia представила модификацию GeForce GTX 1060 на старшем ядре GP104. Фактически, таким образом компания избавлялась от остатков бракованных чипов, которые были не пригодны для использования в GTX 1080 или GTX 1070. По техническим характеристикам новинка никак не отличалась от оригинальной GTX 1060 6GB.

14-15) Также стоит упомянуть про модификации GeForce GTX 1060 c 5 ГБ памяти GDDR5X и GTX 1050 с 768-ю активными процессорами (вместо 640). Обе они вышли в Китае в ноябре 2018 года, но так и не покинули азиатского региона (по крайней мере, по официальным каналам).

Семейство Pascal оказалось очень удачным по соотношению цены, производительности и энергопотребления. Даже сегодня, спустя 3,5 года, старшие модели сохраняют актуальность и обеспечивают высокий уровень производительности в современных играх.

Видеокарты поколения Pascal в коллекции:

Tesla P100 ES

Коллекция видеокарт

VC Collection. Частный сайт о видеокартах

Архитектура Pascal