Серия GeForce 900

Право представить новую архитектуру Nvidia Maxwell, пришедшую на замену Kepler, выпало не флагманской видеокарте, а двум моделям средне-бюджетного сегмента. Так первым ГП на архитектуре Maxwell 1.0 стал GM107, нашедший применение в видеокартах GeForce GTX 750 и GTX 750 Ti. Эти две модели были представлены 14 февраля 2014 года и сохранили приверженность серии GeForce 700. Первое знакомство с Maxwell показало хорошую энергоэффективность  (почти что вдвое лучше, чем у GTX 650 Ti) и высокую производительность новой архитектуры. За счет большого числа шейдерных процессоров и высокой частоты работы ГП бюджетная GTX 750 Ti, оцененная в $149, смогла тягаться с некогда флагманской GTX 480.

Но настоящее пришествие «большого» Maxwell версии 2.0 в высокопроизводительный сегмент состоялось 18 сентября 2014 года, когда Nvidia анонсировала видеокарты GeForce GTX 980 и GTX 970, основанные на чипах GM204. Официальная цена на них составила $549 и $329 соответственно.

Появление же старшего ядра GM200 задержалось до 17 марта 2015 года, когда Nvidia наконец представила новую модель GeForce GTX Titan, получившую суффикс X. Цена на Titan поколения Maxwell, как и на его предшественника из семейства Kepler, составила $999. Он был построен на чипе GM200 в полноценной конфигурации с 3072-я шейдерными процессорами, 192 текстурными модулями и 96-ю блоками растровых операций и снабжался 12 ГБ памяти GDDR5, что на тот момент считалось огромным значением. По позиционированию Titan X по-прежнему нельзя было назвать исключительно игровой видеокартой – он скорее находился на стыке между играми и приложениями по рендерингу и обработке видео. К сожалению, Titan X лишился быстрого вычислительного блока FP64 – ключевой особенности линейки Titan. В итоге вычисления двойной точности он выполнял в 32 раза медленнее, чем одинарной (209,1 ГФлопс против 6,691 ГФлопс).

Несколько позже, 2 июня того же года, компанию «Титану» составила чисто игровая модель GeForce GTX 980 Ti. У этой карты были «вырезаны» два мультипроцессорных модуля SMM, в результате чего общее число шейдерных блоков снизилось до 2816 штук. Объем памяти также пострадал и был уменьшен до 6 ГБ. С другой стороны, цена на флагманскую игровую модель составила вполне доступные для геймера $649.

Архитектурно чип Maxwell 2.0, как и Kepler, состоит из кластеров обработки графики (GPC), в каждом из которых находятся четыре потоковых мультипроцессора (SMM, Streaming Multiprocessing Module) и движок растеризации. Старший чип семейства, GM200, содержит шесть 64-битных контроллеров памяти, к каждому из которых привязано по 16 блоков растровых операций. Суммарная ширина шины составляет 384 бита.

 

 

Строение самих потоковых мультипроцессоров в Maxwell претерпело значительные изменения по сравнению с Kepler. Они имеют значительно лучшую энергоэффективность и демонстрируют более высокую производительность на кв. мм площади. Чтобы добиться этого, инженеры Nvidia переработали блоки управления и планирования и функции распределения загрузки между блоками, а также изменили количество исполняемых за такт инструкций.

Каждый мультипроцессор теперь оказался разделен еще на четыре отдельных вычислительных блока со своими буфером инструкций, планировщиком варпов, CUDA-ядрами, блоками загрузки/сохранения и блоками специальных функций (SFU). Общими у них остались лишь текстурные модули (TMU) и блоки вычислений двойной точности (FP64). Такое разделение блоков помогло избавиться от «холостой» работы в случаях, когда единый общий блок простаивал при частичной нагрузке. Получается, что задача планирования разделяется на четыре части, что упрощает общий дизайн SMM и помогает уменьшить размеры чипа и снизить его энергопотребление.

 

 

Каждый планировщик варпов отправляет инструкции на исполнение 32-м CUDA-ядрам, а также может за один такт отправлять математическую операцию в ядро, а операцию по работе с памятью – в специальный блок загрузки/сохранения (LSU).

Подсистема памяти и кэша тоже подверглась переработке. Каждый SMM в Maxwell содержит 96 кБ собственной памяти, а кэши первого уровня и текстур объединены в два блока по 24 кБ. В общей сложности это дает 144 кБ кэша (против 64 кБ у Kepler). Объем же кэша второго уровня был увеличен сразу в 8 раз: с 256 кБ у Kepler до 2 МБ у Maxwell. Также более чем на 15% выросла частота памяти GDDR5. Все эти изменения позволили увеличить производительность CUDA-ядер на величину до 40% по сравнению с Kepler.

Но что еще важнее, для Maxwell были разработаны два новых метода сжатия данных в кадровом буфере, что существенно повысило экономию пропускной способности памяти. Первый алгоритм берет массив 8×8 пикселей и проверяет, можно ли применить к нему сжатие без потерь. Если в этом массиве присутствуют одноцветные блоки размером 4×2 пикселя, для них применяется степень сжатия 8-к-1. Далее алгоритм проверяет возможность применить сжатие блоками 2×2 со степенью 4-к-1 и т.д. Второй метод называется Delta Color Compression. Он исследует разницу в цвете между соседними пикселями, чтобы определить возможность их сжатия. В обычном виде данные записываются в память лишь в тех редких случаях, когда ни один из двух алгоритмов не может быть применен.

Еще из нововведений Maxwell нужно отметить поддержку аппаратного ускорения метода глобального освещения VXGI (Voxel Global Illumination). Он был предложен Nvidia еще в 2011 году, а его суть состоит в том, что трехмерная сцена представляется в виде вокселей (объемных пикселей) для дальнейшего захвата информации об освещении в каждой ее точке. Затем к полученным данным применяется трассировка (отслеживание пути луча света), и по ее результатам выполняется расчет эффекта отражения. При этом роль лучей при трассировке выполняют конические области.

Вдобавок, в Maxwell была улучшена работа полноэкранного сглаживания DSR и реализован новый метод сглаживания MFAA (Multi-Frame antialiasing, многокадровое сглаживание). Первый из них, по сути, является вариацией классического SSAA, но задействует более сложный фильтр Гаусса с 13 выборками, что позволяет снизить количество артефактов. Второй метод похож на MSAA, но предназначен для наиболее требовательных к производительности игр. Основная его особенность – это возможность программно управлять положением выборок в каждом пикселе, что позволяет разработчику располагать субпиксели как ему угодно.

Наконец, архитектура Maxwell 2.0 получила поддержку четырех функций API DirectX 12: Rasterizer Ordered View, Typed UAV Load, Volume Tiled Resources и Conservative Raster, интерфейса HDMI 2.0 и разрешений экрана вплоть до 5K (5120×3200 пикселей).

Хронология появления настольных видеокарт GeForce серии 900 выглядит следующим образом:

  • 18 сентября 2014г – GeForce GTX 980 и GTX 970, чип GM204. Конфигурации ядер: [2048 SP, 128 TMU, 64 ROP] и [1664 SP, 104 TMU, 56 ROP] соответственно;
  • 22 января 2015г. – GeForce GTX 960, чип GM206. Конфигурации ядер: [1024 SP, 64 TMU, 32 ROP];
  • 17 марта 2015г. – GeForce GTX Titan X, чип GM200. Конфигурации ядер: [3072 SP, 192 TMU, 96 ROP];
  • 2 июня 2015г. – GeForce GTX 980 Ti, чип GM200. Конфигурации ядер: [2816 SP, 176 TMU, 96 ROP];
  • 20 августа 2015г – GeForce GTX 950, чип GM206. Конфигурации ядер: [768 SP, 48 TMU, 32 ROP].

Также существовали OEM-версии GTX 950 и GTX 960. Они имели конфигурации [1024 SP, 64 TMU, 32 ROP] и [1280 SP, 80 TMU, 48 ROP] соответственно.

Видеокарты серии GeForce 900 в коллекции: