2 октября, 2019
Продвигая науку вперед: Nvidia Tesla P100 ES
Первые ускорители вычислений Nvidia Tesla были представлены в мае 2007 года и принадлежали к одноименной архитектуре. Появление таких карт стало возможным благодаря переходу Nvidia к унифицированной шейдерной модели и созданию языка CUDA для программирования вычислений общего назначения на ГП (GPGPU). С тех пор ускорители Tesla продолжают уверенно развиваться, находя применение в задачах сложного математического моделирования, расчета структуры белков, обучения нейросетей, виртуализации и других, где требуется высокая степень распараллеливания.
Очередное поколение Tesla с индексом P100 было представлено в апреле 2016 года наряду с новой графической архитектурой Nvidia Pascal. Эти ускорители были выполнены в формате карт расширения DGS с интерфейсом NVLink и поставлялись в составе суперкомпьютера DGX-1. Сердцем новой Tesla стал чип GP100 с интегрированной на подложку новейшей памятью HBM2.
В июне того же года Nvidia представила две версии Tesla с более привычным интерфейсом PCI-E, и попавший в коллекцию инженерный экземпляр Tesla P100 ES как раз относится к такому типу. При взгляде на ускоритель сразу бросаются в глаза его отличия от серийной модели: наличие двух видеовыходов и водоблок в качестве системы охлаждения.
Этот водоблок тоже является уникальным. Он был спроектирован в калифорнийской лаборатории Nvidia специально для Tesla P100 с расчетом на СВО высокого давления. Но самое важное и необычное отличие инженерного экземпляра от серийной Tesla P100 кроется под системой охлаждения, а именно на подложке чипа GP100. Здесь вместо памяти HBM2 установлены 4 стака HBM1. Вероятно, именно этот фактор не позволяет ускорителю корректно работать в Windows после установки драйвера (печально известный код 43).
Ядро GP100 при площади в 610 мм² содержит 3584 ядра CUDA и 224 TMU, благодаря чему демонстрирует производительность в 4,7 ТФлопс при работе с числами FP64. У данного экземпляра на защитную рамку чипа дополнительно нанесена маркировка «198». На печатной плате имеются два разъема NVLink для объединения нескольких ускорителей в единый вычислительный кластер.
На момент анонса старший ускоритель Tesla P100 PCI-E был оценен в $5,699.