Nvidia geforce titan x pascal • Вэб-шпаргалка для интернет предпринимателей!

NVIDIA TITAN X (Pascal) — ультимативная модель графического ускорителя от NVIDIA, выпущенная в 2016 году. Процессор видеокарты основан на новой архитектуре Pascal, первым образцом которой явилась модель GeForce GTX 1080, выпущенная в этом же году, но чуть раньше. Революционная микроархитектура Pascal принесла новый 16-ти нанометровый техпроцесс, благодаря которому значительно выросла производительность видеокарт, но при этом снизилось их энергопотребление. И если при обзоре прошлой графической архитектуры Maxwell мы отмечали большой шаг вперед в связке производительность+энергопотребление, то сегодня NVIDIA совершила уже не просто шаг, а большой рывок в этом направлении.

NVIDIA TITAN X основана на графическом чипе GP102 с количеством транзисторов в 12 млрд. Видеоадаптер насчитывает 3584 потоковых процессора, 224 текстурных модуля (TMU) и 96 блоков растеризации (ROP). Видеокарта использует память GDDR5X с 384-битной шиной и её объемом в 12 Гбайт.

Рассмотрим технические характеристики подробнее.

При сравнении новинки в игровых и синтетических тестах с предшествующим GeForce GTX TITAN X на архитектуре Maxwell мы видим прирост производительности практически на 60 процентов.

Battlefield 4

129 fps	67 fps
Metro: Last Light	71 fps	51 fps
GTA V	99 fps	57 fps
Crysis 3	68 fps	52 fps
The Witcher 3: Wild Hunt	87 fps	46 fps

*Максимальное качество графики

В заключение остается добавить, что желающим приобрести самую мощную видеокарту 2016 года придется выложить $1200. Хотя.. подобные продукты и ориентированы, как правило на тех, кого не особо волнуют ценники.

Содержание

Оглавление
Вступление
- реклама
- реклама
Технические характеристики

⇡#NVIDIA GP102
⇡#Технические характеристики, цена
⇡#Конструкция
⇡#Плата
- Рекомендуем к прочтению

Вступление

Вопреки сложившимся традициям нынешнее поколение графических ускорителей существует в несколько урезанном виде. С одной стороны, компания AMD выпустила неполную линейку графических ядер. С другой – Nvidia, видя это, решила ограничиться моделями среднего и бюджетного классов. Действительно, в новой линейке GeForce GTX 10X0 ниша мощной видеокарты, какой в свое время была GeForce GTX 980 Ti, остается пустующей.

Наименование	Nvidia GeForce GTX Titan	Nvidia GeForce GTX Titan Black	Nvidia GeForce GTX Titan Z	Nvidia GeForce GTX Titan Х	Nvidia Titan X (Pascal)	Nvidia Tesla P40	Nvidia Quadro P6000	Nvidia Tesla P100	Nvidia Tesla P100
Кодовое имя	Kepler	Kepler	Kepler	Maxwell	Pascal	Pascal	Pascal	Pascal	Pascal
Версия	GK110	GK110	GK110	GM200	GP102	GP102	GP102	GP100	GP100
Техпроцесс, нм	28	28	28	28	16	16	16	16	16
Размер ядра/ядер, мм 2	561	561	561 x 2	601	471	471	471	610	610
Количество транзисторов, млн	7 100	7 100	7 100 x 2	8 000	12 000	12 000	12 000	15 300	15 300
Частота ядра, МГц	837	889	705	1000	1417	1303	1417	1126	1126
Частота ядра (Turbo), МГц	876	980	876	1075	1531	1531	1563	1303	1303
Число шейдеров (PS), шт.	2688	2880	5760	3072	3584	3840	3840	3584	3584
Число текстурных блоков (TMU), шт.	224	240	480	192	224	240	240	224	224
Число блоков растеризации (ROP), шт.	48	48	96	96	96	96	96	96	96
Максимальная скорость закраски, Гпикс/с	40.2	42.7	67.7	96	136
Максимальная скорость выборки текстур, Гтекс/с	188	213	338	192	317.4
Тип памяти	GDDR5	GDDR5	GDDR5	GDDR5	GDDR5X	GDDR5	GDDR5X	HBM2	HBM2
Эффективная частота памяти, МГц	1500	1750	1750	1750	2500	1800	2250	1400	1400
Объем памяти, Гбайт	6	6	6	12	12	24	24	16	12
Шина памяти, бит	384	384	384	384	384	384	384	4096	3072
Пропускная способность памяти, Гбайт/с	288	336	672	336	480	346	432	720	540
Питание, разъемы Pin	6 + 8	6 + 8	8 + 8	6 + 8	6 + 8
Потребляемая мощность, Ватт	250	250	375	250	250	250	250	250	250
CrossFire/Sli	V	V	V	V	V	—	—	—	—
Цена при анонсе, $	999	999	3000	999	1200
Дата анонса	19 февраля 2013	1 марта 2014	8 мая 2014	27 марта 2015	2 августа 2016	5 декабря 2016	2 октября 2016	5 декабря 2016	5 декабря 2016

Вся линейка моделей Titan включает несколько поколений, начиная с ядра Kepler. Сейчас в серию пошло третье поколение архитектуры на блочной конфигурации, поясню точнее…

Ядро GP102 в полной конфигурации содержит 3840 унифицированных процессоров, 240 TMU и 96 ROP. Для Titan X компания Nvidia сократила количество процессоров до 3584 штук, параллельно до 224 уменьшилось и число TMU. У новой модели есть полный брат-близнец – Quadro P6000. Видеокарта хоть и анонсирована, но появится в продаже ближе к середине зимы. Другое дело, ее характеристики. Мало того, что она получила полное ядро Pascal, так и частоты ничем не уступают новинке. Но если начистоту, то ее ценник вряд ли будет сопоставим с Nvidia Titan X (Pascal).

Еще один представитель Pascal – это Tesla P40 с полной конфигурацией и памятью GDDR5. Таким образом у GTX Titan Х есть два брата, но они совсем не близнецы, поскольку оснащены 3840 унифицированными процессорами и большим объемом памяти. С другой стороны ветви эволюции находится ядро GP100. И здесь все сложнее: по своим возможностям оно повторяет соотношение PS/TMU/ROP младшей версии GP102, но наделено памятью HBM2 и возможно большим числом потенциально установленных блоков FP64.

Еще раз повторю, все вышеописанное лишь мое личное предположение, и теоретически у компании Nvidia есть возможность выпустить GP100 с 3840 унифицированными процессорами в случае необходимости, либо при очередном ежегодном обновлении линейки.

Технические характеристики

Наименование	Nvidia GeForce GTX 1080	Nvidia Titan X (Pascal)
Кодовое имя	GP104	GP102
Версия	Pascal	Pascal
Техпроцесс, нм	16	16
Размер ядра/ядер, мм 2	314	471
Количество транзисторов, млн	7 200	12 000
Частота ядра, МГц	1607	1417
Частота ядра (Turbo), МГц	1734	1531
Число шейдеров (PS), шт.	2560	3584
Число текстурных блоков (TMU), шт.	160	224
Число блоков растеризации (ROP), шт.	64	96
Максимальная скорость закраски, Гпикс/с	102.8	136
Максимальная скорость выборки текстур, Гтекс/с	257.1	317.4
Тип памяти	GDDR5X	GDDR5X
Эффективная частота памяти, МГц	2500	2500
Объем памяти, Гбайт	8	12
Шина памяти, бит	256	384
Пропускная способность памяти, Гбайт/с	320.3	480
Питание, разъемы Pin	8	6 + 8
Потребляемая мощность (2D / 3D), Ватт	-/180	-/250
CrossFire/Sli	V	V
Цена при анонсе, $	650	1200
Заменяемая модель	GeForce GTX 980	GeForce GTX Titan

Очевидно, что со стороны AMD угрозы Titan X (Pascal) еще не предвидится, поэтому стоимость новой видеокарты достаточно высока. К тому же в Россию ее пока не завозят, но ключевое слово тут «пока», потому что в ближайшее время все изменится и несколько сотен поклонников марки Nvidia получат возможность купить новинку.

К слову, сама Nvidia позиционирует Titan X (Pascal) в первую очередь как эффективный инструмент для обучения нейросетей и решения задач, связанных с алгоритмами Deep Learning (глубокое обучение). Эти алгоритмы сегодня активно используются в самых разных областях: распознавание речи, изображений, видео, составление гидрометеорологических прогнозов, постановка более точных медицинских диагнозов, составление высокоточных карт, робототехника, самоуправляемые автомобили и не только. Нас же интересует игровая сторона вопроса.

Валерий Косихин

13 сентября 2016

Первым образцом архитектуры Pascal от NVIDIA, выпущенным на рынок, стал графический адаптер GeForce GTX 1080 на базе процессора GP104. Благодаря новому техпроцессу 16 нм FinFET, равно как и оптимизациям архитектуры и схемотехники чипа, GTX 1080 позволил достигнуть уровня быстродействия в играх, примерно на 30% превышающего достижения флагманской видеокарты NVIDIA предыдущего поколения — GeForce GTX TITAN X. В то же время разработчики GTX 1080 сумели сократить энергетический бюджет ускорителя на 70 Вт относительно TDP его предшественника — с 250 до 180 Вт. Между тем тепловой пакет 250 Вт является стандартной целью для топовых игровых видеокарт NVIDIA нескольких последних поколений, поэтому появление после GTX 1080 еще более производительного продукта, который займет эту нишу в линейке Pascal, оставалось лишь вопросом времени.

Начиная с архитектуры Kepler, NVIDIA использует следующую стратегию выпуска GPU различных категорий быстродействия. Сперва дебютирует чип второго эшелона: GK104 в семействе Kepler, GM204 — в Maxwell второй версии, и теперь — GP104 в Pascal. Впоследствии NVIDIA заполняет один-два эшелона ниже, и после существенного промежутка появляется графический процессор высшей категории, ложащийся в основу наиболее производительного ускорителя, который NVIDIA может произвести, сохраняя энергопотребление в рамках 250 Вт при текущем технологическом процессе.

Пиком развития архитектуры Pascal на данный момент является процессор GP100, отличительными свойствами которого стало беспрецедентное число шейдерных ALU (3840 ядер CUDA) и 16 Гбайт памяти типа HBM2, объединенные с GPU на кремниевой подложке. GP100 используется в составе ускорителя Tesla P100, применение которого ограничено сферой суперкомпьютеров в силу специального форм-фактора с шиной NVLINK и TDP в объеме 300 Вт. В конце года также ожидается выход Tesla P100 в стандартном формате платы расширения PCI Express.

Именно чип GP100, в мечтах энтузиастов индустрии, должен был в перспективе увенчать линейку игровых адаптеров GeForce 10, а предварительно NVIDIA могла бы выпустить новый TITAN — как раз с промежуточной остановкой на этой позиции предыдущие большие GPU прибыли в геймерские ПК (GK110 в составе TITAN и GM200 — в TITAN X).

Однако на этот раз, по всей видимости, оказались правы эксперты, предрекавшие окончательное разделение линейки GPU NVIDIA на две непересекающиеся группы — чипы игрового и просьюмерского (от слов producer и consumer) направления, с одной стороны, и чипы для вычислений — с другой. Дифференцирующим фактором в данном случае является скорость GPU в операциях над числами с плавающей точкой двойной точности (FP64). В линейке Kepler разработчики уже пожертвовали этой характеристикой для всех чипов (1/24 от FP32), помимо старшего — GK110/GK210 (1/3 от FP32), с целью снизить энергопотребление GPU. В следующем поколении эта тенденция усугубилась: все процессоры Maxwell работают с FP64 на скорости 1/32 от FP32.

Ситуация с Pascal показала, что экономия на производительности FP64 не осталась временной мерой, обусловленной задержкой на техпроцессе 28 нм. NVIDIA по-прежнему нуждается в GPU для серверов, суперкомпьютеров и рабочих станций, способном оперировать FP64 на высоком уровне быстродействия. Однако для игровых видеоадаптеров эта функциональность, раздувающая транзисторный бюджет и энергопотребление GPU, является лишь обузой.

Таким образом, вместо того, чтобы перенести GP100 (очевидно дорогой в производстве чип как из-за площади, так и из-за интегрированной памяти HBM2) в игровые видеокарты, NVIDIA выпустила дополнительный продукт — GP102, сфокусированный на операциях с FP32 — основном формате чисел, применяемом и рендеринге 3D-графики, и в ряде вычислительных задач. Единственная функциональная особенность GP102 — поддержка целочисленных операций формата int8. Это важный пункт для NVIDIA, поскольку int8 широко применяется в задачах машинного обучения, которые компания сделала для себя одним из приоритетных направлений (конкретнее, один из классов таких задач — глубинное обучение). В скором будущем мы планируем выпустить отдельную статью, посвященную этой теме.

Новый TITAN X, ставший первым устройством на базе процессора GP102, позиционируется в первую очередь именно как ускоритель профессионального класса, который предназначен для исследований и коммерческих приложений, связанных с глубинным обучением. Это подтверждает и отсутствие бренда GeForce в названии карты. Однако широкие игровые возможности новинки также не подлежат сомнению. Все «Титаны», выпущенные ранее, помимо их вычислительных функций, рассматривались как игровые видеокарты премиум-класса, способные обеспечить качество графики и быстродействие, недоступные современным им моделям в основной линейке GeForce.

⇡#NVIDIA GP102

Данный GPU задуман как альтернатива суперкомпьютерному GP100, не уступающая последнему в функциях рендеринга 3D-графики и расчетах FP32. Вместе с тем создатели GP102 сократили все компоненты, не соответствующие назначению продукта.

К примеру, отдельно взятый SM (Streaming Multiprocessor — блок, объединяющей ядра CUDA вместе с блоками наложения текстур, планировщиками, диспетчерами и сегментами локальной памяти) в GP100 содержит 64 ядра CUDA для операций FP32, в то время как SM в GP102 обладает в этом отношении конфигурацией, унаследованной от Maxwell: 128 ядер CUDA. Более дробное распределение ядер CUDA в GP100 позволяет процессору одновременно исполнять больше потоков инструкций (и также групп потоков — warps — и блоков warp’ов), а общий объем таких типов хранилища внутри SM, как разделяемая память (shared memory) и регистровый файл, в пересчете на весь GPU увеличился по сравнению с архитектурой Maxwell.

Блок-схема NVIDIA GP102

Далее, в GP100 на каждые 64 ядра CUDA для операций FP32 приходится по 32 ядра для FP64, в то время как SM в GP102 обладает в этом отношении конфигурацией, унаследованной от Maxwell: 128 ядер CUDA для FP32 и 4 для FP64. Отсюда урезанная производительность GP102 в работе с операциями двойной точности.

Наконец, GP100 несет более крупный кеш второго уровня: 4096 Кбайт против 3072 Кбайт в GP102. И разумеется, в GP102 отсутствует контроллер шины NVLINK, а место контроллеров памяти HBM2 (с общей разрядностью шины в 4096 бит) занимают контроллеры GDDR5X SDRAM. 12 таких 32-битных контроллеров обеспечивают общую 384-битную шину доступа к памяти.

В остальных интересующих нас аспектах чипы GP100 и GP102 идентичны. Оба кристалла содержат 3840 FP32-совместимых ядер CUDA и 240 блоков наложения текстур, а также 96 ROP. Таким образом, с общей точки зрения структура вычислительных блоков GP102 повторяет таковую у чипа GP104, с поправкой на количественные изменения. Хотя нам все еще неизвестны некоторые параметры (объемы кеша L1, shared memory и регистрового файла), они, вероятно, одинаковы в этих двух GPU.

Кристалл GP102, произведенный по техпроцессу 16 нм FinFET на мощностях TSMC, содержит 12 млрд транзисторов на площади 471 мм 2 . Для сравнения: характеристики GP100 — 15,3 млрд транзисторов и 610 мм 2 . Это весьма существенная разница. Кроме того, если TSMC не увеличила размер фотомаски для техпроцесса 16 нм по сравнению с 28 нм, то GP100 его практически исчерпывает, в то время как облегченная архитектура GP102 позволит NVIDIA в будущем создать более крупное ядро для широкого потребительского рынка, пользуясь той же производственной линией (что, однако, вряд ли случится, если разработчики не пересмотрят свои стандарты в отношении TDP топовых моделей).

По поводу отличий архитектуры Pascal от Maxwell рекомендуем обратиться к нашему обзору GeForce GTX 1080. В этой итерации разработчики развили достоинства предыдущего поколения и компенсировали присущие ему недостатки.

Кратко отметим следующие пункты:

улучшенная компрессия цвета с соотношениями вплоть до 8:1;
функция Simultaneous Multi-Projection геометрического движка PolyMorph Engine, позволяющая за один проход создавать вплоть до 16 проекций геометрии сцены (для VR и систем с несколькими дисплеями в конфигурации NVIDIA Surround);
возможность прерывания (preemption) в процессе исполнения draw call (при рендеринге) и потока команд (при вычислениях), которая вместе с динамическим распределением вычислительных ресурсов GPU обеспечивает полноценную поддержку асинхронных вычислений (Async Compute) — дополнительного источника быстродействия в играх под API DirectX 12 и сниженной латентности в VR;
контроллер дисплея, совместимый с интерфейсами DisplayPort 1.3/1.4 и HDMI 2.b. Поддержка высокого динамического диапазона (HDR);
шина SLI с повышенной пропускной способностью.

⇡#Технические характеристики, цена

В TITAN X не используется полностью функциональная версия графического процессора GP102: из 30 SM здесь отключены два. Таким образом, по числу ядер CUDA и текстурных блоков «Титан» совпадает с Tesla P100, где чип GP100 также частично «порезан» (3584 ядра CUDA и 224 текстурных блока).

Графический процессор новинки работает на более высоких частотах (1417/1531 МГц), чем в Tesla P100 (вплоть до 1328/1480 МГц в суперкомпьютерной версии и вплоть до 1300 МГц в форм-факторе платы PCI-Express). И все же частоты «Титана» довольно консервативны по сравнению с характеристиками GeForce GTX 1080 (1607/1733 МГц). Как мы увидим в экспериментах с разгоном, ограничивающим фактором стало энергопотребление устройства, которое NVIDIA установила на привычном уровне 250 Вт.

TITAN X оснащен 12 Гбайт памяти GDDR5X SDRAM с пропускной способность 10 Гбит/с на контакт. 384-битная шина обеспечивает передачу данных на скорости 480 Гбайт/с: по этому показателю TITAN X лишь ненамного уступает действующему рекордсмену — Radeon R9 Fury X, как и прочим продуктам AMD на базе GPU Fiji (512 Гбайт/с).

Производитель	NVIDIA
Модель	GeForce GTX TITAN	GeForce GTX TITAN Black	GeForce GTX TITAN Z	GeForce GTX TITAN X	GeForce GTX 1080	TITAN X
Графический процессор
Название	GK110	GK110	2 × GK110	GM200	GP104	GP102
Микроархитектура	Kepler	Kepler	Kepler	Maxwell	Pascal	Pascal
Техпроцесс, нм	28 нм	28 нм	28 нм	28 нм	16 нм FinFET	16 нм FinFET
Число транзисторов, млн	7 080	7 080	2 × 7080	8 000	7 200	12 000
Тактовая частота, МГц: Base Clock / Boost Clock	837/876	889/980	705/876	1 000 / 1 089	1 607 / 1 733	1 417 / 1531
Число шейдерных ALU	2 688	2 880	2 × 2880	3 072	2 560	3 584
Число блоков наложения текстур	224	240	2 × 240	192	160	224
Число ROP	48	48	2 × 48	96	64	96
Оперативная память
Разрядность шины, бит	384	384	2 × 384	384	256	384
Тип микросхем	GDDR5 SDRAM	GDDR5 SDRAM	GDDR5 SDRAM	GDDR5 SDRAM	GDDR5X SDRAM	GDDR5X SDRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с)	1 502 (6 008)	1 750 (7 000)	1 750 (7 000)	1 753 (7 012)	1 250 (10 000)	1 250 (10 000)
Объем, Мбайт	6 144	6 144	2 × 6144	12 288	8 192	12 288
Шина ввода/вывода	PCI Express 3.0 x16	PCI Express 3.0 x16	PCI Express 3.0 x16	PCI Express 3.0 x16	PCI Express 3.0 x16	PCI Express 3.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты)	4 709	5 645	10 092	6 691	8 873	10 974
Производительность FP32/FP64	1/3	1/3	1/3	1/32	1/32	1/32
Пропускная способность оперативной памяти, Гбайт/с	288	336	2 × 336	336	320	480
Вывод изображения
Интерфейсы вывода изображения	DL DVI-I, DisplayPort 1.2, HDMI 1.4a	DL DVI-I, DisplayPort 1.2, HDMI 1.4a	DL DVI-D, DL DVI-I, DisplayPort 1.2, HDMI 1.4a	DL DVI-I, DisplayPort 1.2, HDMI 1.4a	DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b	DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b
TDP, Вт	250	250	375	250	180	250
Рекомендованная розничная цена на момент выхода (США, без налога), $	999	999	2 999	999	599/699	1 200
Рекомендованная розничная цена на момент выхода (Россия), руб.	34 990	35 990	114 990	74 900	— / 54 990	—

Что касается теоретических показателей быстродействия, то TITAN X стал первой однопроцессорной графической картой, превысившей отметку в 10 TFLOPS по производительности FP32. Из предыдущих продуктов NVIDIA на это был способен только TITAN Z, построенный на паре чипов GK110. С другой стороны, в отличие от Tesla P100 (и аналогично GeForce GTX 1060/1070/1080), TITAN X характеризуется весьма скромным быстродействием в расчетах двойной (1/32 от FP32) и половинной точности (1/64 от FP32), однако способен выполнять операции с числами int8 на скорости в 4 раза выше, чем с FP32. Другие GPU семейства Pascal — GP104 (GeForce GTX 1070/1080, Tesla P4) и GP106 (GTX 1060) и GP100 (Tesla P100) также поддерживают int8 с соотношением быстродействия 4:1 относительно FP32, однако нам на данный момент неизвестно, ограничена ли эта функциональность в игровых видеокартах GeForce.

TITAN X — весьма и весьма дорогое приобретение, на которое решатся только те, кто действительно желает обладать столь совершенной видеокартой. NVIDIA увеличила цену на $200 по сравнению с предыдущими однопроцессорными моделями под этой маркой — до $1 200. На этот раз устройство не распространяется через партнерские компании и продается исключительно на веб-сайте NVIDIA в ряде избранных стран. Россия пока не входит в их число.

⇡#Конструкция

Корпус видеокарты выполнен в единой стилистике с продуктами под маркой Founders Edition линейки GeForce 10. Система охлаждения с радиальным вентилятором (турбинка) покрыта металлическим кожухом, а заднюю поверхность печатной платы защищает толстая пластина. Часть последней можно снять, дабы обеспечить беспрепятственный доступ воздуха к кулеру соседней видеокарты в режиме SLI. Забавно, что хотя TITAN X формально больше не принадлежит к семейству GeForce, именно эта надпись, подсвеченная зелеными светодиодами, по-прежнему красуется на боку видеокарты.

TITAN X обладает такими же габаритами, как и GeForce GTX 1070/1080 референсных версий, но отличается черным цветом кожуха. Радиатор системы охлаждения, напротив, не окрашен.

Конструкция кулера такая же, как у GTX 1070/1080: GPU отдает тепло радиатору с испарительной камерой, а микросхемы оперативной памяти и транзисторы преобразователя напряжения накрыты массивной алюминиевой рамой, несущей отдельный блок ребер небольшого размера.

Между прочим, как выяснил один из обладателей TITAN X, NVIDIA позволяет пользователям сменить систему охлаждения видеокарты на нечто более эффективное (например, СЖО) без потери гарантии.

⇡#Плата

Подобно референсным версиям GTX 1060/1070/1080, плата TITAN X имеет три разъема DisplayPort и по одному разъему DVI и HDMI.

Система питания построена по схеме 6+1 (количество фаз для GPU и чипов памяти). Используются два разъема дополнительного питания — шести- и восьмиконтактный, что вместе с силовыми линиями в разъеме PCI-Express обеспечивает видеокарте резерв мощности в 300 Вт.

Память типа GDDR5X SDRAM, как и на GeForce GTX 1080, набрана микросхемами Micron D9TXS со штатной эффективной частотой 10 ГГц.