Титан икс карта. Обзор и тестирование супервидеокарты NVIDIA TITAN X: демонстрация превосходства
Весна - это время не только просыпающейся природы, но и время для традиционного анонса флагманской однокристальной видеокарты линейки Titan. И хотя первая демонстрация NVIDIA GeForce GTX Titan X прошла неожиданно, этот анонс был обставлен рядом слухов. Пару дней назад прошла официальная презентация этой видеокарты, в течение нескольких дней у нас была возможность ее детального изучения. Чем же она может похвастаться, посмотрим далее.
NVIDIA GeForce GTX Titan X стала четвертой в линейке и третьим «титаном» на однокристальной системе. Напомню, обособленно стоит GeForce GTX Titan Z с двумя GPU. Конечно, мы понимаем, что подобные системы нельзя назвать «народными», но даже при отсутствии 1000-1300 долларов, этот обзор может быть интересен для ознакомления с архитектурой Maxwell в ее максимальной на сегодня реализации. Как и ожидалось, в основе лежит ядро GM200, второе поколение этой архитектуры. Идет оно с движком PolyMorph Engine 3.0 с поддержкой функций feature level Direct3D 12 и аппаратного ускорения технологии глобального освещения. Может, это и будет тот прорыв в реализме и графике, которого так долго ждут в игровой индустрии?
GM200 содержит 8 миллиардов транзисторов, 256 ROP, 3072 CUDA и 384-битную шину памяти. Все это вооружение нацелено на поддержку 4K-разрешения и улучшение работы в 3D-режиме. Базовая частота ядра составляет: 1000 МГц, Boost Clock - 1076 МГц. Память функционирует на частоте 7012 МГц. На борту 12 Гбайт графической памяти, до выхода Titan X этот объем был недоступен для видеокарт, нацеленных на геймеров.
Видео обзор NVIDIA GeForce GTX Titan X
Внешний вид
NVIDIA GeForce GTX Titan X не стала революцией в дизайне топовых видеокарт, внешний вид изменился слабо. Используется система воздушного охлаждения, которая внешне повторяет то, что мы видели ранее.
Правки тут небольшие, ограничены они изменением окраски корпуса. Теперь он практически полностью окрашен в черный цвет.
Видеокарта лишена усиливающей платы на обратной стороне печатной плате. Напомню, в GeForce GTX 980 в референсном дизайне она была.
На заднюю панель выведены: три DisplayPort, HDMI и DVI. В режиме общего рабочего пространства могут работать три разъема, но подключить можно и все 5 разъемов одновременно. Такой же подход применен во всей линейке 900.
На боковой грани светящий логотип NVIDIA GeForce GTX. К сожалению, эффектные изображения светящегося вентилятора остались только фотографиями.
Охлаждение
Конструкция установленной системы охлаждения повторяет ту, которая использовалась в GeForce GTX 780 Ti.
Используется испарительная камера, показавшая с себя с сильной стороны при отводе большого объема тепла на радиатор.
Система разборная, так можно полностью убрать теплорассеиватель, пригодиться это может для установки системы водяного охлаждения.
Начинка
Перекочевала и система питания, несмотря на упоминания по изменению, при осмотре это все те же конденсаторы и дроссели. Даже ШИМ-контроллер нам знаком - NCP4206.Но не буду драматизировать, у нас самих даже в длительных нагрузках не удалось найти шум и писк, о которых упоминали в комментариях к ряду видеокарт.
Сохранилась и планка по увеличению напряжения. В NVIDIA GeForce GTX Titan X его можно увеличить в пределах 25 Вт (TDP 250 Вт/275 Вт).
Распаяно 12 Гбайт чипов памяти SKhynix c частотой 1750 МГц, всего их тут 24.
Тестирование NVIDIA GeForce GTX Titan X
Использовался тестовый стенд.
Модель | Данные |
---|---|
Корпус | Aerocool Strike-X Air |
Материнская плата | Biostar Hi-Fi Z87X 3D |
Процессор | Intel Core i5-4670K Haswell |
Кулер для процессора | DeepCool Ice Blade Pro v2.0 |
Видеокарта | Inno3D iChill GeForce GTX 780Ti HerculeZ X3 Ultra |
Оперативная память | Corsair CMX16GX3M2A1600C11 DDR3-1600 16 Гб Kit CL11 |
Жесткий диск | ADATA XPG SX900 256 ГБ |
Жесткий диск 2 | WD Red WD20EFRX |
Блок питания | Aerocool Templarius 750W |
Wi-Fi адаптер | TP-LINK TL-WDN4800 |
Аудио | Creative Sound Blaster EVO Wireless |
Монитор | iiyama ProLite E2773HDS |
Монитор 2 | Philips 242G5DJEB |
Мышка | ROCCAT Kone XTD |
Клавиатура | Razer BlackWidow Chroma |
Стабилизатор | Sven AVR PRO LCD 10000 |
Операционная система | Microsoft Windows Ultimate 8 64-bit |
Во всех таблицах ниже данные приводятся с использованием заводских настроек, фирменное ПО производителей не устанавливается. Частоты памяти и ядра также не затрагиваются с целью исключения влияния посторонних факторов.
1. Температурный режим работы видеокарты
- NVIDIA GeForce GTX Titan X - 31/83
- Inno3D iChill GeForce GTX 960 Ultra - 29/44
- GeForce GTX 980 - 34/79
- GeForce GTX 770 - 35/80
- GeForce GTX 780 - 35/77
- GeForce GTX 760 - 35/84
2. Шум
- NVIDIA GeForce GTX Titan X - 36/42
- GeForce GTX 980 - 34/79
3. Энергопотребление
- NVIDIA GeForce GTX Titan X - 405
- Inno3D iChill GeForce GTX 960 Ultra - 260
- GeForce GTX 980 - 295
- Inno3D iChill GeForce GTX 780Ti HerculeZ X3 Ultra - 340
- NVIDIA GeForce GTX Titan X - 7133
- Inno3D iChill GeForce GTX 960 Ultra - 3522
- GeForce GTX 980 - 6050
- Inno3D iChill GeForce GTX 780Ti HerculeZ X3 Ultra - 6190
Пришло время самых зрелищных тестов, замеры FPS в ресурсоёмких играх. Ряд таблиц мы сопровождаем наглядными видеороликами с записями во время игры. Данные снимаются с Full HD разрешением при Ultra настройках. Стоит учесть, что в ряде моментов в видеороликах реальные данные по FPS ниже, чем полученные во время тестовых прогонов, это связано с затратой ресурсов на видеозапись. Для этой видеокарты мы отдельно протестировали работу на разрешении 3840x2160 на Ultra настройках.
6. Crysis 3
Crysis 3 - 3840x2160 - Very High 4x AA
- 22.
- Inno3D iChill GeForce GTX 960 Ultra - 45
- GeForce GTX 980 - 69
- Inno3D iChill GeForce GTX 780Ti HerculeZ X3 Ultra - 61
- GeForce GTX 770 - 43
- GeForce GTX 780 - 47
7. Battlefield 4
Battlefield 4 - 3840x2160 - Ultra
- 39
- NVIDIA GeForce GTX Titan X - 75
- Inno3D iChill GeForce GTX 960 Ultra - 52
- GeForce GTX 980 - 91
- Inno3D iChill GeForce GTX 780Ti HerculeZ X3 Ultra - 82
8. Hitman: Absolution
Очень требовательная игра, на движке Glacier 2. Аппетиту игры способны позавидовать другие новинки года.
Hitman: Absolution - 3840x2160 - High, 2x MSAA, 16x AF
- 46
- NVIDIA GeForce GTX Titan X - 95
- Inno3D iChill GeForce GTX 960 Ultra - 44/li>
- GeForce GTX 980 - 70
- Inno3D iChill GeForce GTX 780Ti HerculeZ X3 Ultra - 62
- GeForce GTX 770 - 43
- GeForce GTX 780 - 55
- GeForce GTX 760 - 41
9. Metro Last Light
Ещё одна требовательная к железу игра, использующая DirectX 11 и тесселяцию.
Metro Last Light - 3840x2160 - Very high
- 35
10. Middle Earth: Shadow Mordor
- Inno3D iChill GeForce GTX 960 Ultra - 51
- GeForce GTX 980 - 111
11. Tomb Raider
- NVIDIA GeForce GTX Titan X - 156
- Palit GeForce GTX 960 Super JetStream - 64
- Inno3D iChill GeForce GTX 960 Ultra - 68
- GeForce GTX 980 - 100
12. Watch Dogs Ultra 4x AA
- NVIDIA GeForce GTX Titan X - 80
- Inno3D iChill GeForce GTX 960 Ultra - 49
- GeForce GTX 980 - 62
13. Total War: Rome II Extreme
- NVIDIA GeForce GTX Titan X - 79
- Inno3D iChill GeForce GTX 960 Ultra - 41
- GeForce GTX 980 - 70
14. GRID Autosport Ultra 4x MSAA
- NVIDIA GeForce GTX Titan X - 154
- Inno3D iChill GeForce GTX 960 Ultra - 80
- GeForce GTX 980 - 128
15. World of Tanks
- NVIDIA GeForce GTX Titan X - 124
- Palit GeForce GTX 960 Super JetStream - 71
- Inno3D iChill GeForce GTX 960 Ultra - 75
- GeForce GTX 980 - 116
16. World of Warships
Это новый раздел наших тестов, пока количество протестированных видеокарт ограничено, до конца марта будет представлен комплексный материал. Игру World of Warships сложно оценивать в плане эффективности использования графики, но в целом эти данные могут быть полезны при сборке системы целенаправленно под игры Wargaming.
- NVIDIA GeForce GTX Titan X - 72
- Inno3D iChill GeForce GTX 780Ti - 72
- Palit GeForce GTX 960 Super JetStream - 59
- Radeon R9 280x - 70
- Radeon R9 280x - 70
Разгон
По традиции мы не ограничиваемся тестом на штатных частотах. Для разгона используется программа MSI Afterburner последней на момент тестирования версии. Для NVIDIA GeForce GTX Titan X нам удалось достигнуть следующих результатов без повышения напряжения ядра:Для сравнения увеличения быстродействия используется синтетический тест 3D Mark FireStrike:
Есть потенциал для дальнейшего разгона при максимальном подъеме напряжения. Частоту ядра можно поднять до 1202 МГц и 7806 МГц по памяти. Здесь максимальная планка температуры повышается до 88 градусов.
Итоги по NVIDIA GeForce GTX Titan X
NVIDIA GeForce GTX Titan X продемонстрировала рост быстродействия на фоне снижения энергопотребления. При текущем раскладе сил, это максимальная производительность на однокристальной системе. Адекватных ответов со стороны AMD Radeon до текущего момента не заявлено. В качестве альтернативы можно рассматривать сохраняющую актуальность GTX 780 Ti, GTX 980 в режиме SLI, Radeon R9 290X. Интересна она будет и для рендеринга видео.NVIDIA GeForce GTX Titan X получает заслуженную награду "Золото..
Nvidia Geforce GTX Titan X
Самый мощный однопроцессорный ускоритель
- Часть 2 — Практическое знакомство
Из-за позднего получения тестового образца нового ускорителя (и ПО к нему), а также из-за участия нашего автора Алексея Берилло в работе GTC, части этого обзора, посвященные архитектуре нового продукта Nvidia и анализу синтетических тестов, выйдут позже (примерно через неделю). А сейчас мы представляем материал, знакомящий читателей с особенностями видеокарты, а также с результатами игровых тестов.
Устройство(а)
Nvidia Geforce GTX Titan X 12288 МБ 384-битной GDDR5 PCI-E | ||
---|---|---|
Параметр | Значение | Номинальное значение (референс) |
GPU | Geforce GTX Titan X (GM200) | |
Интерфейс | PCI Express x16 | |
Частота работы GPU (ROPs), МГц | 1000—1075 | 1000—1075 |
Частота работы памяти (физическая (эффективная)), МГц | 1750 (7000) | 1750 (7000) |
Ширина шины обмена с памятью, бит | 384 | |
Число вычислительных блоков в GPU/частота работы блоков, МГц | 24/1000—1075 | 24/1000—1075 |
Число операций (ALU) в блоке | 128 | |
Суммарное число операций (ALU) | 3072 | |
Число блоков текстурирования (BLF/TLF/ANIS) | 192 | |
Число блоков растеризации (ROP) | 96 | |
Размеры, мм | 270×100×35 | 270×100×35 |
Количество слотов в системном блоке, занимаемые видеокартой | 2 | 2 |
Цвет текстолита | черный | черный |
Энергопотребление (пиковое в 3D/в режиме 2D/в режиме «сна»), Вт | 257/98/14 | 257/98/14 |
Уровень шума (в режиме 2D/в режиме 2D (просмотр видео)/в режиме максимального 3D), дБА | 20/21/29,5 | — |
Выходные гнезда | 1×DVI (Dual-Link/HDMI), 1×HDMI 2.0, 3×DisplayPort 1.2 | |
Поддержка многопроцессорной работы | SLI | |
Максимальное количество приемников/мониторов для одновременного вывода изображения | 4 | 4 |
Дополнительное питание: количество 8-контактных разъемов | 1 | 1 |
Дополнительное питание: количество 6-контактных разъемов | 1 | 1 |
Максимальное разрешение 2D: DP/HDMI/Dual-Link DVI/Single-Link DVI | ||
Максимальное разрешение 3D: DP/HDMI/Dual-Link DVI/Single-Link DVI | 3840×2400/3840×2400/2560×1600/1920×1200 |
Комплектация локальной памятью | ||
---|---|---|
Картa имеeт 12288 МБ памяти GDDR5 SDRAM, размещенной в 24 микросхемах по 4 Гбит (по 12 на каждой стороне PCB). В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационную программу Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010) . Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain , также известная, как Island11. Синтетические тесты проводились на следующих видеокартах:
Для анализа производительности новой модели видеокарты Geforce GTX Titan X были выбраны именно эти решения по следующим причинам. Geforce GTX 980 основана на графическом процессоре этой же архитектуры Maxwell, но более низкого уровня — GM204, и нам будет очень интересно оценить, что дало усложнение чипа до GM200. Ну а двухчиповая видеокарта Geforce GTX Titan Z взята просто для ориентира — как самая производительная видеокарта Nvidia, основанная на паре чипов GK110 предыдущей архитектуры Kepler. От конкурирующей компании AMD для нашего сравнения мы также выбрали две видеокарты. Они очень разные в принципе, хотя и основаны на одинаковых графических процессорах Hawaii — просто на картах разное количество GPU и они отличаются по позиционированию и цене. Ценовых конкурентов у Geforce GTX Titan X нет, поэтому мы взяли самую мощную двухчиповую видеокарту Radeon R9 295X2, хотя такое сравнение будет не слишком интересно технически. Для последнего взята быстрейшая одночиповая видеокарта конкурента — Radeon R9 290X, хотя она выпущена слишком давно и основана на GPU явно меньшей сложности. Но другого выбора из решений AMD просто нет. Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)Мы отказались от устаревших DirectX 9 тестов, так как сверхмощные решения вроде Geforce GTX Titan X показывают в них не слишком показательные результаты, будучи всегда ограничены ПСП, филлрейтом или текстурированием. Не говоря уже о том, что двухчиповые видеокарты далеко не всегда корректно работают в таких приложениях, а их у нас целых две. Во вторую версию RightMark3D вошли два уже знакомых нам теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также еще два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы. Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере. Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот. Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым. Производительность в данном тесте зависит от количества и эффективности блоков TMU, влияет также и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются до полутора раза ниже, чем при «Low». В задачах процедурной визуализации меха с большим количеством текстурных выборок, с выпуском видеочипов на базе архитектуры GCN компания AMD давно перехватила лидерство. Именно платы Radeon и по сей день являются лучшими в этих сравнениях, что говорит о большей эффективности выполнения ими этих программ. Такой вывод подтверждается и сегодняшним сравнением — рассматриваемая нами видеокарта Nvidia проиграла даже устаревшей одночиповой Radeon R9 290X, не говоря уже про ближайшего ценового конкурента от AMD. В первом Direct3D 10 тесте новая видеоплата модели Geforce GTX Titan X оказалась чуть быстрее своей младшей сестры на чипе этой же архитектуры в виде GTX 980, но отставание последней невелико — 9-12%. Такой результат объясним заметно меньшей скоростью текстурирования у GTX 980, да и по остальным параметрам она отстаёт, хотя дело явно не в производительности блоков ALU. Двухчиповая Titan Z быстрее, но не так, как Radeon R9 295X2. Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: в такой ситуации что-то должно измениться, и ПСП с филлрейтом будут влиять меньше: В усложнённых условиях новая видеокарта модели Geforce GTX Titan X уже заметнее опережает младшую модель из этого же поколения — GTX 980, оказываясь быстрее уже на приличные 33-39%, что куда ближе к теоретической разнице между ними. Да и отставание от конкурентов в виде Radeon R9 295X2 и R9 290X сократилось — новинка от Nvidia почти догнала одночиповую Radeon. Впрочем, двухчиповая осталась далеко впереди, ведь чипы компании AMD предпочитают попиксельные вычисления и в подобных вычислениях очень сильны. Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга: Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis, Lost Planet и многих других. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High». Диаграмма в целом схожа с предыдущей, также без включения суперсэмплинга, и в этот раз новая Geforce GTX Titan X оказалась чуть ближе к GTX Titan Z, проигрывая двухчиповой плате на паре GPU семейства Kepler не так уж много. В разных условиях новинка на 14-19% опережает предыдущую топовую модель текущего поколения от Nvidia, и даже если брать сравнение с видеокартами AMD, то тут кое-что изменилось — в этом случае новинка GTX Titan X чуть уступает Radeon R9 290X совсем немного. Двухчиповая R9 295X2, впрочем, далеко впереди всех. Посмотрим, что изменит включение суперсэмплинга: При включении суперсэмплинга и самозатенения задача становится тяжелее, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт немного изменилась, хотя включение суперсэмплинга сказывается меньше, чем в предыдущем случае. Графические решения AMD Radeon и в этом D3D10-тесте пиксельных шейдеров работают эффективнее, по сравнению с конкурирующими платами Geforce, но новый чип GM200 изменяет ситуацию в лучшую сторону — плата Geforce GTX Titan X на чипе архитектуры Maxwell уже во всех условиях опережает Radeon R9 290X (впрочем, основанный на заметно менее сложном GPU). Двухчиповое решение на паре Hawaii осталось лидером, ну а по сравнению с другими решениями Nvidia новинка неплоха. Она показала скорость почти на уровне двухчиповой Geforce GTX Titan Z, и обогнала Geforce GTX 980 на 28-33%. Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере. Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos. Результаты предельных математических тестов чаще всего соответствуют разнице по частотам и количеству вычислительных блоков, но лишь примерно, так как на результаты влияет и разная эффективность их использования в конкретных задачах, и оптимизация драйверов, и новейшие системы управления частотами и питанием, и даже упор в ПСП. В случае теста Mineral, новая модель Geforce GTX Titan X лишь на 10% быстрее платы GTX 980 на чипе GM204 из этого же поколения, да и двухчиповая GTX Titan Z оказалась не так уж быстра в этом тесте — платам Nvidia явно что-то мешает раскрыться. Сравнение Geforce GTX Titan X с конкурирующими платами компании AMD было бы не таким печальным, если бы GPU в R9 290X и Titan X были близки по сложности. Но GM200 гораздо крупнее, чем Hawaii, и его небольшая победа вполне естественна. Обновление архитектуры Nvidia с Kepler до Maxwell привело к тому, что новые чипы в таких тестах приблизились к конкурирующим решениям от AMD. Но даже меньшее по стоимости двухчиповое решение Radeon R9 295X2 заметно быстрее. Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки: Во втором математическом тесте из RigthMark мы видим уже иные результаты видеокарт относительно друг друга. Так, новая Geforce GTX Titan X уже сильнее (на 20%) опережает GTX 980 на чипе той же графической архитектуры, да и двухчиповый Geforce очень близок к новинке — Maxwell справляется с расчётными задачами заметно лучше Kepler. Radeon R9 290X остался позади, но как мы уже писали — GPU Hawaii заметно проще, чем GM200, и такая разница логична. Но хотя двухчиповый Radeon R9 295X2 продолжает оставаться лидером в тестах математических вычислений, в целом в таких задачах новый видеочип Nvidia показал себя неплохо, хотя и не достиг теоретической разницы с GM204. Direct3D 10: тесты геометрических шейдеровВ пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10. Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково. Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности: Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для мощных современных видеокарт очень простая, и производительность в ней ограничена скоростью обработки геометрии, а иногда и пропускной способностью памяти и/или филлрейтом. Разница между результатами видеокарт на чипах Nvidia и AMD обычно есть в пользу решений калифорнийской компании, и она обусловлена отличиями в геометрических конвейерах чипов этих компаний. Вот и в данном случае, топовые видеочипы Nvidia имеют много блоков по обработке геометрии, поэтому и выигрыш налицо. В тестах геометрии платы Geforce всегда конкурентоспособнее Radeon. Новая модель Geforce GTX Titan X слегка отстаёт от двухчиповой платы GTX Titan Z на графических процессорах предыдущего поколения, но GTX 980 она обгоняет на 12-25%. Видеокарты Radeon показывают заметно отличающиеся результаты, так как R9 295X2 основана на паре GPU, и только она может поспорить с новинкой в этом тесте, а Radeon R9 290X стала аутсайдером. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер: При изменении нагрузки в этом тесте цифры изменились незначительно, для плат AMD и для решений Nvidia. И это ничего особенно не меняет. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и выводы остаются прежними. К сожалению, «Hyperlight» — второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD просто не работает. В какой-то момент очередное обновление драйверов Catalyst привело к тому, что данный тест перестал запускаться на платах этой компании, и это не исправлено вот уже несколько лет. Direct3D 10: скорость выборки текстур из вершинных шейдеровВ тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет. Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»: Наши предыдущие исследования показали, что на результаты этого теста может влиять и филлрейт и пропускная способность памяти, что хорошо заметно по результатам плат Nvidia, особенно в простых режимах. Новая видеокарта компании Nvidia в этом тесте показывает скорость явно ниже, чем должна — все платы Geforce оказались примерно на одном уровне, что явно не соответствует теории. Они во всех режимах явно упираются во что-то типа ПСП. Впрочем, Radeon R9 295X2 тоже далеко не вдвое быстрее R9 290X. Кстати, одночиповая плата от AMD в этот раз оказалась сильнее всех плат от Nvidia в лёгком режиме и примерно на их уровне в тяжёлом. Ну а двухчиповая Radeon R9 295X2 снова стала лидером нашего сравнения. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок: Ситуация на диаграмме слегка изменилась, одночиповое решение компании AMD в тяжелых режимах потеряло значительно больше плат Geforce. Новая модель Geforce GTX Titan X показала скорость до 14% быстрее, чем Geforce GTX 980, и выиграла у одночиповой Radeon во всех режимах, кроме самого лёгкого — из-за всё того же упора во что-то. Если сравнивать новинку с двухчиповым решением AMD, то Titan X смогла дать бой в тяжёлом режиме, показав близкую производительность, но отстав в лёгких режимах. Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту. Результаты во втором тесте вершинного текстурирования «Waves» совсем не похожи на то, что мы видели на предыдущих диаграммах. Скоростные показатели всех Geforce в этом тесте серьёзно ухудшились, и новая модель Nvidia Geforce GTX Titan X показывает скорость лишь чуть быстрее GTX 980, отставая от двухчиповой Titan Z. Если сравнивать новинку с конкурентами, то обе платы Radeon смогли показать лучшую производительность в этом тесте во всех режимах. Рассмотрим второй вариант этой же задачи: С усложнением задачи во втором тесте текстурных выборок скорость всех решений стала ниже, но видеокарты Nvidia пострадали сильнее, в том числе и рассматриваемая модель. В выводах почти ничего не меняется, новая модель Geforce GTX Titan X до 10-30% быстрее, чем GTX 980, отстав и от двухчиповой Titan Z, и от обеих плат Radeon. Далеко впереди в этих тестах оказалась Radeon R9 295X2, и с точки зрения теории это просто необъяснимо ничем, кроме недостаточной оптимизации от Nvidia. 3DMark Vantage: тесты FeatureСинтетические тесты из пакета 3DMark Vantage покажут нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10, до сих пор актуальны и интересны тем, что отличаются от наших. При анализе результатов новейшей видеокарты модели Geforce GTX Titan X в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark. Feature Test 1: Texture FillПервый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр. Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока и итоговые цифры разных моделей близки к соответствующим теоретическим параметрам. Так, разница в скорости между GTX Titan X и GTX 980 оказалась равной 38% в пользу решения на базе GM200, что близко к теории, ведь у новинки в полтора раза больше блоков TMU, но работают они на меньшей частоте. Естественно, отставание от двухчиповой GTX Titan Z остаётся, так как два GPU имеют большую скорость текстурирования. Что касается сравнения скорости текстурирования новой топовой видеоплаты Nvidia с близкими по цене решениями конкурента, то тут новинка уступает двухчиповому сопернику, который является условным соседом в ценовой нише, но зато опережает Radeon R9 290X, хоть и не слишком существенно. Всё-таки с текстурированием видеокарты компании AMD до сих пор справляются чуть лучше. Feature Test 2: Color FillВторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным. Цифры второго подтеста 3DMark Vantage показывают производительность блоков ROP, без учёта величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест измеряет именно производительность ROP. Рассматриваемая нами сегодня плата Geforce GTX Titan X заметно опередила обе платы Nvidia, и GTX 980 и даже GTX Titan Z, обогнав одночиповую плату на базе GM204 аж на 45% — количество блоков ROP и эффективность их работы в топовом GPU архитектуры Maxwell отличная! Да и если сравнивать скорость заполнения сцены новой видеокартой Geforce GTX Titan X с видеокартами AMD, то рассматриваемая нами плата Nvidia в этом тесте показывает лучшую скорость заполнения сцены даже по сравнению с мощнейшей двухчиповой Radeon R9 295X2, не говоря уже про изрядно отставшую Radeon R9 290X. Большое количество блоков ROP и оптимизации по эффективности сжатия данных буфера кадра сделали своё дело. Feature Test 3: Parallax Occlusion MappingОдин из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss. Этот тест из пакета 3DMark Vantage отличается от проведенных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен верный баланс GPU, а также эффективность выполнения сложных шейдеров. В данном случае, важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage новая плата Geforce GTX Titan X оказалась более чем на треть быстрее модели, основанной на базе графического процессора той же архитектуры Maxwell. И даже двухчиповый Kepler в виде GTX Titan Z выиграл у новинки менее 10%. Одночиповая топовая плата Nvidia в этом тесте показала результат явно лучше, чем у одночиповой Radeon R9 290X, но обе очень серьёзно проигрывают двухчиповой модели Radeon R9 295X2. Графические процессоры производства компании AMD в этой задаче работают несколько эффективнее чипов Nvidia, а у R9 295X2 их целых два. Feature Test 4: GPU ClothЧетвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out. Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, и основными факторами влияния должны бы являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. То есть, сильные стороны чипов Nvidia должны проявляться, но увы — мы увидели очень странный результат (перепроверяли), новая видеокарта Nvidia показала не слишком высокую скорость, мягко говоря. Geforce GTX Titan X в этом подтесте показала результат хуже всех решений, отстав почти на 20% даже от GTX 980! Ну и сравнение с платами Radeon в этом тесте столь же неприглядное для новинки. Несмотря на теоретически меньшее количество геометрических исполнительных блоков и отставание по геометрической производительности у чипов AMD, по сравнению с конкурирующими решениями, обе платы Radeon в этом тесте работают весьма эффективно и обгоняют все три платы Geforce, представленные в сравнении. Снова похоже на недостаток оптимизации в драйверах Nvidia под конкретную задачу. Feature Test 5: GPU ParticlesТест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот. Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out. Во втором «геометрическом» тесте из 3DMark Vantage ситуация серьёзно изменилась, в этот раз все Geforce уже показывают более-менее нормальный результат, хотя двухчиповая Radeon всё равно осталась в лидерах. Новая модель GTX Titan X работает на 24% быстрее своей сестры в лице GTX 980 и примерно столько же отстаёт от двухчиповой Titan Z на GPU прошлого поколения. Сравнение новинки Nvidia с конкурирующими видеокартами от компании AMD в этот раз более позитивное — она показала результат между двумя платами от компании-соперника, и оказалась ближе к Radeon R9 295X2, имеющей два GPU. Новинка значительно опережает Radeon R9 290X и это чётко показывает нам, насколько разными могут быть два вроде бы похожих теста: имитации тканей и симуляции системы частиц. Feature Test 6: Perlin NoiseПоследний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений. В этом случае производительность решений не совсем соответствует теории, хотя и близка к тому, что мы видели в аналогичных тестах. В математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим иное распределение результатов, по сравнению со схожими тестами из нашего тестового пакета. Мы давно знаем, что видеочипы компании AMD с архитектурой GCN до сих пор справляются с подобными задачами лучше решений конкурента, особенно в тех случаях, когда выполняется интенсивная «математика». Но новая топовая модель компании Nvidia основана на большом чипе GM200, и поэтому Geforce GTX Titan X в данном тесте показала результат заметно выше, чем Radeon R9 290X. Если сравнивать новинку с лучшей моделью семейства Geforce GTX 900, то в этом тесте разница между ними составила почти 40% — в пользу рассматриваемой сегодня видеокарты, конечно. Это также близко к теоретической разнице. Неплохой результат для Titan X, лишь двухчиповая Radeon R9 295X2 оказалась впереди, причём далеко впереди. Direct3D 11: Вычислительные шейдерыЧтобы протестировать недавно выпущенное топовое решение компании Nvidia в задачах, использующих такие возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD. Сначала мы рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры. Скорость расчетов в вычислительном и пиксельном шейдерах для всех плат AMD и Nvidia приблизительно одинаковая, отличия наблюдались только у видеокарт на основе GPU предыдущих архитектур. Судя по нашим предыдущим тестам, результаты в задаче часто зависят не столько от математической мощи и эффективности вычислений, сколько от других факторов, вроде пропускной способности памяти. В данном случае, новая топовая видеокарта по скорости опережает одночиповые варианты Geforce GTX 980 и Radeon R9 290X, но отстаёт от двухчиповой R9 295X2, что вполне объяснимо, ведь она обладает мощью пары R9 290X. Если сравнивать новинку с Geforce GTX 980, то рассматриваемая сегодня плата калифорнийской компании на 34-36% быстрее — точно по теории. Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нем показана расчетная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация. В данном тесте чаще всего наблюдается упор в скорость исполнения сложных математических вычислений, обработки геометрии и эффективность выполнения кода с ветвлениями. И в этом DX11-тесте расклад сил между решениями двух разных компаний получился совершенно иной — явно в пользу видеоплат Geforce. Впрочем, результаты пары решений компании Nvidia на разных чипах тоже странные — Geforce GTX Titan X и GTX 980 почти равны, их разделяет всего лишь 5% разницы в производительности. Двухчиповый рендеринг в этой задаче не работает, поэтому соперники (одночиповая и двухчиповая модель Radeon) примерно равны по скорости. Ну а GTX Titan X опережает их раза так в три. Похоже, что данная задача заметно эффективнее рассчитывается на графических процессорах именно архитектуры Maxwell, что мы отмечали и ранее. Direct3D 11: Производительность тесселяцииВычислительные шейдеры очень важны, но еще одним важным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали ее в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro Last Light, Civilization V, Crysis 3, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта. Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными. Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нем реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях: В тесте простого бампмаппинга скорость плат не очень важна, так как эта задача давно стала слишком легкой, а производительность в ней упирается в ПСП или филлрейт. Сегодняшний герой обзора на 23% опережает предыдущую топовую модель Geforce GTX 980 на базе чипа GM204 и чуть-чуть уступает конкуренту в виде Radeon R9 290X. Двухчиповый вариант ещё чуть быстрее. Во втором подтесте с более сложными попиксельными расчетами новинка стала уже на 34% быстрее модели Geforce GTX 980, что ближе к теоретической разнице между ними. Зато Titan X в этот раз уже немного быстрее одночипового условного конкурента на базе одиночного Hawaii. Так как два чипа в составе Radeon R9 295X2 работают отлично, то эта задача выполняется на нём ещё быстрее. Хотя эффективность выполнения математических вычислений в пиксельных шейдерах у чипов архитектуры GCN выше, но выход решений архитектуры Maxwell улучшил позиции решений Nvidia. В подтесте с применением лёгкой степени тесселяции анонсированная недавно плата Nvidia снова лишь на четверть быстрее модели Geforce GTX 980 — возможно, скорость упирается в пропускную способность памяти, так как текстурирование в этом тесте почти не влияет. Если сравнивать новинку с платами от AMD в этом подтесте, то плата Nvidia снова уступает обеим Radeon, так как в этом тесте тесселяции разбиение треугольников весьма умеренное и геометрическая производительность не ограничивает общую скорость рендеринга. Вторым тестом производительности тесселяции будет еще один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность. В этом тесте применяется уже более сложная геометрия, поэтому и сравнение геометрической мощи различных решений приносит другие выводы. Представленные в материале современные решения достаточно хорошо справляются с легкой и средней геометрической нагрузкой, показывая высокую скорость. Но хотя в лёгких условиях графические процессоры Hawaii в составе Radeon R9 290X и R9 295X2 в количестве одной и двух штук отлично работают, в тяжёлых режимах платы Nvidia выходят далеко вперёд. Так, в самых сложных режимах представленная сегодня Geforce GTX Titan X показывает скорость уже заметно лучше, чем двухчиповый Radeon. Что касается сравнения плат Nvidia на чипах GM200 и GM204 между собой, то рассматриваемая сегодня модель Geforce GTX Titan X наращивает преимущество с ростом геометрической нагрузки, так как в лёгком режиме всё упирается в ПСП. В итоге, новинка опережает плату Geforce GTX 980 в зависимости от сложности режима до 31%. Рассмотрим результаты еще одного теста — демонстрационной программы Nvidia Realistic Water Terrain, также известной как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта. Тест Island не является чисто синтетическим тестом для измерения исключительно геометрической производительности GPU, так как он содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются все блоки GPU, а не только геометрические, как в предыдущих тестах геометрии. Хотя основной все равно остается именно нагрузка на блоки обработки геометрии, но может влиять и та же ПСП, например. Мы тестируем все видеоплаты при четырех разных коэффициентах тесселяции — в данном случае настройка называется Dynamic Tessellation LOD. При первом коэффициенте разбиения треугольников, скорость не ограничена производительностью геометрических блоков, и видеокарты Radeon показывают довольно высокий результат, особенно двухчиповая R9 295X2, даже превосходящий результат анонсированной платы Geforce GTX Titan X, но уже на следующих ступенях геометрической нагрузки производительность плат Radeon снижается, и решения Nvidia выходят вперёд. Преимущество новой платы Nvidia на видеочипе GM200 над соперниками в таких тестах уже весьма приличное, и даже многократное. Если сравнить Geforce GTX Titan X с GTX 980, то разница между их производительностью доходит до 37-42%, что отлично объясняется теорией и точно ей соответствует. Графические процессоры Maxwell заметно эффективнее работают в режиме смешанной нагрузки, быстро переключаясь от исполнения графических задач к вычислительным и обратно, и Titan X в этом тесте намного быстрее даже двухчиповой Radeon R9 295X2. Проанализировав результаты синтетических тестов новой видеокарты Nvidia Geforce GTX Titan X, основанной на новом топовом графическом процессоре GM200, а также рассмотрев и результаты других моделей видеокарт от обоих производителей дискретных видеочипов, можно сделать вывод о том, что рассматриваемая сегодня видеокарта должна стать быстрейшей на рынке, составив конкуренцию сильнейшей двухчиповой видеокарте от компании AMD. В общем, это неплохой последователь модели Geforce GTX Titan Black — мощнейший одночип. Новая видеокарта компании Nvidia показывает довольно сильные результаты в «синтетике» — во многих тестах, хоть и не во всех. У Radeon и Geforce традиционно разные сильные стороны. В большом количестве тестов два графических процессора в составе модели Radeon R9 295X2 оказались быстрее, в том числе из-за большей итоговой пропускной способности памяти и скорости текстурирования с весьма эффективным исполнением вычислительных задач. Но в других случаях топовый графический процессор архитектуры Maxwell отыгрывается, особенно в геометрических тестах и примерах с тесселяцией. Впрочем, в реальных игровых приложениях всё будет несколько иначе, по сравнению с «синтетикой» и Geforce GTX Titan X должен показать там скорость заметно выше уровня одночиповых Geforce GTX 980 и уж тем более Radeon R9 290X. А с двухчиповой Radeon R9 295X2 новинку сравнивать сложно — у систем на базе двух и более GPU есть свои неприятные особенности, хотя прирост средней частоты кадров при должной оптимизации они обеспечивают. А вот архитектурные особенности и функциональность явно в пользу премиального решения Nvidia. Geforce GTX Titan X потребляет гораздо меньше энергии, чем тот же Radeon R9 295X2, и по энергоэффективности новая модель компании Nvidia весьма сильна — это отличительная особенность архитектуры Maxwell. Не нужно забывать о большей функциональности новинки Nvidia: тут есть поддержка уровня Feature Level 12.1 в DirectX 12, аппаратное ускорение VXGI, новый метод сглаживания MFAA и другие технологии. О рыночной точке зрения мы уже говорили в первой части — в элитном сегменте от цены зависит не так уж много. Главное, чтобы решение было максимально функциональным и производительным в игровых приложениях. Попросту — было лучшим во всём. Как раз для того, чтобы оценить скорость новинки в играх, в следующей части нашего материала мы определим производительность Geforce GTX Titan X в нашем наборе игровых проектов и сравним её с показателями конкурентов, в том числе оценим оправданность розничной цены новинки с точки зрения энтузиастов, а также узнаем, насколько она быстрее Geforce GTX 980 уже в играх. |
Монитор Asus ProArt PA249Q для рабочего компьютера предоставлен компанией Asustek | Клавиатура Cougar 700K для рабочего компьютера предоставленa компанией Cougar |
Видеокарта TITAN X создана для фанатов самых требовательных к ресурсам игр. Она объединяет в себе самые современные технологии и экстремальную производительность новой архитектуры NVIDIA Maxwell™, представляя собой самую быструю и технически продвинутую видеокарту на планете.
ПОВЫШЕННАЯ ПРОИЗВОДИТЕЛЬНОСТЬ
TITAN X сохраняет наследие видеокарт семейства TITAN, обеспечивая самую высокую в мире производительность среди игровых GPU. Она использует мощную архитектуру Maxwell для обеспечения новейших технологий при удвоенной производительности и энергоэффективности по сравнению с оригинальной видеокартой GTX TITAN.
НЕПРЕВЗОЙДЕННЫЙ ДИЗАЙН
TITAN X спроектирована и мастерски собрана из высококачественных компонентов, обеспечивая значительный прирост производительности при сохранении непревзойденных акустических и температурных характеристик.
Этот продвинутый GPU поддерживает гиперреалистичную глобальную иллюминацию в реальном времени благодаря технологии NVIDIA VXGI, а также технологию NVIDIA G-SYNC™, которая гарантирует плавное изображение в играх без разрывов. Кроме того, вы сможете испытать технологию DSR, которая дарит возможности 4K даже на 1080p дисплеях.
ЭКСТРЕМАЛЬНЫЕ ИГРЫ
TITAN X – единственная видеокарта с одним GPU, способная с легкостью воспроизводить 4K игры с высокими настройками. Она плавно работает благодаря приложению GeForce® Experience™, которое обеспечивает доступ к новейшим драйверам и оптимизирует игровые настройки одним щелчком мыши. Вы даже можете записывать свои лучшие игровые моменты и делиться ими с друзьями с помощью технологии NVIDIA® ShadowPlay™.
Первым образцом архитектуры Pascal от NVIDIA, выпущенным на рынок, стал графический адаптер GeForce GTX 1080 на базе процессора GP104. Благодаря новому техпроцессу 16 нм FinFET, равно как и оптимизациям архитектуры и схемотехники чипа, GTX 1080 позволил достигнуть уровня быстродействия в играх, примерно на 30% превышающего достижения флагманской видеокарты NVIDIA предыдущего поколения — GeForce GTX TITAN X. В то же время разработчики GTX 1080 сумели сократить энергетический бюджет ускорителя на 70 Вт относительно TDP его предшественника — с 250 до 180 Вт. Между тем тепловой пакет 250 Вт является стандартной целью для топовых игровых видеокарт NVIDIA нескольких последних поколений, поэтому появление после GTX 1080 еще более производительного продукта, который займет эту нишу в линейке Pascal, оставалось лишь вопросом времени.
Начиная с архитектуры Kepler, NVIDIA использует следующую стратегию выпуска GPU различных категорий быстродействия. Сперва дебютирует чип второго эшелона: GK104 в семействе Kepler, GM204 — в Maxwell второй версии, и теперь — GP104 в Pascal. Впоследствии NVIDIA заполняет один-два эшелона ниже, и после существенного промежутка появляется графический процессор высшей категории, ложащийся в основу наиболее производительного ускорителя, который NVIDIA может произвести, сохраняя энергопотребление в рамках 250 Вт при текущем технологическом процессе.
Пиком развития архитектуры Pascal на данный момент является процессор GP100, отличительными свойствами которого стало беспрецедентное число шейдерных ALU (3840 ядер CUDA) и 16 Гбайт памяти типа HBM2, объединенные с GPU на кремниевой подложке. GP100 используется в составе ускорителя Tesla P100, применение которого ограничено сферой суперкомпьютеров в силу специального форм-фактора с шиной NVLINK и TDP в объеме 300 Вт. В конце года также ожидается выход Tesla P100 в стандартном формате платы расширения PCI Express.
Именно чип GP100, в мечтах энтузиастов индустрии, должен был в перспективе увенчать линейку игровых адаптеров GeForce 10, а предварительно NVIDIA могла бы выпустить новый TITAN — как раз с промежуточной остановкой на этой позиции предыдущие большие GPU прибыли в геймерские ПК (GK110 в составе TITAN и GM200 — в TITAN X).
Однако на этот раз, по всей видимости, оказались правы эксперты, предрекавшие окончательное разделение линейки GPU NVIDIA на две непересекающиеся группы — чипы игрового и просьюмерского (от слов producer и consumer) направления, с одной стороны, и чипы для вычислений — с другой. Дифференцирующим фактором в данном случае является скорость GPU в операциях над числами с плавающей точкой двойной точности (FP64). В линейке Kepler разработчики уже пожертвовали этой характеристикой для всех чипов (1/24 от FP32), помимо старшего — GK110/GK210 (1/3 от FP32), с целью снизить энергопотребление GPU. В следующем поколении эта тенденция усугубилась: все процессоры Maxwell работают с FP64 на скорости 1/32 от FP32.
Ситуация с Pascal показала, что экономия на производительности FP64 не осталась временной мерой, обусловленной задержкой на техпроцессе 28 нм. NVIDIA по-прежнему нуждается в GPU для серверов, суперкомпьютеров и рабочих станций, способном оперировать FP64 на высоком уровне быстродействия. Однако для игровых видеоадаптеров эта функциональность, раздувающая транзисторный бюджет и энергопотребление GPU, является лишь обузой.
Таким образом, вместо того, чтобы перенести GP100 (очевидно дорогой в производстве чип как из-за площади, так и из-за интегрированной памяти HBM2) в игровые видеокарты, NVIDIA выпустила дополнительный продукт — GP102, сфокусированный на операциях с FP32 — основном формате чисел, применяемом и рендеринге 3D-графики, и в ряде вычислительных задач. Единственная функциональная особенность GP102 — поддержка целочисленных операций формата int8. Это важный пункт для NVIDIA, поскольку int8 широко применяется в задачах машинного обучения, которые компания сделала для себя одним из приоритетных направлений (конкретнее, один из классов таких задач — глубинное обучение). В скором будущем мы планируем выпустить отдельную статью, посвященную этой теме.
Новый TITAN X, ставший первым устройством на базе процессора GP102, позиционируется в первую очередь именно как ускоритель профессионального класса, который предназначен для исследований и коммерческих приложений, связанных с глубинным обучением. Это подтверждает и отсутствие бренда GeForce в названии карты. Однако широкие игровые возможности новинки также не подлежат сомнению. Все «Титаны», выпущенные ранее, помимо их вычислительных функций, рассматривались как игровые видеокарты премиум-класса, способные обеспечить качество графики и быстродействие, недоступные современным им моделям в основной линейке GeForce.
⇡ NVIDIA GP102
Данный GPU задуман как альтернатива суперкомпьютерному GP100, не уступающая последнему в функциях рендеринга 3D-графики и расчетах FP32. Вместе с тем создатели GP102 сократили все компоненты, не соответствующие назначению продукта.
К примеру, отдельно взятый SM (Streaming Multiprocessor — блок, объединяющей ядра CUDA вместе с блоками наложения текстур, планировщиками, диспетчерами и сегментами локальной памяти) в GP100 содержит 64 ядра CUDA для операций FP32, в то время как SM в GP102 обладает в этом отношении конфигурацией, унаследованной от Maxwell: 128 ядер CUDA. Более дробное распределение ядер CUDA в GP100 позволяет процессору одновременно исполнять больше потоков инструкций (и также групп потоков — warps — и блоков warp’ов), а общий объем таких типов хранилища внутри SM, как разделяемая память (shared memory) и регистровый файл, в пересчете на весь GPU увеличился по сравнению с архитектурой Maxwell.
Блок-схема NVIDIA GP102
Далее, в GP100 на каждые 64 ядра CUDA для операций FP32 приходится по 32 ядра для FP64, в то время как SM в GP102 обладает в этом отношении конфигурацией, унаследованной от Maxwell: 128 ядер CUDA для FP32 и 4 для FP64. Отсюда урезанная производительность GP102 в работе с операциями двойной точности.
Наконец, GP100 несет более крупный кеш второго уровня: 4096 Кбайт против 3072 Кбайт в GP102. И разумеется, в GP102 отсутствует контроллер шины NVLINK, а место контроллеров памяти HBM2 (с общей разрядностью шины в 4096 бит) занимают контроллеры GDDR5X SDRAM. 12 таких 32-битных контроллеров обеспечивают общую 384-битную шину доступа к памяти.
В остальных интересующих нас аспектах чипы GP100 и GP102 идентичны. Оба кристалла содержат 3840 FP32-совместимых ядер CUDA и 240 блоков наложения текстур, а также 96 ROP. Таким образом, с общей точки зрения структура вычислительных блоков GP102 повторяет таковую у чипа GP104, с поправкой на количественные изменения. Хотя нам все еще неизвестны некоторые параметры (объемы кеша L1, shared memory и регистрового файла), они, вероятно, одинаковы в этих двух GPU.
Кристалл GP102, произведенный по техпроцессу 16 нм FinFET на мощностях TSMC, содержит 12 млрд транзисторов на площади 471 мм 2 . Для сравнения: характеристики GP100 — 15,3 млрд транзисторов и 610 мм 2 . Это весьма существенная разница. Кроме того, если TSMC не увеличила размер фотомаски для техпроцесса 16 нм по сравнению с 28 нм, то GP100 его практически исчерпывает, в то время как облегченная архитектура GP102 позволит NVIDIA в будущем создать более крупное ядро для широкого потребительского рынка, пользуясь той же производственной линией (что, однако, вряд ли случится, если разработчики не пересмотрят свои стандарты в отношении TDP топовых моделей).
По поводу отличий архитектуры Pascal от Maxwell рекомендуем обратиться к нашему обзору GeForce GTX 1080 . В этой итерации разработчики развили достоинства предыдущего поколения и компенсировали присущие ему недостатки.
Кратко отметим следующие пункты:
- улучшенная компрессия цвета с соотношениями вплоть до 8:1;
- функция Simultaneous Multi-Projection геометрического движка PolyMorph Engine, позволяющая за один проход создавать вплоть до 16 проекций геометрии сцены (для VR и систем с несколькими дисплеями в конфигурации NVIDIA Surround);
- возможность прерывания (preemption) в процессе исполнения draw call (при рендеринге) и потока команд (при вычислениях), которая вместе с динамическим распределением вычислительных ресурсов GPU обеспечивает полноценную поддержку асинхронных вычислений (Async Compute) — дополнительного источника быстродействия в играх под API DirectX 12 и сниженной латентности в VR;
- контроллер дисплея, совместимый с интерфейсами DisplayPort 1.3/1.4 и HDMI 2.b. Поддержка высокого динамического диапазона (HDR);
- шина SLI с повышенной пропускной способностью.
⇡ Технические характеристики, цена
В TITAN X не используется полностью функциональная версия графического процессора GP102: из 30 SM здесь отключены два. Таким образом, по числу ядер CUDA и текстурных блоков «Титан» совпадает с Tesla P100, где чип GP100 также частично «порезан» (3584 ядра CUDA и 224 текстурных блока).
Графический процессор новинки работает на более высоких частотах (1417/1531 МГц), чем в Tesla P100 (вплоть до 1328/1480 МГц в суперкомпьютерной версии и вплоть до 1300 МГц в форм-факторе платы PCI-Express). И все же частоты «Титана» довольно консервативны по сравнению с характеристиками GeForce GTX 1080 (1607/1733 МГц). Как мы увидим в экспериментах с разгоном, ограничивающим фактором стало энергопотребление устройства, которое NVIDIA установила на привычном уровне 250 Вт.
TITAN X оснащен 12 Гбайт памяти GDDR5X SDRAM с пропускной способность 10 Гбит/с на контакт. 384-битная шина обеспечивает передачу данных на скорости 480 Гбайт/с: по этому показателю TITAN X лишь ненамного уступает действующему рекордсмену — Radeon R9 Fury X, как и прочим продуктам AMD на базе GPU Fiji (512 Гбайт/с).
Производитель | NVIDIA | |||||
Модель | GeForce GTX TITAN | GeForce GTX TITAN Black | GeForce GTX TITAN Z | GeForce GTX TITAN X | GeForce GTX 1080 | TITAN X |
Графический процессор | ||||||
Название | GK110 | GK110 | 2 × GK110 | GM200 | GP104 | GP102 |
Микроархитектура | Kepler | Kepler | Kepler | Maxwell | Pascal | Pascal |
Техпроцесс, нм | 28 нм | 28 нм | 28 нм | 28 нм | 16 нм FinFET | 16 нм FinFET |
Число транзисторов, млн | 7 080 | 7 080 | 2 × 7080 | 8 000 | 7 200 | 12 000 |
Тактовая частота, МГц: Base Clock / Boost Clock | 837/876 | 889/980 | 705/876 | 1 000 / 1 089 | 1 607 / 1 733 | 1 417 / 1531 |
Число шейдерных ALU | 2 688 | 2 880 | 2 × 2880 | 3 072 | 2 560 | 3 584 |
Число блоков наложения текстур | 224 | 240 | 2 × 240 | 192 | 160 | 224 |
Число ROP | 48 | 48 | 2 × 48 | 96 | 64 | 96 |
Оперативная память | ||||||
Разрядность шины, бит | 384 | 384 | 2 × 384 | 384 | 256 | 384 |
Тип микросхем | GDDR5 SDRAM | GDDR5 SDRAM | GDDR5 SDRAM | GDDR5 SDRAM | GDDR5X SDRAM | GDDR5X SDRAM |
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с) | 1 502 (6 008) | 1 750 (7 000) | 1 750 (7 000) | 1 753 (7 012) | 1 250 (10 000) | 1 250 (10 000) |
Объем, Мбайт | 6 144 | 6 144 | 2 × 6144 | 12 288 | 8 192 | 12 288 |
Шина ввода/вывода | PCI Express 3.0 x16 | PCI Express 3.0 x16 | PCI Express 3.0 x16 | PCI Express 3.0 x16 | PCI Express 3.0 x16 | PCI Express 3.0 x16 |
Производительность | ||||||
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты) | 4 709 | 5 645 | 10 092 | 6 691 | 8 873 | 10 974 |
Производительность FP32/FP64 | 1/3 | 1/3 | 1/3 | 1/32 | 1/32 | 1/32 |
Пропускная способность оперативной памяти, Гбайт/с | 288 | 336 | 2 × 336 | 336 | 320 | 480 |
Вывод изображения | ||||||
Интерфейсы вывода изображения | DL DVI-I, DisplayPort 1.2, HDMI 1.4a | DL DVI-D, DL DVI-I, DisplayPort 1.2, HDMI 1.4a | DL DVI-I, DisplayPort 1.2, HDMI 1.4a | DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b | ||
TDP, Вт | 250 | 250 | 375 | 250 | 180 | 250 |
Рекомендованная розничная цена на момент выхода (США, без налога), $ | 999 | 999 | 2 999 | 999 | 599/699 | 1 200 |
Рекомендованная розничная цена на момент выхода (Россия), руб. | 34 990 | 35 990 | 114 990 | 74 900 | — / 54 990 | — |
Что касается теоретических показателей быстродействия, то TITAN X стал первой однопроцессорной графической картой, превысившей отметку в 10 TFLOPS по производительности FP32. Из предыдущих продуктов NVIDIA на это был способен только TITAN Z, построенный на паре чипов GK110. С другой стороны, в отличие от Tesla P100 (и аналогично GeForce GTX 1060/1070/1080), TITAN X характеризуется весьма скромным быстродействием в расчетах двойной (1/32 от FP32) и половинной точности (1/64 от FP32), однако способен выполнять операции с числами int8 на скорости в 4 раза выше, чем с FP32. Другие GPU семейства Pascal — GP104 (GeForce GTX 1070 /1080, Tesla P4) и GP106 (GTX 1060) и GP100 (Tesla P100) также поддерживают int8 с соотношением быстродействия 4:1 относительно FP32, однако нам на данный момент неизвестно, ограничена ли эта функциональность в игровых видеокартах GeForce.
TITAN X — весьма и весьма дорогое приобретение, на которое решатся только те, кто действительно желает обладать столь совершенной видеокартой. NVIDIA увеличила цену на $200 по сравнению с предыдущими однопроцессорными моделями под этой маркой — до $1 200. На этот раз устройство не распространяется через партнерские компании и продается исключительно на веб-сайте NVIDIA в ряде избранных стран. Россия пока не входит в их число.
⇡ Конструкция
Корпус видеокарты выполнен в единой стилистике с продуктами под маркой Founders Edition линейки GeForce 10. Система охлаждения с радиальным вентилятором (турбинка) покрыта металлическим кожухом, а заднюю поверхность печатной платы защищает толстая пластина. Часть последней можно снять, дабы обеспечить беспрепятственный доступ воздуха к кулеру соседней видеокарты в режиме SLI. Забавно, что хотя TITAN X формально больше не принадлежит к семейству GeForce, именно эта надпись, подсвеченная зелеными светодиодами, по-прежнему красуется на боку видеокарты.
Конструкция кулера такая же, как у GTX 1070/1080: GPU отдает тепло радиатору с испарительной камерой, а микросхемы оперативной памяти и транзисторы преобразователя напряжения накрыты массивной алюминиевой рамой, несущей отдельный блок ребер небольшого размера.
Между прочим, как выяснил один из обладателей TITAN X, NVIDIA позволяет пользователям сменить систему охлаждения видеокарты на нечто более эффективное (например, СЖО) без потери гарантии.
⇡ Плата
Подобно референсным версиям GTX 1060/1070/1080, плата TITAN X имеет три разъема DisplayPort и по одному разъему DVI и HDMI.
Система питания построена по схеме 6+1 (количество фаз для GPU и чипов памяти). Используются два разъема дополнительного питания — шести- и восьмиконтактный, что вместе с силовыми линиями в разъеме PCI-Express обеспечивает видеокарте резерв мощности в 300 Вт.
Память типа GDDR5X SDRAM, как и на GeForce GTX 1080, набрана микросхемами Micron D9TXS со штатной эффективной частотой 10 ГГц.
⇡ Тестовый стенд, методика тестирования
Конфигурация тестовых стендов | |
---|---|
CPU | Intel Core i7-5960X @ 4 ГГц (100 × 40) |
Материнская плата | ASUS RAMPAGE V EXTREME |
Оперативная память | Corsair Vengeance LPX, 2133 МГц, 4 × 4 Гбайт |
ПЗУ | Intel SSD 520 240 Гбайт + Crucial M550 512 Гбайт |
Блок питания | Corsair AX1200i, 1200 Вт |
Система охлаждения CPU | Thermalright Archon |
Корпус | CoolerMaster Test Bench V1.0 |
Монитор | NEC EA244UHD |
Операционная система | Windows 10 Pro x64 |
ПО для GPU AMD | |
Все | Radeon Software Crimson Edition 16.8.2 Non-WHQL |
ПО для GPU NVIDIA | |
Все | GeForce Game Ready Driver 372.54 WHQL |
CPU работает на постоянной частоте. В настройках драйвера NVIDIA в качестве процессора для вычисления PhysX выбран CPU. В настройках драйвера AMD настройка Tesselation переведена из состояния AMD Optimized в Use application settings.
Бенчмарки: игры | ||||
---|---|---|---|---|
Игра (в порядке даты выхода) | API | Настройки | Полноэкранное сглаживание | |
1920 × 1080 / 2560 × 1440 | 3840 × 2160 | |||
Crysis 3 + FRAPS | DirectX 11 | Макс. качество. Начало миссии Swamp | MSAA 4x | Выкл. |
Battlefield 4 + FRAPS | Макс. качество. Начало миссии Tashgar | MSAA 4x + FXAA High | ||
Metro: Last Light Redux, встроенный бенчмарк | Макс. качество | SSAA 4x | ||
GTA V, встроенный бенчмарк | Макс. качество | MSAA 4x + FXAA | ||
DiRT Rally | Макс. качество | MSAA 4x | ||
Rise of the Tomb Raider, встроенный бенчмарк | DirectX 12 | Макс. качество, VXAO выкл. | SSAA 4x | |
Tom Clancy"s The Division, встроенный бенчмарк | DirectX 11 | Макс. качество, HFTS выкл. | SMAA 1x Ultra | |
HITMAN, встроенный бенчмарк | DirectX 12 | Макс. качество | SSAA 4x | |
Ashes of the Singularity, встроенный бенчмарк | DirectX 12 | Макс. качество | MSAA 4x + Temporal AA 4x | |
DOOM | Vulkan | Макс. качество. Миссия Foundry | TSSAA 8TX | |
Total War: WARHAMMER, встроенный бенчмарк | DirectX 12 | Макс. качество | MSAA 4x |
Бенчмарки: декодирование видео, вычисления | |
---|---|
Программа | Настройки |
DXVA Checker, Decode Benchmark, H.264 | Файлы 1920 × 1080p (High Profile, L4.1), 3840 × 2160p (High Profile, L5.1). Microsoft H264 Video Decoder |
DXVA Checker, Decode Benchmark, H.265 | Файлы 1920 × 1080p (Main Profile, L4.0), 3840 × 2160p (Main Profile, L5.0). Microsoft H265 Video Decoder |
LuxMark 3.1 x64 | Сцена Hotel Lobby (Complex Benchmark) |
Sony Vegas Pro 13 | Бенчмарк Sony для Vegas Pro 11, продолжительность — 65 с, рендеринг в XDCAM EX, 1920 × 1080p 24 Гц |
SiSoftware Sandra 2016 SP1, GPGPU Scientific Analysis | Open CL, FP32/FP64 |
CompuBench CL Desktop Edition X64, Ocean Surface Simulation | — |
CompuBench CL Desktop Edition X64, Particle Simulation— 64K | — |
⇡ Участники тестирования
В тестировании производительности приняли участие следующие видеокарты:
- NVIDIA TITAN X (1417/10000 МГц, 12 Гбайт);
⇡ Производительность : 3DMark
Синтетические тесты в среднем демонстрируют преимущество TITAN X перед GeForce GTX 1080 в 25 %. По сравнению с предыдущим поколением марки TITAN, а также Radeon R9 Fury X новый флагман предлагает на 61—63 % более высокий результат и более чем вдвое выросшую производительность, по сравнению с первой версией TITAN на базе архитектуры Kepler. Довольно высокую позицию в сравнении с ускорителем NVIDIA удерживает Radeon R9 295X2 — новинка лишь на 18 % быстрее в 3DMark.
3DMark (Graphics Score) | |||||||
---|---|---|---|---|---|---|---|
Разрешение | |||||||
Fire Strike | 1920 × 1080 | 26 341 | 10 449 | 17 074 | 21 648 | 23 962 | 16 279 |
Fire Strike Extreme | 2560 × 1440 | 13 025 | 4 766 | 7 945 | 10 207 | 10 527 | 7 745 |
Fire Strike Ultra | 3840 × 2160 | 6 488 | 2 299 | 4 011 | 4 994 | 5 399 | 3 942 |
Time Spy | 2560 × 1440 | 8 295 | 2 614 | 4 935 | 6 955 | 7 186 | 5 084 |
Макс. | −60% | −35% | −16% | −9% | −38% | ||
Среднее | −64% | −38% | −20% | −15% | −39% | ||
Мин. | −68% | −41% | −23% | −19% | −41% |
⇡ Производительность: игры (1920 × 1080 , 2560 × 1440)
В тестах при сравнительно низком разрешении для столь мощного GPU новый TITAN X на 15-20 % (от режима 1080p к 1440p соответственно) превосходит GeForce GTX 1080 по средним результатам. Еще более эффектно новый флагман выглядит в сравнении с лучшими ускорителями периода 28 нм: он на 47-56 % быстрее GeForce GTX TITAN X на базе GM200 и на 67-72 % опережает Radeon R9 Fury X.
Если взять самый первый TITAN поколения Kepler, то речь идет о более чем двукратном приросте быстродействия.
1920 × 1080 | |||||||
---|---|---|---|---|---|---|---|
Полноэкранное сглаживание | NVIDIA TITAN X (1417/10000 МГц, 12 Гбайт) | NVIDIA GeForce GTX TITAN (837/6008 МГц, 6 Гбайт) | NVIDIA GeForce GTX TITAN X (1000/7012 МГц, 12 Гбайт) | NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) | AMD Radeon R9 295X2 (1018/5000 МГц, 8 Гбайт) | AMD Radeon R9 Fury X (1050/1000 МГц, 4 Гбайт) | |
Ashes of the Singularity | MSAA 4x | 47 | 20 | 31 | 42 | 34 | 26 |
Battlefield 4 | MSAA 4x + FXAA High | 162 | 71 | 118 | 149 | 134 | 94 |
Crysis 3 | MSAA 4x | 99 | 45 | 65 | 79 | 90 | 60 |
DiRT Rally | MSAA 4x | 126 | 57 | 83 | 101 | 97 | 65 |
DOOM | TSSAA 8TX | 200 | 69 | 151 | 185 | 122 | 156 |
GTA V | MSAA 4x + FXAA | 85 | 44 | 68 | 84 | 76 | 52 |
HITMAN | SSAA 4x | 68 | 21 | 39 | 52 | 24 | 33 |
Metro: Last Light Redux | SSAA 4x | 124 | 47 | 73 | 92 | 94 | 70 |
Rise of the Tomb Raider | SSAA 4x | 70 | 28 | 47 | 62 | 55 | 41 |
Tom Clancy"s The Division | SMAA 1x Ultra | 87 | 35 | 59 | 80 | 57 | 58 |
Total War: WARHAMMER | MSAA 4x | 76 | 38 | 56 | 73 | 37 | 49 |
Макс. | −48% | −20% | −0% | −9% | −22% | ||
Среднее | −58% | −32% | −13% | −29% | −40% | ||
Мин. | −69% | −43% | −26% | −65% | −51% |
2560 × 1440 | |||||||
---|---|---|---|---|---|---|---|
Полноэкранное сглаживание | NVIDIA TITAN X (1417/10000 МГц, 12 Гбайт) | NVIDIA GeForce GTX TITAN (837/6008 МГц, 6 Гбайт) | NVIDIA GeForce GTX TITAN X (1000/7012 МГц, 12 Гбайт) | NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) | AMD Radeon R9 295X2 (1018/5000 МГц, 8 Гбайт) | AMD Radeon R9 Fury X (1050/1000 МГц, 4 Гбайт) | |
Ashes of the Singularity | MSAA 4x | 39 | 16 | 24 | 33 | 27 | 21 |
Battlefield 4 | MSAA 4x + FXAA High | 109 | 47 | 75 | 98 | 95 | 65 |
Crysis 3 | MSAA 4x | 63 | 27 | 40 | 53 | 59 | 39 |
DiRT Rally | MSAA 4x | 93 | 40 | 60 | 74 | 71 | 48 |
DOOM | TSSAA 8TX | 166 | 45 | 95 | 126 | 82 | 107 |
GTA V | SMAA | 67 | 31 | 48 | 63 | 61 | 39 |
HITMAN | MSAA 4x + FXAA | 43 | 13 | 24 | 33 | 12 | 17 |
Metro: Last Light Redux | SSAA 4x | 71 | 26 | 43 | 52 | 54 | 43 |
Rise of the Tomb Raider | Не поддерживается | 44 | 16 | 28 | 38 | 23 | 27 |
Tom Clancy"s The Division | SSAA 4x | 63 | 24 | 43 | 58 | 45 | 44 |
Total War: WARHAMMER | SMAA 1x High | 57 | 26 | 39 | 50 | 25 | 34 |
Макс. | −53% | −29% | −6% | −6% | −30% | ||
Среднее | −61% | −36% | −16% | −33% | −42% | ||
Мин. | −73% | −44% | −27% | −72% | −60% |
Прим.:
⇡ Производительность: игры (3840 × 2160)
При переходе от разрешения 1440p к 4К соотношение между видеокартами NVIDIA остается прежним. TITAN X на 20 % быстрее, чем GeForce GTX 1080 и на 56 % превосходит TITAN X на базе Maxwell.
Radeon R9 Fury X, что характерно для этой модели, более эффективно справляется с тестами в 4К, что в итоге сократило преимущество «Титана» до 56 %.
3840 × 2160 | |||||||
---|---|---|---|---|---|---|---|
Полноэкранное сглаживание | NVIDIA TITAN X (1417/10000 МГц, 12 Гбайт) | NVIDIA GeForce GTX TITAN (837/6008 МГц, 6 Гбайт) | NVIDIA GeForce GTX TITAN X (1000/7012 МГц, 12 Гбайт) | NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) | AMD Radeon R9 295X2 (1018/5000 МГц, 8 Гбайт) | AMD Radeon R9 Fury X (1050/1000 МГц, 4 Гбайт) | |
Ashes of the Singularity | Выкл. | 45 | 20 | 29 | 41 | 38 | 37 |
Battlefield 4 | 84 | 35 | 57 | 74 | 72 | 52 | |
Crysis 3 | 42 | 18 | 28 | 36 | 40 | 29 | |
DiRT Rally | 65 | 26 | 41 | 50 | 48 | 33 | |
DOOM | 92 | 24 | 51 | 68 | 45 | 57 | |
GTA V | 55 | 25 | 39 | 51 | 49 | 34 | |
HITMAN | 67 | 21 | 38 | 53 | 24 | 33 | |
Metro: Last Light Redux | 64 | 23 | 38 | 47 | 47 | 38 | |
Rise of the Tomb Raider | 50 | 19 | 33 | 44 | 37 | 31 | |
Tom Clancy"s The Division | 38 | 15 | 25 | 33 | 26 | 28 | |
Total War: WARHAMMER | 43 | 20 | 30 | 38 | 20 | 32 | |
Макс. | −53% | −29% | −7% | −5% | −18% | ||
Среднее | −61% | −36% | −16% | −29% | −36% | ||
Мин. | −74% | −45% | −27% | −64% | −51% |
Прим.: В Total War: WARHAMMER не поддерживается DirectX 12 для GeForce GTX TITAN.
⇡ Производительность: декодирование видео
В GP102 интегрирован такой же аппаратный кодек, как и в двух младших GPU семейства Pascal, поэтому TITAN X демонстрирует скорость декодирования стандартов H.264 и HEVC наравне с GeForce GTX 1080, с поправкой на сниженные тактовые частоты GPU. Производительность Pascal в этой задаче является непревзойденной как по сравнению с кодеками NVIDIA в чипах Maxwell, так и с таковыми в AMD Polaris.
Прим.: поскольку в пределах одной линейки GPU декодеры обычно не различаются, на диаграммах приведено по одному устройству из каждого семейства (или больше в том случае, если это правило нарушается).
Прим. 2: GeForce GTX TITAN X , как и другие устройства на базе GPU архитектуры Maxwell, за исключением GM204 (GeForce GTX 950/960), выполняет частично аппаратное декодирование H.265, подкрепленное ресурсами CPU.
⇡ Производительность: вычисления
Соотношение между различными архитектурами в задачах GPGPU зависит от специфики каждого приложения. TITAN X по большей части обеспечивает предсказуемый прирост быстродействия по сравнению с GeForce GTX 1080, однако есть исключительные случаи, когда задача упирается в частоту графического процессора (как тест физики частиц в CompuBench CL и рендеринг в Sony Vegas): здесь преимущество на стороне GTX 1080. Напротив, новый TITAN X взял реванш в той ситуации, где GeForce GTX 1080 уступает TITAN X на базе Maxwell и Radeon R9 Fury X (трассировка лучей в LuxMark).
В тесте SiSoftware Sandra, включающем перемножение матриц и быстрое преобразование Фурье, TITAN X не знает равных в режиме FP32. Что касается FP64, то просто за счет грубой силы (большого количества ядер CUDA и высоких тактовых частот) ускоритель достиг более высоких показателей, чем оригинальный TITAN поколения Kepler и Radeon R9 Fury X — видекарты, обладающие более выгодным соотношением скорости работы с FP32 и FP64. Это в конечном счете не позволяет совсем уж сбрасывать со счетов TITAN X как ускоритель задач с вычислениями двойной точности. Впрочем, для этой цели лучше всего подходит Radeon R9 295X2. Видеокарты AMD сохраняют сильные позиции и в некоторых других тестах: расчете водной поверхности в CompuBench CL и Sony Vegas.
⇡ Тактовые частоты, энергопотребление, температура, разгон
При игровой нагрузке графический процессор TITAN X периодически достигает столь же высоких тактовых частот, как GP104 в составе GTX 1080 (1848 против 1860 МГц), однако большую часть времени пребывает в существенно более низком диапазоне (1557-1671 МГц). При этом максимальное напряжение питания GPU составляет 1,062 В (1,05 В в GTX 1080).
Вентилятор СО вращается со скоростью вплоть до 2472 об/мин. Карта требует более сильного охлаждения, чем GTX 1080, а поскольку конструкция кулера осталась неизменной, он создает больше шума. Чтобы компенсировать этот фактор, для TITAN X установили на 3 °С более высокую целевую температуру GPU.
Хотя TITAN X на базе Pascal формально обладает одинаковым TDP c TITAN X предыдущего поколения, на практике система с новой видеокартой развивает существенно большую (на 49 Вт) мощность. Впрочем, здесь может играть роль повышенная нагрузка на CPU, обслуживающий более производительный графический процессор. В FurMark, напротив, все ускорители, обладающие TDP 250 Вт (а также 275-ваттный Fury X) находятся примерно на одном уровне.
Для разгона «Титана» мы воспользовались штатной возможностью увеличить лимит мощности видеокарты на 20 %, запустили турбину СО на полную скорость (4837 об/мин) и увеличили максимальное напряжение питания GPU до 1,093 В (такое же значение, как на GTX 1080). В результате нам удалось поднять базовую частоту GPU на 200 МГц — до 1617 МГц, а эффективную частоту памяти — до 11100 МГц.
Одно это уже совсем неплохо для столь крупного чипа, однако не меньшее значение имеет повышенный лимит мощности. Разогнанный GPU поддерживает частоты в диапазоне 1974-1987 МГц, достигая максимума в 2063 МГц, а это уже не менее чем просто потрясающее достижение. Для сравнения: пиковая частота графического процессора в нашем экземпляре GTX 1080 при разгоне составила 2126 МГц.
Система с разогнанным TITAN X развивает мощность на 46 Вт больше, чем при штатном режиме работы видеокарты. Раскрученный до максимальной скорости вентилятор сбил температуру GPU на 17-20 °C, что позволяет пользователям рассчитывать на столь же эффективный разгон при более низких оборотах, обеспечивающих относительно комфортный уровень шума.
⇡ Производительность: разгон
Оверклокинг TITAN X позволяет весьма существенно увеличить быстродействие — на 14% в 3DMark и на 18-23 % в игровых бенчмарках при разрешениях 1080p и 1440p. В играх при разрешении 4К бонус достигает 26 %.
Разница между разогнанным TITAN X и GeForce GTX 1080, работающим на референсных частотах, достигает шокирующих значений — 36, 47 и 50 % в трех использованных нами разрешениях. Разумеется, сам GTX 1080 также подлежит разгону, но, как мы помним из нашего обзора референсной видеокарты, это добавляет к результатам лишь 9, 13 и 12 %. Таким образом, если сравнивать разогнанный флагман линейки GeForce 10 и разогнанный TITAN X, то преимущество последнего составит 25, 30 и 34 %.
Используя наши старые данные о производительности GeForce GTX TITAN X на чипе GM200 в разгоне, произведем аналогичные расчеты для сравнения двух поколений «Титанов». Разогнанный TITAN X на Pascal опережает своего предшественника на 75, 93 и 97 %. Когда оба ускорителя разогнаны, новинка сохраняет отрыв в 74 и 70 % при разрешениях 1440p и 2160p. От тестирования в режиме 1080p мы (как помнят критиковавшие это решение читатели) отказались в обзоре GeForce GTX TITAN X.
3DMark (Graphics Score) | ||||||
---|---|---|---|---|---|---|
Разрешение | NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) | NVIDIA TITAN X (1417/10000 МГц, 12 Гбайт) | ||||
Fire Strike | 1920 × 1080 | 21 648 | 26 341 | 31 038 | ||
Fire Strike Extreme | 2560 × 1440 | 10 207 | 13 025 | 15 191 | ||
Fire Strike Ultra | 3840 × 2160 | 4 994 | 6 488 | 7 552 | ||
Time Spy | 2560 × 1440 | 6 955 | 8 295 | 8 644 | ||
Макс. | +30% | +51% | ||||
Среднее | +25% | +42% | ||||
Мин. | +19% | 101 | 126 | 126 | ||
DOOM | TSSAA 8TX | 185 | 200 | 200 | ||
GTA V | MSAA 4x + FXAA | 84 | 85 | 96 | ||
HITMAN | SSAA 4x | 52 | 68 | 77 | ||
Metro: Last Light Redux | SSAA 4x | 92 | 124 | 140 | ||
Rise of the Tomb Raider | SSAA 4x | 62 | 70 | 94 | ||
Tom Clancy"s The Division | SMAA 1x Ultra | 80 | 87 | 117 | ||
Total War: WARHAMMER | MSAA 4x | 73 | 76 | 88 | ||
Макс. | +35% | +57% | ||||
Среднее | +16% | +36% | ||||
Мин. | +0% | +8% |
2560 × 1440 | ||||
---|---|---|---|---|
Полноэкранное сглаживание | NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) | NVIDIA TITAN X (1417/10000 МГц, 12 Гбайт) | NVIDIA TITAN X (1617/11110 МГц, 12 Гбайт) | |
Ashes of the Singularity | MSAA 4x | 33 | 39 | 48 |
Battlefield 4 | MSAA 4x + FXAA High | 98 | 109 | 146 |
Crysis 3 | MSAA 4x | 53 | 63 | 81 |
DiRT Rally | MSAA 4x | 74 | 93 | 93 |
DOOM | TSSAA 8TX | 126 | 166 | 183 |
GTA V | SMAA | 63 | 67 | 86 |
HITMAN | MSAA 4x + FXAA | 33 | 43 | 49 |
Metro: Last Light Redux | SSAA 4x | 52 | 71 | 82 |
Rise of the Tomb Raider | Не поддерживается | 38 | 44 | 59 |
Tom Clancy"s The Division | SSAA 4x | 58 | 63 | 86 |
Total War: WARHAMMER | SMAA 1x High | 50 | 57 | 74 |
Макс. | +36% | +58% | ||
Среднее | +20% | +47% | ||
Мин. | ||||
DOOM | 68 | 92 | 104 | |
GTA V | 51 | 55 | 75 | |
HITMAN | 53 | 67 | 77 | |
Metro: Last Light Redux | 47 | 64 | 74 | |
Rise of the Tomb Raider | 44 | 50 | 69 | |
Tom Clancy"s The Division | 33 | 38 | 52 | |
Total War: WARHAMMER | 38 | 43 | 58 | |
Макс. | +37% | +59% | ||
Среднее |
Наимено- вание | Radeon R9 290X | Radeon R9 295X2 | GeForce GTX 780 Ti | GeForce GTX Titan | GeForce GTX Titan Black | GeForce GTX Titan Black Z | GeForce GTX 980 | GeForce GTX Titan X |
Кодовое имя | Hawaii XT | Hawaii XT | GK110 | GK110 | GK110 | GK110 | GM204 | GM200 |
Версия | GCN 1.1 | GCN 1.1 | Kepler | Kepler | Kepler | Kepler | Maxwell 2.x | Maxwell 2.x |
Техпроцесс, нм | 28 | 28 | 28 | 28 | 28 | 28 | 28 | 28 |
Размер ядра/ядер, мм 2 | 438 | 438 x 2 | 521 | 521 | 521 | 521 x 2 | 398 | – |
Количество транзисторов, млн | 6200 | 6200 x 2 | 7100 | 7100 | 7100 | 7100 x 2 | 5200 | 8000 |
Частота ядра, МГц | – | – | 880 | 840 | 890 | 700 | 1126 | 1000 |
Частота ядра (Turbo), МГц | 1000 | 1018 | 930 | 880 | 980 | 880 | 1216 | 1075 |
Число шейдеров (PS), шт. | 2816 | 5632 | 2880 | 2688 | 2880 | 5760 | 2048 | 3072 |
Число текстурных блоков (TMU), шт. | 176 | 352 | 240 | 224 | 240 | 480 | 128 | 192 |
Число блоков растеризации (ROP), шт. | 64 | 128 | 48 | 48 | 48 | 96 | 64 | 96 |
Максимальная скорость закраски, Гпикс/с | 64 | 130 | 42 | 40.2 | 42.7 | 84.6 | 72 | – |
Максимальная скорость выборки текстур, Гтекс/с | 176 | 358 | 210.2 | 187.5 | 213.4 | 338 | 144.1 | 192 |
Тип памяти | GDDR5 | GDDR5 | GDDR5 | GDDR5 | GDDR5 | GDDR5 | GDDR5 | GDDR5 |
Эффективная частота памяти, МГц | 5000 | 5000 | 7000 | 6000 | 7000 | 7000 | 7000 | 7000 |
Объем памяти, Гбайт | 4 | 4 + 4 | 3 | 6 | 6 | 6 + 6 | 4 | 12 |
Шина памяти, бит | 512 | 512 + 512 | 384 | 384 | 384 | 384 + 384 | 256 | 384 |
Пропускная способность памяти, Гбайт/с | 320 | 320 + 320 | 336 | 288.4 | 336 | 336 + 336 | 224.3 | 336.5 |
Питание, разъемы Pin | 6 + 8 | 8 + 8 | 6 + 8 | 6 + 8 | 6 + 8 | 8 + 8 | 6 + 6 | 6 + 8 |
Потребляемая мощность (2D / 3D), Ватт | -/290 | -/500 | -/250 | -/250 | -/250 | -/375 | -/165 | -/250 |
CrossFire/Sli | V | V | V | V | V | V | V | V |
Цена при анонсе, $ | 550 | 1500 | 700 | 1000 | 1000 | 3000 | 550 | 999 |
Заменяемая модель | – | HD 7990 | GTX 780 | – | GTX Titan | GTX 690 | GTX 780 Ti | Titan Black |
А теперь поговорим о цене и российской реальности, поскольку в таблице указана предполагаемая стоимость видеокарты. Ведь, несмотря на анонс, на момент написания материала компания Nvidia еще не определилась с ценником окончательно, соответственно авторы обзоров могут только гадать. А делать выводы без подобной информации сложно.
Предположительно, целевая стоимость новинки будет в диапазоне $1000–1300. Допустим, она будет стоить ровно тысячу долларов. В магазинах такой ценник трансформируется в минимум 65 000 рублей, что автоматически сужает круг потенциальных потребителей до одного-двух человек в месяц. При этом высокий курс доллара выбил из претендентов на покупку и GeForce GTX 970, и GeForce GTX 980 – все они теперь попросту не по карману рядовому геймеру. А так да, GeForce GTX Titan X будет быстрой .
В свете этих событий многие пользователи предпочтут либо вовсе отказаться от обновления, либо сэкономить и купить б/у модель, что вполне логично и обосновано. А значит, обзор GeForce GTX Titan X большинство энтузиастов воспримет как некий набор больших чисел.
Новые технологии 3D
Помимо поддержки VXGI, различных методов сглаживания, привычного GPU Boost и многого другого, GeForce GTX Titan X, как и все предыдущие видеокарты Nvidia, постепенно начинают готовить к 3D очкам виртуальной реальности. Основная проблема с существующими устройствами 3D – высокое время отклика. Суммарно под этим понятием мы понимаем время отклика матрицы, время срабатывания гироскопов, время передачи графической информации от ускорителя к очкам. За год в Oculus добились многого, чему в немалой степени помог анонсированный DirectX 12, но со стороны разработчиков графических решений работы ожидается не меньше.
Как раз этим и занялась компания Nvidia, внося оптимизации в программное обеспечение. Пока я не уверен, что это коснется всего модельного ряда, вероятнее всего нововведения, пусть и программные, затронут только последнее поколение. А в чем, собственно говоря, заключается проблема? Технология Oculus – это один источник отображения, разделенный на две видимые зоны. Текущее положение дел из-за высокой задержки рендера изображения в шлеме вызывает у человека головокружения и нередко тошноту. Представьте себя «подшофе», вот точно также вы ощутите себя через 10-30 минут, поиграв в любую динамичную игру в очках Oculus.
- VR SLI – две видеокарты работают раздельно с каждым глазом в очках. Увеличивается общая скорость, что снижает головокружения.
- Асинхронный режим для одной видеокарты. Данные от гироскопов передаются графическому ускорителю, и следующий кадр пересчитывается лишь частично, экономя ресурсы системы.
Насколько нововведения улучшают ощущения, ответить сложно, по крайней мере, пока самостоятельно не проверишь. Увы, в момент анонса шлемов для прессы не было, поэтому остается только верить на слово.