olohuoneen suunnittelu / 26.06.2022

Titan x kartta. NVIDIA TITAN X Super Graphics Card Review and Test: Ylivertaisuuden osoittaminen

Kevät ei ole vain luonnon heräämisen aikaa, vaan myös Titan-linjan lippulaivan yksisiruisen näytönohjaimen perinteisen julkistamisen aika. Ja vaikka NVIDIA GeForce GTX Titan X:n ensimmäinen esittely oli odottamaton, tätä ilmoitusta ympäröi useita huhuja. Pari päivää sitten oli tämän videokortin virallinen esittely, usean päivän ajan meillä oli mahdollisuus tutkia sitä yksityiskohtaisesti. Mistä hän voi ylpeillä, katsotaanpa lisää.

NVIDIA GeForce GTX Titan X:stä tuli sarjan neljäs ja kolmas "titaani" yksisiruisessa järjestelmässä. Haluan muistuttaa, että GeForce GTX Titan Z kahdella GPU:lla erottuu toisistaan. Tietenkin ymmärrämme, että tällaisia järjestelmiä ei voida kutsua "suosituiksi", mutta jopa 1000-1300 dollarin puuttuessa tämä katsastus voi olla mielenkiintoista tutustua Maxwell-arkkitehtuuriin sen maksimaalisessa toteutuksessa tänään. Kuten odotettiin, se perustuu GM200-ytimeen, tämän arkkitehtuurin toiseen sukupolveen. Sen mukana tulee PolyMorph Engine 3.0, joka tukee ominaisuustason Direct3D 12:ta ja laitteistokiihdytettyä maailmanlaajuista valaistustekniikkaa. Ehkä tämä on se läpimurto realismissa ja grafiikassa, jota peliteollisuus on odottanut niin kauan?

GM200 sisältää 8 miljardia transistoria, 256 ROP:ta, 3072 CUDA:ta ja 384-bittisen muistiväylän. Kaikki nämä aseet on tarkoitettu tukemaan 4K-resoluutiota ja parantamaan 3D-suorituskykyä. Perusydintaajuus on: 1000 MHz, Boost Clock - 1076 MHz. Muisti toimii 7012 MHz taajuudella. Laitteessa on 12 Gt näytönohjainmuistia, joka ei ollut käytettävissä pelaajille suunnatuissa näytönohjaimissa ennen Titan X:n julkaisua.

Videoarvostelu NVIDIA GeForce GTX Titan X

Ulkomuoto

NVIDIA GeForce GTX Titan X ei tullut vallankumoukseksi huippuluokan näytönohjainten suunnittelussa, ulkonäkö on muuttunut vähän. Käytetään ilmajäähdytysjärjestelmää, joka ulkoisesti toistaa aiemmin näkemämme.

Muokkaukset ovat pieniä, ne rajoittuvat rungon värin muutokseen. Nyt se on melkein kokonaan maalattu mustaksi.

Näytönohjain on vailla vahvistinlevyä painetun piirilevyn takana. Haluan muistuttaa, että se oli GeForce GTX 980:n referenssisuunnittelussa.

Takapaneelissa näkyy: kolme DisplayPort, HDMI ja DVI. Kolme liitintä voi toimia jaetussa työtilassa, mutta voit yhdistää kaikki 5 liitintä samanaikaisesti. Samaa lähestymistapaa sovelletaan koko 900-linjalla.

Valoisa NVIDIA GeForce GTX -logo sivulla. Valitettavasti upeat kuvat hehkuvasta tuulettimesta ovat vain valokuvia.

Jäähdytys

Asennetun jäähdytysjärjestelmän rakenne toistaa GeForce GTX 780 Ti:ssä käytettyä.

Käytössä on haihdutuskammio, joka osoittautui vahvaksi puolelle siirrettäessä suurta lämpöä jäähdyttimeen.

Järjestelmä on kokoontaitettava, joten voit irrottaa lämmönhajottimen kokonaan, se voi olla hyödyllinen vesijäähdytysjärjestelmän asennuksessa.

Täyte

Myös sähköjärjestelmä siirtyi muutoksesta mainitsemisesta huolimatta, tarkastuksessa on kaikki samat kondensaattorit ja kuristimet. Jopa PWM-ohjain on meille tuttu - NCP4206.

Mutta en ala dramatisoimaan, me itse emme löytäneet sitä melua ja vinkua, jotka mainittiin useiden videokorttien kommenteissa, edes pitkäaikaisessa kuormituksessa.

Myös jännitteen nostotanko on säilynyt. NVIDIA GeForce GTX Titan X:ssä sitä voidaan kasvattaa 25 W:iin (TDP 250W/275W).

SKhynix-muistisiruja, joiden taajuus on 1750 MHz, juotetaan 12 Gt, niitä on yhteensä 24 kappaletta.

Testataan NVIDIA GeForce GTX Titan X

Käytettiin testitelinettä.

Malli	Data
Kehys	Aerocool Strike-X Air
Emolevy	Biostar Hi-Fi Z87X 3D
prosessori	Intel Core i5-4670K Haswell
CPU-jäähdytin	Deep Cool Ice Blade Pro v2.0
näytönohjain	Inno3D iChill GeForce GTX 780Ti HerculeZ X3 Ultra
RAM	Corsair CMX16GX3M2A1600C11 DDR3-1600 16GB Kit CL11
HDD	ADATA XPG SX900 256 Gt
Kiintolevy 2	WD punainen WD20EFRX
Virtalähde	Aerocool Templarius 750W
wifi sovitin	TP-LINK TL-WDN4800
Audio	Creative Sound Blaster EVO Wireless
Monitori	iiyama ProLite E2773HDS
Näyttö 2	Philips 242G5DJEB
hiiri	ROCCAT Kone XTD
Näppäimistö	Razer BlackWidow Chroma
Stabilisaattori	Sven AVR PRO LCD 10000
Käyttöjärjestelmä	Microsoft Windows Ultimate 8 64-bittinen

Kaikissa alla olevissa taulukoissa tiedot on annettu tehdasasetuksia käyttäen, valmistajien omaa ohjelmistoa ei ole asennettu. Myöskään muistiin ja ydintaajuuksiin ei vaikuteta, jotta ulkopuolisten tekijöiden vaikutus voidaan sulkea pois.

1. Näytönohjaimen lämpötila

NVIDIA GeForce GTX Titan X - 31/83
Inno3D iChill GeForce GTX 960 Ultra - 29/44
GeForce GTX 980 - 34/79
GeForce GTX 770 - 35/80
GeForce GTX 780 - 35/77
GeForce GTX 760 - 35/84

2. Melu

NVIDIA GeForce GTX Titan X - 36/42
GeForce GTX 980 - 34/79

3. Virrankulutus

NVIDIA GeForce GTX Titan X-405
Inno3D iChill GeForce GTX 960 Ultra - 260
GeForce GTX 980-295
Inno3D iChill GeForce GTX 780Ti HerculeZ X3 Ultra - 340

Perinteisesti aloitamme suorituskyvyn arvioinnin synteettisillä testeillä.

NVIDIA GeForce GTX Titan X - 7133
Inno3D iChill GeForce GTX 960 Ultra - 3522
GeForce GTX 980-6050
Inno3D iChill GeForce GTX 780Ti HerculeZ X3 Ultra - 6190

Loput testisarjasta:

On näyttävimpien testien, FPS-mittausten aika resurssiintensiivisissä peleissä. Seuraamme useita pöytiä visuaalisilla videoilla pelin aikana. Tiedot tallennetaan Full HD -resoluutiolla Ultra-asetuksissa. On syytä ottaa huomioon, että joissain videoissa todelliset FPS-tiedot ovat alhaisemmat kuin testiajojen aikana saadut, tämä johtuu videotallennusresurssien kustannuksista. Tämän näytönohjaimen osalta testasimme erikseen työn 3840x2160 resoluutiolla Ultra-asetuksissa.

6. Crysis 3
Crysis 3 - 3840x2160 - Erittäin korkea 4xAA - 22.

Inno3D iChill GeForce GTX 960 Ultra - 45
GeForce GTX 980-69
Inno3D iChill GeForce GTX 780Ti HerculeZ X3 Ultra - 61
GeForce GTX 770-43
GeForce GTX 780-47

7. Battlefield 4
Battlefield 4 - 3840x2160 - Ultra - 39

NVIDIA GeForce GTX Titan X-75
Inno3D iChill GeForce GTX 960 Ultra - 52
GeForce GTX 980-91
Inno3D iChill GeForce GTX 780Ti HerculeZ X3 Ultra - 82

8. Hitman: Absolution
Erittäin vaativa peli, joka perustuu Glacier 2 -moottoriin. Pelin ruokahalu on kateus vuoden muista uusista julkaisuista.
Hitman: Absolution - 3840x2160 - korkea, 2x MSAA, 16x AF - 46

NVIDIA GeForce GTX Titan X-95
Inno3D iChill GeForce GTX 960 Ultra - 44/li>
GeForce GTX 980-70
Inno3D iChill GeForce GTX 780Ti HerculeZ X3 Ultra - 62
GeForce GTX 770-43
GeForce GTX 780-55
GeForce GTX 760-41

9. Metro Last Light
Toinen laitteistoa vaativa peli, joka käyttää DirectX 11:tä ja tessellaatiota.
Metro Last Light - 3840x2160 - Erittäin korkea - 35

10 Keskimaa: Varjo Mordor

Inno3D iChill GeForce GTX 960 Ultra - 51
GeForce GTX 980-111

Keskimaa: Mordorin varjo - 3840x2160 - Ultra - 49

11. Tomb Raider

NVIDIA GeForce GTX Titan X - 156
Palit GeForce GTX 960 Super JetStream - 64
Inno3D iChill GeForce GTX 960 Ultra - 68
GeForce GTX 980-100

Tomb Raider - 3840x2160 - Ultra - 49

12. Watch Dogs Ultra 4x AA

NVIDIA GeForce GTX Titan X-80
Inno3D iChill GeForce GTX 960 Ultra - 49
GeForce GTX 980-62

Watch Dogs - 3840x2160 - Ultra - 27

13. Total War: Rome II Extreme

NVIDIA GeForce GTX Titan X-79
Inno3D iChill GeForce GTX 960 Ultra - 41
GeForce GTX 980-70

Total War: Rome II - 3840x2160 - Ultra - 30

14. GRID Autosport Ultra 4x MSAA

NVIDIA GeForce GTX Titan X - 154
Inno3D iChill GeForce GTX 960 Ultra - 80
GeForce GTX 980-128

GRID Autosport - 3840x2160 - Ultra - 69

15. World of Tanks

NVIDIA GeForce GTX Titan X - 124
Palit GeForce GTX 960 Super JetStream - 71
Inno3D iChill GeForce GTX 960 Ultra - 75
GeForce GTX 980-116

16. World of Warships

Tämä on uusi osa testeistämme, vaikka testattujen näytönohjainkorttien määrä on rajallinen, kattava materiaali julkaistaan maaliskuun loppuun mennessä. World of Warshipsin graafisen tehokkuuden arvioiminen on vaikeaa, mutta yleisesti ottaen näistä tiedoista voi olla hyötyä rakennettaessa järjestelmää erityisesti Wargaming-peleihin.

NVIDIA GeForce GTX Titan X-72
Inno3D iChill GeForce GTX 780Ti - 72 -näytönohjain
Palit GeForce GTX 960 Super JetStream - 59
Radeon R9 280x - 70
Radeon R9 280x - 70

Tällä hetkellä pelimoottori rajoittaa maksimi FPS -merkin noin 72:een.

Ylikellotus

Perinteisesti emme rajoitu testaamiseen vakiotaajuuksilla. Ylikellotusta varten MSI Afterburner on uusin versio testaushetkellä. NVIDIA GeForce GTX Titan X:llä pystyimme saavuttamaan seuraavat tulokset nostamatta ydinjännitettä:

Suorituskyvyn kasvun vertaamiseen käytetään synteettistä testiä 3D Mark FireStrike:

Ylikellotus on mahdollista suurimmalla jännitteen nousulla. Ydintaajuus voidaan nostaa muistilla 1202 MHz:iin ja 7806 MHz:iin. Täällä maksimilämpötilapalkki nousee 88 asteeseen.

NVIDIA GeForce GTX Titan X -tulokset

NVIDIA GeForce GTX Titan X osoitti parempaa suorituskykyä alhaisemman virrankulutuksen taustalla. Nykyisellä voimien kohdistuksella tämä on suurin suorituskyky yksisirujärjestelmässä. AMD Radeonin riittäviä vastauksia ei ole vielä ilmoitettu. Vaihtoehtona voimme harkita GTX 780 Ti:tä, GTX 980:aa SLI-tilassa, Radeon R9 290X:ää, joka on edelleen ajankohtainen. Se on myös mielenkiintoinen videon renderöinnin kannalta.

NVIDIA GeForce GTX Titan X voitti ansaitun kullan..

Nvidia Geforce GTX Titan X

Tehokkain yhden prosessorin kiihdytin

Osa 2 - Käytännön tutustuminen

Uuden kiihdytin (ja sen ohjelmiston) testinäytteen myöhästymisen vuoksi sekä kirjoittajamme Aleksei Berillon osallistumisen vuoksi GTC:n työhön, osa tästä katsauksesta on omistettu uuden Nvidian arkkitehtuurille. tuote ja synteettisten testien analyysi julkaistaan myöhemmin (noin viikon kuluttua). Ja nyt esittelemme materiaalin, joka tutustuttaa lukijat näytönohjaimen ominaisuuksiin sekä pelitestien tuloksiin.

Laitteet)

Nvidia Geforce GTX Titan X 12288MB 384-bittinen GDDR5 PCI-E
Parametri	Merkitys	Nimellisarvo (viite)
GPU	Geforce GTX Titan X (GM200)
Käyttöliittymä	PCI Express x16
GPU:n toimintataajuus (ROPs), MHz	1000—1075	1000—1075
Muistin taajuus (fyysinen (tehollinen)), MHz	1750 (7000)	1750 (7000)
Muistinvaihtoväylän leveys, bitti	384
GPU:n laskentayksiköiden lukumäärä / lohkojen taajuus, MHz	24/1000—1075	24/1000—1075
Operaatioiden määrä (ALU) lohkoa kohden	128
Operaatiot yhteensä (ALU)	3072
Tekstuuriyksiköiden määrä (BLF/TLF/ANIS)	192
Rasterointilohkojen määrä (ROP)	96
Mitat, mm	270×100×35	270×100×35
Näytönohjaimen käyttämien järjestelmäyksikön paikkojen määrä	2	2
Tekstioliitti väri	musta	musta
Virrankulutus (huippu 3D-tilassa/2D-tilassa/lepotilassa), W	257/98/14	257/98/14
Melutaso (2D-tilassa / 2D-tilassa (videon toisto) / maksimi 3D-tilassa), dBA	20/21/29,5	—
Lähtöliittimet		1×DVI (Dual-Link/HDMI), 1×HDMI 2.0, 3×DisplayPort 1.2
Tuki moniprosessoinnille	SLI
Vastaanottimien/monitorien enimmäismäärä samanaikaista kuvan tulostamista varten	4	4
Aputeho: 8-nastaisten liittimien määrä	1	1
Aputeho: 6-nastaisten liittimien määrä	1	1
Suurin 2D-resoluutio: DP/HDMI/Dual-Link DVI/Single-Link DVI
Suurin 3D-resoluutio: DP/HDMI/Dual-Link DVI/Single-Link DVI	3840×2400/3840×2400/2560×1600/1920×1200

Mukana paikallisen muistin kanssa
Kortissa on 12 288 Mt GDDR5 SDRAM -muistia 24 4 Gt:n piirissä (12 PCB:n kummallakin puolella). DirectX 11:n synteettisinä testeinä käytimme esimerkkejä Microsoftin ja AMD SDK:ista sekä Nvidia-demo-ohjelmasta. Ensimmäinen on HDRToneMappingCS11.exe ja NBodyGravityCS11.exe DirectX SDK:sta (helmikuu 2010). Otimme myös hakemuksia molemmilta videosirujen valmistajilta: Nvidialta ja AMD:ltä. DetailTessellation11 ja PNTriangles11 on otettu ATI Radeon SDK:sta (ne ovat myös DirectX SDK:ssa). Lisäksi käytettiin Nvidian Realistic Water Terrain -demo-ohjelmaa, joka tunnetaan myös nimellä Island11. Synteettiset testit suoritettiin seuraaville näytönohjaimille: Geforce GTX Titan X GTX Titan X) Geforce GTX Titan Z vakioparametreilla (lyhennetty GTX Titan Z) Geforce GTX 980 vakioparametreilla (lyhennetty GTX 980) Radeon R9 295X2 vakioparametreilla (lyhennetty R9 295x2) Radeon R9 290X vakioparametreilla (lyhennetty R9 290X) Geforce GTX Titan X -näytönohjaimen uuden mallin suorituskyvyn analysoimiseksi nämä ratkaisut valittiin seuraavista syistä. Geforce GTX 980 perustuu grafiikkasuorittimeen, jolla on sama Maxwell-arkkitehtuuri, mutta alemman tason - GM204, ja meidän on erittäin mielenkiintoista arvioida, mitä GM200: n sirun monimutkaisuus antoi. Geforce GTX Titan Z -kaksisiruinen näytönohjain otettiin vain viitteeksi - tuottavimmaksi Nvidia-näytönohjaimeksi, joka perustuu edellisen Kepler-arkkitehtuurin GK110-siruihin. Kilpailijayritykseltä AMD valitsimme vertailuun myös kaksi näytönohjainta. Ne ovat periaatteessa hyvin erilaisia, vaikka ne perustuvat samoihin Hawaii-grafiikkasuorittimiin - niillä on vain eri määrä GPU:ita korteissa ja ne eroavat sijainniltaan ja hinnaltaan. Geforce GTX Titan X:llä ei ole hintakilpailijoita, joten otimme tehokkaimman kaksisiruisen näytönohjaimen Radeon R9 295X2, vaikka tällainen vertailu ei olisi teknisesti kovin mielenkiintoinen. Jälkimmäiseen otettiin kilpailijan nopein yksisiruinen näytönohjain Radeon R9 290X, vaikka se julkaistiin liian kauan sitten ja perustuu selkeästi vähemmän monimutkaiseen GPU:han. Mutta AMD-ratkaisuista ei yksinkertaisesti ole muuta vaihtoehtoa. Direct3D 10: PS 4.0 pikselin varjostustestit (teksturointi, silmukka) Hylkäsimme vanhentuneista DirectX 9 -vertailuarvoista, sillä supertehokkaat ratkaisut, kuten Geforce GTX Titan X, eivät osoita niissä kovin hyviä tuloksia, koska niitä rajoittavat aina muistin kaistanleveys, täyttönopeus tai teksturointi. Puhumattakaan siitä, että kaksisiruiset näytönohjaimet eivät aina toimi oikein tällaisissa sovelluksissa, ja meillä on niitä kaksi. RightMark3D:n toinen versio sisältää kaksi jo tuttua PS 3.0 -testiä Direct3D 9:n alla, jotka kirjoitettiin uudelleen DirectX 10:tä varten, sekä kaksi uutta testiä. Ensimmäinen pari lisäsi mahdollisuuden ottaa käyttöön self-shadowing ja Shader supersampling, mikä lisää lisäksi videosirujen kuormitusta. Nämä testit mittaavat silmukkakuvapisteiden varjostimien suorituskykyä suurella määrällä tekstuurinäytteitä (jopa useita satoja näytteitä pikseliä kohden raskaimmassa tilassa) ja suhteellisen pienellä ALU-kuormalla. Toisin sanoen ne mittaavat tekstuurin haun nopeutta ja haaroittamisen tehokkuutta pikselivarjostimessa. Ensimmäinen pikselivarjostustesti on Fur. Alimmilla asetuksilla se käyttää 15-30 pintakuvionäytettä korkeuskartalta ja kahta näytettä päätekstuurista. Effect detail - "High" -tila lisää näytteiden lukumäärän 40-80:een, "shader" supersamplingin sisällyttäminen - jopa 60-120 näytteeseen, ja "High"-tilalle yhdessä SSAA:n kanssa on ominaista suurin "vakavuus". - 160 - 320 näytettä korkeuskartalta. Tarkastetaan ensin tilat ilman supersamplingia, ne ovat suhteellisen yksinkertaisia, ja tulosten suhteen "Matala" ja "Korkea" -tiloissa pitäisi olla suunnilleen sama. Suorituskyky tässä testissä riippuu TMU:iden lukumäärästä ja tehokkuudesta, ja myös monimutkaisten ohjelmien suorittamisen tehokkuus vaikuttaa. Ja versiossa ilman supersamplingia tehokkaalla täyttönopeudella ja muistin kaistanleveydellä on myös lisävaikutus suorituskykyyn. Tulokset "Korkea"-tasoa eriteltäessä ovat jopa puolitoista kertaa alhaisemmat kuin "Matalalla". Proseduurin turkisrenderöinnissä, jossa on suuri määrä tekstuureja, GCN-arkkitehtuuriin perustuvien videosirujen julkaisun myötä AMD on jo kauan sitten ottanut johtoaseman. Radeon-levyt ovat edelleen parhaita näissä vertailuissa tähän päivään asti, mikä osoittaa, että ne ovat tehokkaampia näiden ohjelmien suorittamisessa. Tämän johtopäätöksen vahvistaa tämän päivän vertailu - arvioimamme Nvidia-näytönohjain hävisi jopa vanhentuneelle yksisiruiselle Radeon R9 290X:lle, puhumattakaan AMD:n lähimmästä hintakilpailijasta. Ensimmäisessä Direct3D 10 -testissä Geforce GTX Titan X -mallin uusi näytönohjain osoittautui hieman nopeammaksi kuin sen nuorempi sisar perustuen saman arkkitehtuurin siruun GTX 980:n muodossa, mutta jälkimmäinen ei ole kaukana. jäljessä - 9-12%. Tämä tulos selittyy GTX 980:n huomattavasti pienemmällä teksturointinopeudella, ja se on jäljessä muissa parametreissa, vaikka ALU:iden suorituskyvyllä ei selvästikään ole merkitystä. Kaksisiruinen Titan Z on nopeampi, mutta ei yhtä nopea kuin Radeon R9 295X2. Katsotaanpa saman testin tulosta, mutta "shader" supersamplingin ollessa päällä, mikä nelinkertaistaa työn: tällaisessa tilanteessa jonkin pitäisi muuttua, ja muistin kaistanleveydellä täyttönopeudella on vähemmän vaikutusta: Geforce GTX Titan X -mallin uusi näytönohjain on vaikeissa olosuhteissa jo selvemmin edellä saman sukupolven nuorempaa mallia - GTX 980:a, ja se on nopeampi kohtuulliset 33-39%, mikä on paljon lähempänä teoreettista eroa. heidän välillään. Ja kilpailijoiden Radeon R9 295X2 ja R9 290X muodossa oleva ruuhka on vähentynyt - Nvidian uusi tuote on melkein kuronut kiinni yksisiruisen Radeonin. Kaksisiruinen on kuitenkin kaukana edellä, koska AMD-sirut pitävät pikseli-pikseliltä laskelmia ja ovat erittäin vahvoja sellaisissa laskelmissa. Seuraava DX10-testi mittaa monimutkaisten silmukoiden pikselivarjostimien suorittamisen suorituskykyä suurella määrällä tekstuurihakuja, ja sitä kutsutaan nimellä Steep Parallax Mapping. Matalilla asetuksilla se käyttää 10-50 pintakuviointinäytettä korkeuskartalta ja kolmea näytettä päätekstuureista. Kun otat raskaan tilan käyttöön itsevarjostuksen kanssa, näytteiden määrä kaksinkertaistuu ja supersampling nelinkertaistaa tämän määrän. Monimutkaisin testitila, jossa on supersampling ja itsevarjostus, valitsee 80 - 400 pintakuvioarvoa, eli kahdeksan kertaa enemmän kuin yksinkertainen tila. Tarkistamme ensin yksinkertaiset vaihtoehdot ilman supersamplingia: Toinen Direct3D 10 pikselin varjostimen testi on käytännön kannalta mielenkiintoisempi, koska parallaksikartoituslajikkeita käytetään laajasti peleissä ja raskaita variantteja, kuten jyrkkää parallaksikartoitusta, on käytetty pitkään monissa projekteissa, esimerkiksi peleissä. Crysis, Lost Planet ja monet muut sarjat. Lisäksi testissämme voit supersamplingin lisäksi ottaa käyttöön itsevarjostuksen, mikä lisää videosirun kuormitusta noin kaksinkertaiseksi - tätä tilaa kutsutaan nimellä "High". Kaavio on yleisesti ottaen samanlainen kuin edellinen, myös ilman supersamplingin sisällyttämistä, ja tällä kertaa uusi Geforce GTX Titan X osoittautui hieman lähemmäksi GTX Titan Z:ta, häviämättä niinkään kaksisiruiselle levylle. Kepler-perheen GPU-parilla. Eri olosuhteissa uusi tuote on 14-19% edellä Nvidian nykyisen sukupolven aiempaa huippumallia, ja vaikka ottaisimme vertailun AMD-näytönohjainkortteihin, tässä on jotain muuttunut - tässä tapauksessa uusi GTX Titan X on hieman huonompi kuin Radeon R9 290X. Kaksisiruinen R9 295X2 on kuitenkin kaukana kaikkia edellä. Katsotaanpa, mikä muuttaa supersamplingin sisällyttämisen: Kun supersampling ja self-shadowing ovat käytössä, tehtävä vaikeutuu, kahden vaihtoehdon yhdistäminen kerralla lisää korttien kuormitusta lähes kahdeksankertaiseksi, mikä aiheuttaa vakavan suorituskyvyn laskun. Testattujen näytönohjainkorttien nopeusindikaattoreiden välinen ero on hieman muuttunut, vaikka supersamplingin sisällyttämisellä on vähemmän vaikutusta kuin edellisessä tapauksessa. AMD Radeon -grafiikkaratkaisut toimivat tässä D3D10 pikselin varjostustestissä tehokkaammin kuin kilpailevat Geforce-levyt, mutta uusi GM200-siru muuttaa tilanteen parempaan suuntaan – Maxwell-arkkitehtuuripiiriin perustuva Geforce GTX Titan X -kortti on jo edellä Radeon R9 290X:ää kaikissa olosuhteissa (perustuu kuitenkin huomattavasti vähemmän monimutkaisempaan GPU:hun). Hawaii-pariin perustuva kaksisiruinen ratkaisu pysyy johtajana, mutta muihin Nvidian ratkaisuihin verrattuna uusi tuote ei ole huono. Se osoitti nopeutta lähes kahden sirun Geforce GTX Titan Z:n tasolla ja ylitti Geforce GTX 980:n 28-33%. Direct3D 10: PS 4.0 Pixel Shader -vertailu (tietokone) Seuraavat pari pikselivarjostustestiä sisältävät vähimmäismäärän pintakuviohakuja vähentääkseen TMU:n suorituskykyä. Ne käyttävät suurta määrää aritmeettisia operaatioita ja mittaavat tarkasti videosirujen matemaattista suorituskykyä, aritmeettisten käskyjen suoritusnopeutta pikselivarjostimessa. Ensimmäinen matematiikan koe on mineraali. Tämä on monimutkainen menettelyllinen teksturointitesti, joka käyttää vain kahta pintakuviotietonäytettä ja 65 sin ja cos -käskyä. Rajoittavien matemaattisten testien tulokset vastaavat useimmiten taajuuksien ja laskentayksiköiden lukumäärän eroa, mutta vain likimääräisesti, koska tuloksiin vaikuttavat niiden käytön erilainen tehokkuus tietyissä tehtävissä ja ajurien optimointi sekä viimeisin taajuus ja virranhallintajärjestelmät ja jopa muistin kaistanleveyden painottaminen. Mineral-testin tapauksessa uusi Geforce GTX Titan X -malli on vain 10 % nopeampi kuin saman sukupolven GM204-siruun perustuva GTX 980 -kortti, ja kaksisiruinen GTX Titan Z ei ollut niin nopea tässä testissä. - jokin estää selvästi Nvidia-kortteja avautumasta. Geforce GTX Titan X:n vertaaminen kilpaileviin AMD:n emolevyihin ei olisi niin surullista, jos R9 290X:n ja Titan X:n GPU:t olisivat monimutkaisia. Mutta GM200 on paljon suurempi kuin Havaiji, ja sen pieni voitto on luonnollista. Nvidian arkkitehtuuripäivitys Kepleristä Maxwelliin on tuonut uudet sirut lähemmäksi kilpailevia AMD-ratkaisuja tällaisissa testeissä. Mutta jopa halvempi kaksisiruinen ratkaisu Radeon R9 295X2 on huomattavasti nopeampi. Tarkastellaan toista varjostuslaskennan testiä, jota kutsutaan Fireksi. Se on ALU:lle raskaampi, ja siinä on vain yksi tekstuurinhaku, ja sin- ja cos-käskyjen määrä on kaksinkertaistettu, jopa 130. Katsotaan mikä on muuttunut kuormituksen kasvaessa: RigthMarkin toisessa matemaattisessa testissä näemme jo erilaisia tuloksia näyttökorteille suhteessa toisiinsa. Joten uusi Geforce GTX Titan X on jo vahvempi (20 %) GTX 980:a edellä saman grafiikkaarkkitehtuurin sirulla, ja kaksisiruinen Geforce on hyvin lähellä uutta tuotetta - Maxwell selviytyy laskentatehtävistä paljon parempi kuin Kepler. Radeon R9 290X on jäänyt taakse, mutta kuten jo kirjoitimme, Hawaii GPU on huomattavasti yksinkertaisempi kuin GM200, ja tämä ero on looginen. Mutta vaikka kaksisiruinen Radeon R9 295X2 on edelleen johtava matemaattisissa testeissä, yleensä uusi Nvidia-videosiru suoriutui hyvin tällaisissa tehtävissä, vaikka se ei saavuttanut teoreettista eroa GM204: n kanssa. Direct3D 10: Geometry Shader -testit RightMark3D 2.0:ssa on kaksi geometrian varjostimen nopeustestiä, ensimmäinen vaihtoehto on nimeltään "Galaxy", tekniikka on samanlainen kuin Direct3D:n aiempien versioiden "pistesprite". Se animoi hiukkasjärjestelmän GPU:ssa, geometriavarjostin jokaisesta pisteestä luo neljä kärkeä, jotka muodostavat hiukkasen. Samanlaisia algoritmeja tulisi käyttää laajalti tulevissa DirectX 10 -peleissä. Geometry shader -testien tasapainon muuttaminen ei vaikuta lopulliseen renderöintitulokseen, lopullinen kuva on aina täsmälleen sama, vain kohtausten käsittelytavat muuttuvat. "GS-kuorma"-parametri määrittää, missä varjostimessa laskelmat suoritetaan - kärjessä tai geometriassa. Laskelmien määrä on aina sama. Tarkastellaan "Galaxy" -testin ensimmäistä versiota, jossa on laskelmia vertex-varjostimessa, kolmelle geometrisen monimutkaisuuden tasolle: Kohtausten eri geometrisesti monimutkaisten nopeuksien suhde on suunnilleen sama kaikissa ratkaisuissa, suorituskyky vastaa pisteiden määrää, jokaisella askeleella FPS-pudotus on lähes kaksinkertainen. Tämä tehtävä on erittäin yksinkertainen tehokkaille nykyaikaisille näytönohjaimille, ja sen suorituskykyä rajoittaa geometrian käsittelynopeus ja joskus muistin kaistanleveys ja/tai täyttöaste. Ero Nvidia- ja AMD-siruihin perustuvien näytönohjainkorttien tulosten välillä on yleensä kalifornialaisen yrityksen ratkaisujen eduksi, ja se johtuu näiden yritysten sirujen geometristen putkien eroista. Tässäkin tapauksessa huippuluokan Nvidia-videosiruissa on monia geometrisia prosessointiyksiköitä, joten voitto on ilmeinen. Geometriatesteissä Geforce-levyt ovat aina kilpailukykyisempiä kuin Radeon. Uusi Geforce GTX Titan X -malli on hieman jäljessä edellisen sukupolven GPU:n kaksoissirun GTX Titan Z -kortista, mutta se ylittää GTX 980:n 12-25%. Radeon-näytönohjaimet näyttävät selvästi erilaisia tuloksia, sillä R9 295X2 perustuu GPU-pariin ja vain se voi kilpailla tämän testin uutuuden kanssa, ja Radeon R9 290X oli ulkopuolinen. Katsotaan kuinka tilanne muuttuu siirrettäessä osa laskelmista geometriavarjostimeen: Kun kuormitus muuttui tässä testissä, luvut muuttuivat hieman AMD-levyjen ja Nvidia-ratkaisujen osalta. Eikä se oikeastaan muuta mitään. Näytönohjaimet tässä geometriavarjostimien testissä reagoivat huonosti muutoksiin GS-kuormaparametrissa, joka on vastuussa osan laskelmien siirtämisestä geometriavarjostimeen, joten johtopäätökset pysyvät samoina. Valitettavasti "Hyperlight" on geometrian varjostimien toinen testi, joka osoittaa useiden tekniikoiden käytön kerralla: instanssi, stream-tulostus, puskurin kuorma, joka käyttää dynaamista geometrian luomista piirtämällä kahteen puskuriin, sekä uuden Direct3D 10 -ominaisuuden. - stream-lähtö, kaikki nykyaikaiset AMD-näytönohjaimet eivät vain toimi. Jossain vaiheessa toinen Catalyst-ohjainpäivitys lopetti tämän testin suorittamisen Catalyst-korteilla, eikä tätä ole korjattu useaan vuoteen. Direct3D 10: tekstuurien hakunopeus vertex-varjostimista "Vertex Texture Fetch" -testit mittaavat useiden pintakuvioiden haun nopeutta vertex-varjostimesta. Testit ovat pohjimmiltaan samanlaisia, joten "Earth"- ja "Waves"-testien korttien tulosten suhteen tulisi olla suunnilleen sama. Molemmissa testeissä käytetään pintakuvionäytteenottotietoihin perustuvaa siirtymäkartoitusta, ainoa merkittävä ero on, että "Waves"-testi käyttää ehdollisia hyppyjä, kun taas "Earth"-testi ei. Harkitse ensimmäistä testiä "Earth", ensin "Effect Detail Low" -tilassa: Aiemmat tutkimuksemme ovat osoittaneet, että sekä täyttönopeus että muistin kaistanleveys voivat vaikuttaa tämän testin tuloksiin, mikä näkyy selvästi Nvidia-levyjen tuloksissa, etenkin yksinkertaisissa tiloissa. Nvidian uusi näytönohjain tässä testissä näyttää selvästi pienemmän nopeuden kuin sen pitäisi olla - kaikki Geforce-levyt osoittautuivat suunnilleen samalla tasolla, mikä ei selvästikään vastaa teoriaa. Kaikissa tiloissa ne törmäävät selvästi muistin kaistanleveyteen. Radeon R9 295X2 ei kuitenkaan ole läheskään kaksi kertaa nopeampi kuin R9 290X. Muuten, tällä kertaa AMD:n yksisirulevy osoittautui vahvemmiksi kuin kaikki Nvidian levyt kevyessä tilassa ja suunnilleen niiden tasolla hard modessa. No, kaksisiruisesta Radeon R9 295X2:sta tuli jälleen vertailumme johtaja. Tarkastellaan suoritusta samassa testissä lisääntyneellä tekstuurinhakujen määrällä: Kaavion tilanne on hieman muuttunut, AMD:n yksisiruinen ratkaisu raskaissa tiloissa on menettänyt huomattavasti enemmän Geforce-kortteja. Uusi malli Geforce GTX Titan X osoitti jopa 14 % nopeampia nopeuksia kuin Geforce GTX 980 ja ylitti yksisirun Radeonin kaikissa tiloissa paitsi kevyimmässä - koska sama keskittyminen johonkin. Jos vertaamme uutta tuotetta AMD:n kaksoissiruratkaisuun, niin Titan X pystyi taistelemaan raskaassa tilassa osoittaen läheistä suorituskykyä, mutta jäljessä kevyissä tiloissa. Tarkastellaan toisen testin tuloksia vertex-varjostimien pintakuvioiden hauista. Waves-testissä on vähemmän näytteitä, mutta se käyttää ehdollisia hyppyjä. Bilineaaristen pintakuvionäytteiden määrä on tässä tapauksessa korkeintaan 14 ("Effect detail Low") tai enintään 24 ("Effect detail High") kärkeä kohti. Geometrian monimutkaisuus muuttuu samalla tavalla kuin edellisessä testissä. Toisen "Waves"-vertex-teksturointitestin tulokset eivät ole mitään sen kaltaisia, mitä näimme edellisissä kaavioissa. Kaikkien Geforcen nopeussuorituskyky tässä testissä on heikentynyt vakavasti, ja uusi Nvidia Geforce GTX Titan X -malli näyttää vain hieman nopeampaa nopeutta kuin GTX 980, mikä on jäljessä kaksisiruisesta Titan Z:sta. Kilpailijoihin verrattuna molemmat Radeon-levyt pystyivät näyttääksesi parhaan suorituskyvyn tässä testissä kaikissa tiloissa. Harkitse saman ongelman toista versiota: Toisessa tekstuurinäytteenottotestissä tehtävän monimutkaisuuden myötä kaikkien ratkaisujen nopeus pieneni, mutta Nvidia-näytönohjaimet kärsivät enemmän, mukaan lukien harkittava malli. Melkein mikään ei muutu päätelmissä, uusi Geforce GTX Titan X -malli on jopa 10-30% nopeampi kuin GTX 980, jääden jälkeen sekä kaksisiruisesta Titan Z:sta että molemmista Radeon-korteista. Radeon R9 295X2 oli näissä testeissä kaukana edellä, ja teorian näkökulmasta tämä on yksinkertaisesti käsittämätöntä lukuun ottamatta Nvidian riittämätöntä optimointia. 3DMark Vantage: Ominaisuustestit 3DMark Vantage -paketin synteettiset testit osoittavat meille, mitä olemme aiemmin menettäneet. Tämän testipaketin ominaisuustesteissä on DirectX 10 -tuki, ne ovat edelleen relevantteja ja mielenkiintoisia, koska ne eroavat meidän ominaisuuksistamme. Analysoitaessa tämän paketin viimeisimmän Geforce GTX Titan X -näytönohjaimen tuloksia, teemme uusia ja hyödyllisiä johtopäätöksiä, jotka ovat välttyneet RightMark-perhepakettien testeistä. Ominaisuustesti 1: Tekstuuritäyttö Ensimmäinen testi mittaa pintakuviohakuyksiköiden suorituskykyä. Käytetään suorakulmion täyttämiseen pienestä tekstuurista luetuilla arvoilla käyttämällä useita pintakuviokoordinaatteja, jotka muuttavat jokaista kehystä. AMD- ja Nvidia-näytönohjainten tehokkuus Futuremarkin tekstuuritestissä on melko korkea ja eri mallien lopulliset luvut ovat lähellä vastaavia teoreettisia parametreja. Nopeusero GTX Titan X:n ja GTX 980:n välillä osoittautui siis 38 % GM200:aan perustuvan ratkaisun hyväksi, mikä on lähellä teoriaa, koska uudessa tuotteessa on puolitoista kertaa enemmän TMU-yksiköitä. , mutta ne toimivat pienemmällä taajuudella. Luonnollisesti viive kaksois-GTX Titan Z:n jälkeen säilyy, sillä kahdella grafiikkasuorittimella on nopeampi teksturointinopeus. Mitä tulee uuden huippuluokan Nvidia-näytönohjaimen teksturointinopeuden vertailuun kilpailijan samanhintaisiin ratkaisuihin, niin uutuus on tässä huonompi kuin kaksisiruinen kilpailija, joka on ehdollinen naapuri hintarakossa, mutta on edellä Radeon R9 290X, vaikkakaan ei liian merkittävästi. Silti AMD-näytönohjaimet pärjäävät hieman paremmin teksturoinnin kanssa. Ominaisuustesti 2: Väritäyttö Toinen tehtävä on täyttöastetesti. Se käyttää hyvin yksinkertaista pikselivarjostajaa, joka ei rajoita suorituskykyä. Interpoloitu väriarvo kirjoitetaan näytön ulkopuoliseen puskuriin (renderöintikohteeseen) käyttämällä alfasekoitusta. Se käyttää 16-bittistä näytön ulkopuolista FP16-puskuria, joka on yleisimmin käytetty HDR-renderöintiä käyttävissä peleissä, joten tämä testi on melko ajankohtainen. Toisen 3DMark Vantage -alitestin luvut osoittavat ROP-yksiköiden suorituskyvyn ottamatta huomioon videomuistin kaistanleveyden määrää (ns. "tehokas täyttöaste"), ja testi mittaa tarkasti ROP:n suorituskyvyn. Tänään tarkastelemamme Geforce GTX Titan X -levy on huomattavasti edellä molempia Nvidia-kortteja, GTX 980:aa ja jopa GTX Titan Z:ta, ylittäen GM204-pohjaisen yksisirulevyn jopa 45 % - ROP-korttien ja niiden lukumäärän. Maxwell-arkkitehtuurin huipputason GPU:n tehokkuus on erinomainen! Ja jos verrataan uuden Geforce GTX Titan X -näytönohjaimen kohtauksen täyttönopeutta AMD-näytönohjainkorttiin, niin tässä testissä harkitsemamme Nvidia-levy näyttää parhaan kohtauksen täyttönopeuden jopa verrattuna tehokkaimpaan kaksisiruiseen Radeon R9:ään. 295X2, puhumattakaan huomattavasti jälkeen jääneestä Radeon R9 290X:stä. Suuri määrä ROP-lohkoja ja optimointeja kehyspuskuritiedon pakkaamisen tehostamiseksi teki tehtävänsä. Ominaisuustesti 3: Parallax-okkluusiokartoitus Yksi mielenkiintoisimmista ominaisuustesteistä, koska tätä tekniikkaa käytetään jo peleissä. Se piirtää yhden nelikulmion (tarkemmin kaksi kolmiota) käyttämällä erityistä Parallax Occlusion Mapping -tekniikkaa, joka jäljittelee monimutkaista geometriaa. Käytetään melko resurssiintensiivisiä säteenseurantatoimintoja ja korkearesoluutioista syvyyskarttaa. Tämä pinta varjostetaan myös raskaalla Strauss-algoritmilla. Tämä on testi videosirun erittäin monimutkaiselle ja raskaalle pikselivarjostimelle, joka sisältää lukuisia tekstuurihakuja säteenjäljityksen, dynaamisen haaroittamisen ja monimutkaisten Straussin valaistuslaskelmien aikana. Tämä 3DMark Vantage -paketin testi eroaa aikaisemmista siinä, että sen tulokset eivät riipu pelkästään matemaattisten laskelmien nopeudesta, haaran suorituksen tehokkuudesta tai tekstuurin haun nopeudesta, vaan useista parametreista samanaikaisesti. Suuren nopeuden saavuttamiseksi tässä tehtävässä on tärkeää GPU:n oikea tasapaino sekä monimutkaisten varjostimien suorittamisen tehokkuus. Tässä tapauksessa sekä matemaattinen että tekstuurin suorituskyky ovat tärkeitä, ja tässä 3DMark Vantagen "syntetiikassa" uusi Geforce GTX Titan X -kortti osoittautui yli kolmanneksen nopeammaksi kuin saman Maxwell-arkkitehtuurin GPU:hun perustuva malli. . Ja jopa kaksisiruinen Kepler GTX Titan Z:n muodossa ylitti uutuuden alle 10 prosentilla. Nvidian yksisiruinen huippukortti ylitti tässä testissä selvästi yksisirun Radeon R9 290X:n, mutta molemmat ovat huomattavasti parempia kuin kaksisiruinen Radeon R9 295X2. AMD:n GPU:t ovat tässä tehtävässä jonkin verran tehokkaampia kuin Nvidia-sirut, ja R9 295X2:ssa on niitä kaksi. Ominaisuustesti 4: GPU-kangas Neljäs testi on mielenkiintoinen, koska se laskee fyysiset vuorovaikutukset (kangasjäljitelmä) videosirun avulla. Vertex-simulaatiota käytetään käyttämällä vertexin ja geometrian varjostimien yhdistettyä toimintaa useilla kierroksilla. Käytä stream out -toimintoa pisteiden siirtämiseen simulaatiokierroksesta toiseen. Siten testataan vertex- ja geometriavarjostimien suorituksen suorituskykyä ja ulosvirtausnopeutta. Tässä testissä renderöintinopeus riippuu myös useista parametreista kerralla, ja tärkeimmät vaikuttajat tulisivat olla geometrian käsittelyn suorituskyky ja geometrian varjostimien tehokkuus. Eli Nvidia-sirujen vahvuuksien pitäisi näkyä, mutta valitettavasti - näimme erittäin oudon tuloksen (tarkistettu uudelleen), uusi Nvidia-näytönohjain ei osoittanut lievästi sanoen liian suurta nopeutta. Geforce GTX Titan X tässä osatestissä osoitti kaikista ratkaisuista huonoimman tuloksen, jäljessä jopa GTX 980:sta lähes 20 %! No, vertailu Radeon-levyihin tässä testissä on aivan yhtä ruma uudelle tuotteelle. Huolimatta teoreettisesti pienemmästä geometristen suoritusyksiköiden määrästä ja AMD-sirujen geometrisesta suoritusviiveestä kilpaileviin ratkaisuihin verrattuna, molemmat Radeon-levyt toimivat erittäin tehokkaasti tässä testissä ja ylittävät vertailussa kaikki kolme esitettyä Geforce-korttia. Jälleen näyttää siltä, että Nvidia-ajureissa ei ole optimoitua tiettyä tehtävää varten. Ominaisuustesti 5: GPU-hiukkaset Testi efektien fyysiseen simulointiin, joka perustuu videosirun avulla laskettuihin hiukkasjärjestelmiin. Vertex-simulaatiota käytetään myös, jokainen huippu edustaa yhtä hiukkasta. Stream out -toimintoa käytetään samaan tarkoitukseen kuin edellisessä testissä. Lasketaan useita satojatuhansia hiukkasia, kaikki animoidaan erikseen, lasketaan myös niiden törmäykset korkeuskarttaan. Kuten yhdessä RightMark3D 2.0 -testissämme, hiukkaset piirretään geometriavarjostimella, joka luo jokaisesta pisteestä neljä kärkeä hiukkasen muodostamiseksi. Mutta testi lataa Shader-lohkot ennen kaikkea vertex-laskelmilla, myös stream out testataan. 3DMark Vantagen toisessa "geometrisessa" testissä tilanne on muuttunut vakavasti, tällä kertaa kaikki Geforcet osoittavat jo enemmän tai vähemmän normaalia tulosta, vaikka kaksisiruinen Radeon pysyy edelleen kärjessä. Uusi GTX Titan X -malli on 24 % nopeampi kuin sen sisar GTX 980 ja suunnilleen saman verran jäljessä edellisen sukupolven GPU:n kaksoisgrafiikkasuorittimesta Titan Z:sta. Nvidian uutuuden vertailu kilpaileviin AMD:n näytönohjaimiin tällä kertaa on positiivisempi - se osoitti tuloksen kahden kilpailevan yrityksen levyn välillä ja osoittautui lähempänä Radeon R9 295X2:ta, jossa on kaksi GPU:ta. Uutuus on kaukana Radeon R9 290X:n edellä ja tämä osoittaa meille selvästi, kuinka erilaisia kaksi näennäisesti samanlaista testiä voivat olla: kangassimulaatio ja hiukkassysteemisimulaatio. Ominaisuustesti 6: Perlin Noise Vantage-paketin viimeinen ominaisuustesti on matemaattisesti intensiivinen videosirun testi, joka laskee pikselivarjostimessa useita Perlin-kohinaalgoritmin oktaaveja. Jokainen värikanava käyttää omaa kohinatoimintoaan lisätäkseen videosirun kuormitusta. Perlin-kohina on standardialgoritmi, jota käytetään usein proseduurin teksturointiin, se käyttää paljon matemaattisia laskelmia. Tässä tapauksessa ratkaisujen suorituskyky ei aivan vastaa teoriaa, vaikka se on lähellä sitä, mitä näimme vastaavissa testeissä. Futuremark-paketin matemaattisessa testissä, joka näyttää videosirujen huippusuorituskyvyn rajatehtävissä, näemme erilaisen tulosten jakautumisen verrattuna testipakettimme vastaaviin testeihin. Olemme tienneet jo pitkään, että GCN-arkkitehtuurilla varustetut AMD-videosirut selviävät edelleen tällaisista tehtävistä kilpailijoita paremmin, varsinkin tapauksissa, joissa suoritetaan intensiivistä "matematiikkaa". Mutta Nvidian uusi huippumalli perustuu suureen GM200-siruun, joten Geforce GTX Titan X suoriutui tässä testissä huomattavasti paremmin kuin Radeon R9 290X. Jos verrataan uutta tuotetta Geforce GTX 900 -perheen parhaaseen malliin, niin tässä testissä ero niiden välillä oli lähes 40% - tietysti tänään harkitsemamme näytönohjaimen hyväksi. Tämä on myös lähellä teoreettista eroa. Ei huono tulos Titan X:lle, vain kaksisiruinen Radeon R9 295X2 oli edellä ja kaukana edellä. Direct3D 11: Laske varjostimet Testaaksemme Nvidian äskettäin julkaistua huippuluokan ratkaisua tehtäviin, joissa käytetään DirectX 11 -ominaisuuksia, kuten tessellaatiota ja laskentavarjostimia, käytimme Microsoftin, Nvidian ja AMD:n SDK-esimerkkejä ja demoja. Ensin tarkastellaan vertailuarvoja, jotka käyttävät Compute-varjostimia. Niiden ulkonäkö on yksi tärkeimmistä innovaatioista DX API:n uusimmissa versioissa, niitä käytetään jo nykyaikaisissa peleissä erilaisten tehtävien suorittamiseen: jälkikäsittelyyn, simulaatioihin jne. Ensimmäinen testi näyttää esimerkin HDR-renderöimisestä sävykartoituksella. DirectX SDK:sta, jossa on jälkikäsittely, joka käyttää pikseli- ja laskentavarjostimia. Laskentanopeus laskenta- ja pikselivarjostimissa kaikilla AMD- ja Nvidia-korteilla on suunnilleen sama, eroja havaittiin vain aikaisempien arkkitehtuurien GPU:ihin perustuvissa näytönohjaimissa. Aikaisempien testiemme perusteella ongelman tulokset eivät useinkaan riipu niinkään matemaattisesta tehosta ja laskentatehosta, vaan muista tekijöistä, kuten muistin kaistanleveydestä. Tässä tapauksessa uusi huippuluokan näytönohjain on nopeampi kuin yksisiruinen Geforce GTX 980 ja Radeon R9 290X, mutta takana kaksisiruinen R9 295X2, mikä on ymmärrettävää, koska siinä on R9 290X -parin teho. . Jos vertaamme uutta tuotetta Geforce GTX 980:een, niin tänään tarkastellun kalifornialaisen yrityksen emolevy on 34-36% nopeampi - täsmälleen teorian mukaan. Toinen laskentavarjostimen testi on myös otettu Microsoft DirectX SDK:sta, ja se näyttää N-kappaleen (N-body) painovoimalaskentaongelman, simulaation dynaamisesta hiukkasjärjestelmästä, joka on alttiina fyysisille voimille, kuten painovoimalle. Tässä testissä painotetaan useimmiten monimutkaisten matemaattisten laskutoimitusten suorittamisen nopeutta, geometrian käsittelyä ja koodin suorittamisen tehokkuutta haaroituksella. Ja tässä DX11-testissä kahden eri yrityksen ratkaisujen välisten voimien kohdistus osoittautui täysin erilaiseksi - selvästi Geforce-näytönohjainkorttien hyväksi. Eri siruihin perustuvan Nvidia-ratkaisuparin tulokset ovat kuitenkin myös outoja - Geforce GTX Titan X ja GTX 980 ovat lähes yhtä suuret, niitä erottaa vain 5 % suorituskyvyn ero. Dual-chip renderöinti ei toimi tässä tehtävässä, joten kilpailijat (yksisiruiset ja kaksisiruiset Radeon-mallit) ovat suunnilleen yhtä nopeita. No, GTX Titan X on kolme kertaa heitä edellä. Näyttää siltä, että tämä tehtävä lasketaan paljon tehokkaammin Maxwell-arkkitehtuurin GPU:illa, jonka totesimme aiemmin. Direct3D 11: Tessellation Performance Laskennalliset varjostimet ovat erittäin tärkeitä, mutta toinen tärkeä uusi Direct3D 11:n ominaisuus on laitteiston tessellointi. Käsittelimme sitä hyvin yksityiskohtaisesti teoreettisessa artikkelissamme Nvidia GF100:sta. Tessellationia on käytetty DX11-peleissä pitkään, kuten STALKER: Call of Pripyat, DiRT 2, Aliens vs Predator, Metro Last Light, Civilization V, Crysis 3, Battlefield 3 ja muut. Jotkut niistä käyttävät tessellaatiota hahmomalleissa, toiset simuloivat realistista vedenpintaa tai maisemaa. Graafisten primitiivien osiointiin (tessellaatioon) on olemassa useita erilaisia järjestelmiä. Esimerkiksi phong-tessellaatio, PN-kolmiot, Catmull-Clark-alajako. Joten PN-kolmioiden laatoitusjärjestelmää käytetään STALKER: Call of Pripyatissa ja Metro 2033 - Phong tessellaatiossa. Nämä menetelmät ovat suhteellisen nopeita ja helppoja ottaa käyttöön pelin kehitysprosessissa ja olemassa olevissa moottoreissa, minkä vuoksi niistä on tullut suosittuja. Ensimmäinen tessellaatiotesti on ATI Radeon SDK:n Detail Tessellation -esimerkki. Se toteuttaa paitsi tesselloinnin, myös kaksi erilaista pikselikohtaista käsittelytekniikkaa: yksinkertaisen normaalien karttojen päällekkäisyyden ja parallaksien okkluusiokartoituksen. No, verrataan AMD:n ja Nvidian DX11-ratkaisuja eri olosuhteissa: Yksinkertaisessa bumpmapping-testissä levyjen nopeudella ei ole suurta merkitystä, koska tämä tehtävä on tullut liian helpoksi pitkään ja sen suorituskyky riippuu muistin kaistanleveydestä tai täyttönopeudesta. Tämän päivän arvostelun sankari on 23% edellä GM204-siruun perustuvaa edellistä huippumallia Geforce GTX 980 ja hieman huonompi kuin kilpailijansa Radeon R9 290X:n muodossa. Kaksisiruinen versio on jopa hieman nopeampi. Toisessa osatestissä monimutkaisemmilla pikselikohtaisilla laskelmilla uusi tuote on jo 34 % nopeampi kuin Geforce GTX 980, mikä on lähempänä niiden välistä teoreettista eroa. Mutta tällä kertaa Titan X on jo hieman nopeampi kuin yhden sirun ehdollinen kilpailija, joka perustuu yhteen Havaijiin. Koska Radeon R9 295X2:n kaksi sirua toimivat täydellisesti, tämä tehtävä suoritetaan vielä nopeammin. Vaikka matemaattisten laskelmien suorituskyky pikselivarjostimissa on parempi GCN-arkkitehtuurisirujen osalta, Maxwell-arkkitehtuuriratkaisujen julkaisu paransi Nvidia-ratkaisujen sijoituksia. Kevyessä tessellaatio-alitestissä äskettäin julkistettu Nvidia-levy on jälleen vain neljänneksen nopeampi kuin Geforce GTX 980 - ehkä nopeutta rajoittaa muistin kaistanleveys, koska teksturointi ei tässä testissä juuri vaikuta. Jos verrataan uutta tuotetta AMD-kortteihin tässä osatestissä, niin Nvidia-levy on jälleen huonompi kuin molemmat Radeonit, koska tässä tessellaatiotestissä kolmion halkaisu on erittäin maltillista eikä geometrinen suorituskyky rajoita yleistä renderöintinopeutta. Toinen tessellaatiotesti on toinen esimerkki 3D-kehittäjille ATI Radeon SDK - PN Trianglesista. Itse asiassa molemmat esimerkit sisältyvät myös DX SDK:han, joten olemme varmoja, että pelien kehittäjät luovat oman koodinsa niiden perusteella. Testasimme tätä esimerkkiä eri tessellaatiokertoimella nähdäksemme, kuinka paljon se vaikuttaa yleiseen suorituskykyyn. Tässä testissä käytetään monimutkaisempaa geometriaa, joten eri ratkaisujen geometristen tehojen vertailu tuo erilaisia johtopäätöksiä. Materiaalissa esitetyt nykyaikaiset ratkaisut kestävät melko hyvin kevyitä ja keskisuuria geometrisia kuormituksia osoittaen suurta nopeutta. Mutta vaikka Havaijin yksi ja kaksi GPU:ta Radeon R9 290X:ssä ja R9 295X2:ssa toimivat hyvin valoisissa olosuhteissa, Nvidian levyt ovat huippuluokkaa raskaassa käytössä. Joten vaikeimmissa tiloissa tänään esitelty Geforce GTX Titan X näyttää nopeuden jo huomattavasti paremmin kuin kaksisiruinen Radeon. Mitä tulee GM200- ja GM204-siruihin perustuvien Nvidia-levyjen vertailuun, tänään tarkasteltavana oleva Geforce GTX Titan X -malli lisää etuaan geometrisen kuormituksen kasvun myötä, koska valotilassa kaikki riippuu muistin kaistanleveydestä. Tämän seurauksena uusi tuote on Geforce GTX 980 -korttia edellä tilan monimutkaisuudesta riippuen jopa 31 %. Katsotaanpa toisen testin, Nvidia Realistic Water Terrain -demo-ohjelman, joka tunnetaan myös nimellä Island, tuloksia. Tämä demo käyttää tessellaatio- ja siirtymäkartoitusta realistisen näköisen valtameren pinnan ja maaston luomiseksi. Island-testi ei ole puhtaasti synteettinen testi puhtaasti geometrisen GPU-suorituskyvyn mittaamiseen, koska se sisältää sekä monimutkaisia pikseli- että laskentavarjostimia, ja tällainen kuormitus on lähempänä oikeita pelejä, joissa käytetään kaikkia GPU-yksiköitä, ei vain geometrisia, kuten edellisessä. geometrian testit. Vaikka geometrian prosessointiyksiköiden kuormitus pysyy edelleen pääasiallisena, esimerkiksi sama muistin kaistanleveys voi myös vaikuttaa. Testaamme kaikki näytönohjaimet neljällä eri tessellaatiokertoimella - tässä tapauksessa asetusta kutsutaan nimellä Dynamic Tessellation LOD. Ensimmäisellä kolmion jakokertoimella geometristen lohkojen suorituskyky ei rajoita nopeutta, ja Radeon-näytönohjaimet näyttävät melko korkean tuloksen, etenkin kaksisiruinen R9 295X2, joka jopa ylittää ilmoitetun Geforce GTX Titan X -levyn tuloksen. , mutta jo seuraavilla geometrisilla kuormitustasoilla Radeon-korttien suorituskyky heikkenee ja ratkaisut Nvidia ovat ottamassa johtoasemaan. Uuden GM200-videosiruun perustuvan Nvidia-levyn etu kilpailijoihinsa nähden tällaisissa testeissä on jo varsin kohtuullinen ja jopa moninkertainen. Jos vertaamme Geforce GTX Titan X:ää GTX 980:een, niin ero niiden suorituskyvyn välillä on 37-42%, mikä on täysin selitetty teorialla ja vastaa sitä tarkasti. Maxwellin grafiikkasuorittimet ovat huomattavasti tehokkaampia sekakuormituksessa ja siirtyvät nopeasti grafiikasta tietojenkäsittelyyn ja takaisin, ja Titan X on paljon nopeampi kuin jopa kaksisiruinen Radeon R9 295X2 tässä testissä. Analysoituamme uuden Nvidia Geforce GTX Titan X -näytönohjaimen synteettisten testien tulokset, jotka perustuvat uuteen huippuluokan GM200-grafiikkasuorittimeen sekä ottamalla huomioon muiden näytönohjainmallien tulokset molemmilta erillisten videosirujen valmistajilta, voimme päätellä, että tänään harkitsemamme näytönohjaimen pitäisi olla markkinoiden nopein ja kilpailla vahvimman AMD:n kaksisiruisen näytönohjaimen kanssa. Yleensä tämä on hyvä Geforce GTX Titan Black -seuraaja - tehokas yksisiru. Nvidian uusi näytönohjain näyttää melko vahvoja tuloksia synteettisessä - monissa testeissä, mutta ei kaikissa. Radeonilla ja Geforcella on perinteisesti erilaisia vahvuuksia. Useissa testeissä Radeon R9 295X2 -mallin kaksi GPU:ta olivat nopeampia, muun muassa suuremman kokonaismuistin kaistanleveyden ja teksturointinopeuden ansiosta, jotka suorittivat laskennalliset tehtävät erittäin tehokkaasti. Mutta muissa tapauksissa Maxwell-arkkitehtuurin huippugrafiikkaprosessori voittaa takaisin, erityisesti geometrisissä testeissä ja tessellaatioesimerkeissä. Todellisissa pelisovelluksissa kaikki on kuitenkin hieman erilaista "synteettisiin" verrattuna ja Geforce GTX Titan X:n nopeus pitäisi olla huomattavasti korkeampi kuin yksisiruinen Geforce GTX 980 ja vielä enemmän Radeon R9 290X . Ja uutuutta on vaikea verrata kaksisiruisiin Radeon R9 295X2 -järjestelmiin - kahteen tai useampaan GPU:hun perustuvilla järjestelmillä on omat epämiellyttävät ominaisuutensa, vaikka ne lisäävät keskimääräistä kuvanopeutta asianmukaisella optimoinnilla. Mutta arkkitehtoniset ominaisuudet ja toiminnallisuus tukevat selvästi Nvidian premium-ratkaisua. Geforce GTX Titan X kuluttaa paljon vähemmän energiaa kuin sama Radeon R9 295X2, ja Nvidian uusi malli on erittäin vahva energiatehokkuuden suhteen - tämä on Maxwell-arkkitehtuurin erottuva piirre. Älä unohda Nvidian uuden tuotteen parempaa toiminnallisuutta: DirectX 12:ssa on tuki ominaisuustasolle 12.1, VXGI-laitteistokiihdytykseen, uusi MFAA-anti-aliasing-menetelmä ja muita teknologioita. Puhuimme jo markkinoiden näkökulmasta ensimmäisessä osassa - eliittisegmentissä ei niinkään riipu hinnasta. Pääasia on, että ratkaisu on pelisovelluksissa mahdollisimman toimiva ja tuottava. Yksinkertaisesti sanottuna se oli parasta kaikessa. Pelkästään uutuuden nopeuden arvioimiseksi peleissä, materiaalimme seuraavassa osassa määritämme Geforce GTX Titan X:n suorituskyvyn peliprojektiemme sarjassa ja vertaamme sitä kilpailijoiden suorituskykyyn, mukaan lukien perustelujen arviointi. uutuuden vähittäishinnasta harrastajien näkökulmasta ja selvitä myös kuinka paljon nopeampi se on Geforce GTX 980 jo peleissä.	Yrityksen toimittama Asus ProArt PA249Q näyttö työtietokoneeseen Asustek	Yrityksen toimittama Cougar 700K näppäimistö työtietokoneeseen puuma

Mukana paikallisen muistin kanssa

Kortissa on 12 288 Mt GDDR5 SDRAM -muistia 24 4 Gt:n piirissä (12 PCB:n kummallakin puolella).

DirectX 11:n synteettisinä testeinä käytimme esimerkkejä Microsoftin ja AMD SDK:ista sekä Nvidia-demo-ohjelmasta. Ensimmäinen on HDRToneMappingCS11.exe ja NBodyGravityCS11.exe DirectX SDK:sta (helmikuu 2010). Otimme myös hakemuksia molemmilta videosirujen valmistajilta: Nvidialta ja AMD:ltä. DetailTessellation11 ja PNTriangles11 on otettu ATI Radeon SDK:sta (ne ovat myös DirectX SDK:ssa). Lisäksi käytettiin Nvidian Realistic Water Terrain -demo-ohjelmaa, joka tunnetaan myös nimellä Island11.

Synteettiset testit suoritettiin seuraaville näytönohjaimille:

Geforce GTX Titan X GTX Titan X)
Geforce GTX Titan Z vakioparametreilla (lyhennetty GTX Titan Z)
Geforce GTX 980 vakioparametreilla (lyhennetty GTX 980)
Radeon R9 295X2 vakioparametreilla (lyhennetty R9 295x2)
Radeon R9 290X vakioparametreilla (lyhennetty R9 290X)

Geforce GTX Titan X -näytönohjaimen uuden mallin suorituskyvyn analysoimiseksi nämä ratkaisut valittiin seuraavista syistä. Geforce GTX 980 perustuu grafiikkasuorittimeen, jolla on sama Maxwell-arkkitehtuuri, mutta alemman tason - GM204, ja meidän on erittäin mielenkiintoista arvioida, mitä GM200: n sirun monimutkaisuus antoi. Geforce GTX Titan Z -kaksisiruinen näytönohjain otettiin vain viitteeksi - tuottavimmaksi Nvidia-näytönohjaimeksi, joka perustuu edellisen Kepler-arkkitehtuurin GK110-siruihin.

Kilpailijayritykseltä AMD valitsimme vertailuun myös kaksi näytönohjainta. Ne ovat periaatteessa hyvin erilaisia, vaikka ne perustuvat samoihin Hawaii-grafiikkasuorittimiin - niillä on vain eri määrä GPU:ita korteissa ja ne eroavat sijainniltaan ja hinnaltaan. Geforce GTX Titan X:llä ei ole hintakilpailijoita, joten otimme tehokkaimman kaksisiruisen näytönohjaimen Radeon R9 295X2, vaikka tällainen vertailu ei olisi teknisesti kovin mielenkiintoinen. Jälkimmäiseen otettiin kilpailijan nopein yksisiruinen näytönohjain Radeon R9 290X, vaikka se julkaistiin liian kauan sitten ja perustuu selkeästi vähemmän monimutkaiseen GPU:han. Mutta AMD-ratkaisuista ei yksinkertaisesti ole muuta vaihtoehtoa.

Direct3D 10: PS 4.0 pikselin varjostustestit (teksturointi, silmukka)

Hylkäsimme vanhentuneista DirectX 9 -vertailuarvoista, sillä supertehokkaat ratkaisut, kuten Geforce GTX Titan X, eivät osoita niissä kovin hyviä tuloksia, koska niitä rajoittavat aina muistin kaistanleveys, täyttönopeus tai teksturointi. Puhumattakaan siitä, että kaksisiruiset näytönohjaimet eivät aina toimi oikein tällaisissa sovelluksissa, ja meillä on niitä kaksi.

RightMark3D:n toinen versio sisältää kaksi jo tuttua PS 3.0 -testiä Direct3D 9:n alla, jotka kirjoitettiin uudelleen DirectX 10:tä varten, sekä kaksi uutta testiä. Ensimmäinen pari lisäsi mahdollisuuden ottaa käyttöön self-shadowing ja Shader supersampling, mikä lisää lisäksi videosirujen kuormitusta.

Nämä testit mittaavat silmukkakuvapisteiden varjostimien suorituskykyä suurella määrällä tekstuurinäytteitä (jopa useita satoja näytteitä pikseliä kohden raskaimmassa tilassa) ja suhteellisen pienellä ALU-kuormalla. Toisin sanoen ne mittaavat tekstuurin haun nopeutta ja haaroittamisen tehokkuutta pikselivarjostimessa.

Ensimmäinen pikselivarjostustesti on Fur. Alimmilla asetuksilla se käyttää 15-30 pintakuvionäytettä korkeuskartalta ja kahta näytettä päätekstuurista. Effect detail - "High" -tila lisää näytteiden lukumäärän 40-80:een, "shader" supersamplingin sisällyttäminen - jopa 60-120 näytteeseen, ja "High"-tilalle yhdessä SSAA:n kanssa on ominaista suurin "vakavuus". - 160 - 320 näytettä korkeuskartalta.

Tarkastetaan ensin tilat ilman supersamplingia, ne ovat suhteellisen yksinkertaisia, ja tulosten suhteen "Matala" ja "Korkea" -tiloissa pitäisi olla suunnilleen sama.

Suorituskyky tässä testissä riippuu TMU:iden lukumäärästä ja tehokkuudesta, ja myös monimutkaisten ohjelmien suorittamisen tehokkuus vaikuttaa. Ja versiossa ilman supersamplingia tehokkaalla täyttönopeudella ja muistin kaistanleveydellä on myös lisävaikutus suorituskykyyn. Tulokset "Korkea"-tasoa eriteltäessä ovat jopa puolitoista kertaa alhaisemmat kuin "Matalalla".

Proseduurin turkisrenderöinnissä, jossa on suuri määrä tekstuureja, GCN-arkkitehtuuriin perustuvien videosirujen julkaisun myötä AMD on jo kauan sitten ottanut johtoaseman. Radeon-levyt ovat edelleen parhaita näissä vertailuissa tähän päivään asti, mikä osoittaa, että ne ovat tehokkaampia näiden ohjelmien suorittamisessa. Tämän johtopäätöksen vahvistaa tämän päivän vertailu - arvioimamme Nvidia-näytönohjain hävisi jopa vanhentuneelle yksisiruiselle Radeon R9 290X:lle, puhumattakaan AMD:n lähimmästä hintakilpailijasta.

Ensimmäisessä Direct3D 10 -testissä Geforce GTX Titan X -mallin uusi näytönohjain osoittautui hieman nopeammaksi kuin sen nuorempi sisar perustuen saman arkkitehtuurin siruun GTX 980:n muodossa, mutta jälkimmäinen ei ole kaukana. jäljessä - 9-12%. Tämä tulos selittyy GTX 980:n huomattavasti pienemmällä teksturointinopeudella, ja se on jäljessä muissa parametreissa, vaikka ALU:iden suorituskyvyllä ei selvästikään ole merkitystä. Kaksisiruinen Titan Z on nopeampi, mutta ei yhtä nopea kuin Radeon R9 295X2.

Katsotaanpa saman testin tulosta, mutta "shader" supersamplingin ollessa päällä, mikä nelinkertaistaa työn: tällaisessa tilanteessa jonkin pitäisi muuttua, ja muistin kaistanleveydellä täyttönopeudella on vähemmän vaikutusta:

Geforce GTX Titan X -mallin uusi näytönohjain on vaikeissa olosuhteissa jo selvemmin edellä saman sukupolven nuorempaa mallia - GTX 980:a, ja se on nopeampi kohtuulliset 33-39%, mikä on paljon lähempänä teoreettista eroa. heidän välillään. Ja kilpailijoiden Radeon R9 295X2 ja R9 290X muodossa oleva ruuhka on vähentynyt - Nvidian uusi tuote on melkein kuronut kiinni yksisiruisen Radeonin. Kaksisiruinen on kuitenkin kaukana edellä, koska AMD-sirut pitävät pikseli-pikseliltä laskelmia ja ovat erittäin vahvoja sellaisissa laskelmissa.

Seuraava DX10-testi mittaa monimutkaisten silmukoiden pikselivarjostimien suorittamisen suorituskykyä suurella määrällä tekstuurihakuja, ja sitä kutsutaan nimellä Steep Parallax Mapping. Matalilla asetuksilla se käyttää 10-50 pintakuviointinäytettä korkeuskartalta ja kolmea näytettä päätekstuureista. Kun otat raskaan tilan käyttöön itsevarjostuksen kanssa, näytteiden määrä kaksinkertaistuu ja supersampling nelinkertaistaa tämän määrän. Monimutkaisin testitila, jossa on supersampling ja itsevarjostus, valitsee 80 - 400 pintakuvioarvoa, eli kahdeksan kertaa enemmän kuin yksinkertainen tila. Tarkistamme ensin yksinkertaiset vaihtoehdot ilman supersamplingia:

Toinen Direct3D 10 pikselin varjostimen testi on käytännön kannalta mielenkiintoisempi, koska parallaksikartoituslajikkeita käytetään laajasti peleissä ja raskaita variantteja, kuten jyrkkää parallaksikartoitusta, on käytetty pitkään monissa projekteissa, esimerkiksi peleissä. Crysis, Lost Planet ja monet muut sarjat. Lisäksi testissämme voit supersamplingin lisäksi ottaa käyttöön itsevarjostuksen, mikä lisää videosirun kuormitusta noin kaksinkertaiseksi - tätä tilaa kutsutaan nimellä "High".

Kaavio on yleisesti ottaen samanlainen kuin edellinen, myös ilman supersamplingin sisällyttämistä, ja tällä kertaa uusi Geforce GTX Titan X osoittautui hieman lähemmäksi GTX Titan Z:ta, häviämättä niinkään kaksisiruiselle levylle. Kepler-perheen GPU-parilla. Eri olosuhteissa uusi tuote on 14-19% edellä Nvidian nykyisen sukupolven aiempaa huippumallia, ja vaikka ottaisimme vertailun AMD-näytönohjainkortteihin, tässä on jotain muuttunut - tässä tapauksessa uusi GTX Titan X on hieman huonompi kuin Radeon R9 290X. Kaksisiruinen R9 295X2 on kuitenkin kaukana kaikkia edellä. Katsotaanpa, mikä muuttaa supersamplingin sisällyttämisen:

Kun supersampling ja self-shadowing ovat käytössä, tehtävä vaikeutuu, kahden vaihtoehdon yhdistäminen kerralla lisää korttien kuormitusta lähes kahdeksankertaiseksi, mikä aiheuttaa vakavan suorituskyvyn laskun. Testattujen näytönohjainkorttien nopeusindikaattoreiden välinen ero on hieman muuttunut, vaikka supersamplingin sisällyttämisellä on vähemmän vaikutusta kuin edellisessä tapauksessa.

AMD Radeon -grafiikkaratkaisut toimivat tässä D3D10 pikselin varjostustestissä tehokkaammin kuin kilpailevat Geforce-levyt, mutta uusi GM200-siru muuttaa tilanteen parempaan suuntaan – Maxwell-arkkitehtuuripiiriin perustuva Geforce GTX Titan X -kortti on jo edellä Radeon R9 290X:ää kaikissa olosuhteissa (perustuu kuitenkin huomattavasti vähemmän monimutkaisempaan GPU:hun). Hawaii-pariin perustuva kaksisiruinen ratkaisu pysyy johtajana, mutta muihin Nvidian ratkaisuihin verrattuna uusi tuote ei ole huono. Se osoitti nopeutta lähes kahden sirun Geforce GTX Titan Z:n tasolla ja ylitti Geforce GTX 980:n 28-33%.

Direct3D 10: PS 4.0 Pixel Shader -vertailu (tietokone)

Seuraavat pari pikselivarjostustestiä sisältävät vähimmäismäärän pintakuviohakuja vähentääkseen TMU:n suorituskykyä. Ne käyttävät suurta määrää aritmeettisia operaatioita ja mittaavat tarkasti videosirujen matemaattista suorituskykyä, aritmeettisten käskyjen suoritusnopeutta pikselivarjostimessa.

Ensimmäinen matematiikan koe on mineraali. Tämä on monimutkainen menettelyllinen teksturointitesti, joka käyttää vain kahta pintakuviotietonäytettä ja 65 sin ja cos -käskyä.

Rajoittavien matemaattisten testien tulokset vastaavat useimmiten taajuuksien ja laskentayksiköiden lukumäärän eroa, mutta vain likimääräisesti, koska tuloksiin vaikuttavat niiden käytön erilainen tehokkuus tietyissä tehtävissä ja ajurien optimointi sekä viimeisin taajuus ja virranhallintajärjestelmät ja jopa muistin kaistanleveyden painottaminen. Mineral-testin tapauksessa uusi Geforce GTX Titan X -malli on vain 10 % nopeampi kuin saman sukupolven GM204-siruun perustuva GTX 980 -kortti, ja kaksisiruinen GTX Titan Z ei ollut niin nopea tässä testissä. - jokin estää selvästi Nvidia-kortteja avautumasta.

Geforce GTX Titan X:n vertaaminen kilpaileviin AMD:n emolevyihin ei olisi niin surullista, jos R9 290X:n ja Titan X:n GPU:t olisivat monimutkaisia. Mutta GM200 on paljon suurempi kuin Havaiji, ja sen pieni voitto on luonnollista. Nvidian arkkitehtuuripäivitys Kepleristä Maxwelliin on tuonut uudet sirut lähemmäksi kilpailevia AMD-ratkaisuja tällaisissa testeissä. Mutta jopa halvempi kaksisiruinen ratkaisu Radeon R9 295X2 on huomattavasti nopeampi.

Tarkastellaan toista varjostuslaskennan testiä, jota kutsutaan Fireksi. Se on ALU:lle raskaampi, ja siinä on vain yksi tekstuurinhaku, ja sin- ja cos-käskyjen määrä on kaksinkertaistettu, jopa 130. Katsotaan mikä on muuttunut kuormituksen kasvaessa:

RigthMarkin toisessa matemaattisessa testissä näemme jo erilaisia tuloksia näyttökorteille suhteessa toisiinsa. Joten uusi Geforce GTX Titan X on jo vahvempi (20 %) GTX 980:a edellä saman grafiikkaarkkitehtuurin sirulla, ja kaksisiruinen Geforce on hyvin lähellä uutta tuotetta - Maxwell selviytyy laskentatehtävistä paljon parempi kuin Kepler.

Radeon R9 290X on jäänyt taakse, mutta kuten jo kirjoitimme, Hawaii GPU on huomattavasti yksinkertaisempi kuin GM200, ja tämä ero on looginen. Mutta vaikka kaksisiruinen Radeon R9 295X2 on edelleen johtava matemaattisissa testeissä, yleensä uusi Nvidia-videosiru suoriutui hyvin tällaisissa tehtävissä, vaikka se ei saavuttanut teoreettista eroa GM204: n kanssa.

Direct3D 10: Geometry Shader -testit

RightMark3D 2.0:ssa on kaksi geometrian varjostimen nopeustestiä, ensimmäinen vaihtoehto on nimeltään "Galaxy", tekniikka on samanlainen kuin Direct3D:n aiempien versioiden "pistesprite". Se animoi hiukkasjärjestelmän GPU:ssa, geometriavarjostin jokaisesta pisteestä luo neljä kärkeä, jotka muodostavat hiukkasen. Samanlaisia algoritmeja tulisi käyttää laajalti tulevissa DirectX 10 -peleissä.

Geometry shader -testien tasapainon muuttaminen ei vaikuta lopulliseen renderöintitulokseen, lopullinen kuva on aina täsmälleen sama, vain kohtausten käsittelytavat muuttuvat. "GS-kuorma"-parametri määrittää, missä varjostimessa laskelmat suoritetaan - kärjessä tai geometriassa. Laskelmien määrä on aina sama.

Tarkastellaan "Galaxy" -testin ensimmäistä versiota, jossa on laskelmia vertex-varjostimessa, kolmelle geometrisen monimutkaisuuden tasolle:

Kohtausten eri geometrisesti monimutkaisten nopeuksien suhde on suunnilleen sama kaikissa ratkaisuissa, suorituskyky vastaa pisteiden määrää, jokaisella askeleella FPS-pudotus on lähes kaksinkertainen. Tämä tehtävä on erittäin yksinkertainen tehokkaille nykyaikaisille näytönohjaimille, ja sen suorituskykyä rajoittaa geometrian käsittelynopeus ja joskus muistin kaistanleveys ja/tai täyttöaste.

Ero Nvidia- ja AMD-siruihin perustuvien näytönohjainkorttien tulosten välillä on yleensä kalifornialaisen yrityksen ratkaisujen eduksi, ja se johtuu näiden yritysten sirujen geometristen putkien eroista. Tässäkin tapauksessa huippuluokan Nvidia-videosiruissa on monia geometrisia prosessointiyksiköitä, joten voitto on ilmeinen. Geometriatesteissä Geforce-levyt ovat aina kilpailukykyisempiä kuin Radeon.

Uusi Geforce GTX Titan X -malli on hieman jäljessä edellisen sukupolven GPU:n kaksoissirun GTX Titan Z -kortista, mutta se ylittää GTX 980:n 12-25%. Radeon-näytönohjaimet näyttävät selvästi erilaisia tuloksia, sillä R9 295X2 perustuu GPU-pariin ja vain se voi kilpailla tämän testin uutuuden kanssa, ja Radeon R9 290X oli ulkopuolinen. Katsotaan kuinka tilanne muuttuu siirrettäessä osa laskelmista geometriavarjostimeen:

Kun kuormitus muuttui tässä testissä, luvut muuttuivat hieman AMD-levyjen ja Nvidia-ratkaisujen osalta. Eikä se oikeastaan muuta mitään. Näytönohjaimet tässä geometriavarjostimien testissä reagoivat huonosti muutoksiin GS-kuormaparametrissa, joka on vastuussa osan laskelmien siirtämisestä geometriavarjostimeen, joten johtopäätökset pysyvät samoina.

Valitettavasti "Hyperlight" on geometrian varjostimien toinen testi, joka osoittaa useiden tekniikoiden käytön kerralla: instanssi, stream-tulostus, puskurin kuorma, joka käyttää dynaamista geometrian luomista piirtämällä kahteen puskuriin, sekä uuden Direct3D 10 -ominaisuuden. - stream-lähtö, kaikki nykyaikaiset AMD-näytönohjaimet eivät vain toimi. Jossain vaiheessa toinen Catalyst-ohjainpäivitys lopetti tämän testin suorittamisen Catalyst-korteilla, eikä tätä ole korjattu useaan vuoteen.

Direct3D 10: tekstuurien hakunopeus vertex-varjostimista

"Vertex Texture Fetch" -testit mittaavat useiden pintakuvioiden haun nopeutta vertex-varjostimesta. Testit ovat pohjimmiltaan samanlaisia, joten "Earth"- ja "Waves"-testien korttien tulosten suhteen tulisi olla suunnilleen sama. Molemmissa testeissä käytetään pintakuvionäytteenottotietoihin perustuvaa siirtymäkartoitusta, ainoa merkittävä ero on, että "Waves"-testi käyttää ehdollisia hyppyjä, kun taas "Earth"-testi ei.

Harkitse ensimmäistä testiä "Earth", ensin "Effect Detail Low" -tilassa:

Aiemmat tutkimuksemme ovat osoittaneet, että sekä täyttönopeus että muistin kaistanleveys voivat vaikuttaa tämän testin tuloksiin, mikä näkyy selvästi Nvidia-levyjen tuloksissa, etenkin yksinkertaisissa tiloissa. Nvidian uusi näytönohjain tässä testissä näyttää selvästi pienemmän nopeuden kuin sen pitäisi olla - kaikki Geforce-levyt osoittautuivat suunnilleen samalla tasolla, mikä ei selvästikään vastaa teoriaa. Kaikissa tiloissa ne törmäävät selvästi muistin kaistanleveyteen. Radeon R9 295X2 ei kuitenkaan ole läheskään kaksi kertaa nopeampi kuin R9 290X.

Muuten, tällä kertaa AMD:n yksisirulevy osoittautui vahvemmiksi kuin kaikki Nvidian levyt kevyessä tilassa ja suunnilleen niiden tasolla hard modessa. No, kaksisiruisesta Radeon R9 295X2:sta tuli jälleen vertailumme johtaja. Tarkastellaan suoritusta samassa testissä lisääntyneellä tekstuurinhakujen määrällä:

Kaavion tilanne on hieman muuttunut, AMD:n yksisiruinen ratkaisu raskaissa tiloissa on menettänyt huomattavasti enemmän Geforce-kortteja. Uusi malli Geforce GTX Titan X osoitti jopa 14 % nopeampia nopeuksia kuin Geforce GTX 980 ja ylitti yksisirun Radeonin kaikissa tiloissa paitsi kevyimmässä - koska sama keskittyminen johonkin. Jos vertaamme uutta tuotetta AMD:n kaksoissiruratkaisuun, niin Titan X pystyi taistelemaan raskaassa tilassa osoittaen läheistä suorituskykyä, mutta jäljessä kevyissä tiloissa.

Tarkastellaan toisen testin tuloksia vertex-varjostimien pintakuvioiden hauista. Waves-testissä on vähemmän näytteitä, mutta se käyttää ehdollisia hyppyjä. Bilineaaristen pintakuvionäytteiden määrä on tässä tapauksessa korkeintaan 14 ("Effect detail Low") tai enintään 24 ("Effect detail High") kärkeä kohti. Geometrian monimutkaisuus muuttuu samalla tavalla kuin edellisessä testissä.

Toisen "Waves"-vertex-teksturointitestin tulokset eivät ole mitään sen kaltaisia, mitä näimme edellisissä kaavioissa. Kaikkien Geforcen nopeussuorituskyky tässä testissä on heikentynyt vakavasti, ja uusi Nvidia Geforce GTX Titan X -malli näyttää vain hieman nopeampaa nopeutta kuin GTX 980, mikä on jäljessä kaksisiruisesta Titan Z:sta. Kilpailijoihin verrattuna molemmat Radeon-levyt pystyivät näyttääksesi parhaan suorituskyvyn tässä testissä kaikissa tiloissa. Harkitse saman ongelman toista versiota:

Toisessa tekstuurinäytteenottotestissä tehtävän monimutkaisuuden myötä kaikkien ratkaisujen nopeus pieneni, mutta Nvidia-näytönohjaimet kärsivät enemmän, mukaan lukien harkittava malli. Melkein mikään ei muutu päätelmissä, uusi Geforce GTX Titan X -malli on jopa 10-30% nopeampi kuin GTX 980, jääden jälkeen sekä kaksisiruisesta Titan Z:sta että molemmista Radeon-korteista. Radeon R9 295X2 oli näissä testeissä kaukana edellä, ja teorian näkökulmasta tämä on yksinkertaisesti käsittämätöntä lukuun ottamatta Nvidian riittämätöntä optimointia.

3DMark Vantage: Ominaisuustestit

3DMark Vantage -paketin synteettiset testit osoittavat meille, mitä olemme aiemmin menettäneet. Tämän testipaketin ominaisuustesteissä on DirectX 10 -tuki, ne ovat edelleen relevantteja ja mielenkiintoisia, koska ne eroavat meidän ominaisuuksistamme. Analysoitaessa tämän paketin viimeisimmän Geforce GTX Titan X -näytönohjaimen tuloksia, teemme uusia ja hyödyllisiä johtopäätöksiä, jotka ovat välttyneet RightMark-perhepakettien testeistä.

Ominaisuustesti 1: Tekstuuritäyttö

Ensimmäinen testi mittaa pintakuviohakuyksiköiden suorituskykyä. Käytetään suorakulmion täyttämiseen pienestä tekstuurista luetuilla arvoilla käyttämällä useita pintakuviokoordinaatteja, jotka muuttavat jokaista kehystä.

AMD- ja Nvidia-näytönohjainten tehokkuus Futuremarkin tekstuuritestissä on melko korkea ja eri mallien lopulliset luvut ovat lähellä vastaavia teoreettisia parametreja. Nopeusero GTX Titan X:n ja GTX 980:n välillä osoittautui siis 38 % GM200:aan perustuvan ratkaisun hyväksi, mikä on lähellä teoriaa, koska uudessa tuotteessa on puolitoista kertaa enemmän TMU-yksiköitä. , mutta ne toimivat pienemmällä taajuudella. Luonnollisesti viive kaksois-GTX Titan Z:n jälkeen säilyy, sillä kahdella grafiikkasuorittimella on nopeampi teksturointinopeus.

Mitä tulee uuden huippuluokan Nvidia-näytönohjaimen teksturointinopeuden vertailuun kilpailijan samanhintaisiin ratkaisuihin, niin uutuus on tässä huonompi kuin kaksisiruinen kilpailija, joka on ehdollinen naapuri hintarakossa, mutta on edellä Radeon R9 290X, vaikkakaan ei liian merkittävästi. Silti AMD-näytönohjaimet pärjäävät hieman paremmin teksturoinnin kanssa.

Ominaisuustesti 2: Väritäyttö

Toinen tehtävä on täyttöastetesti. Se käyttää hyvin yksinkertaista pikselivarjostajaa, joka ei rajoita suorituskykyä. Interpoloitu väriarvo kirjoitetaan näytön ulkopuoliseen puskuriin (renderöintikohteeseen) käyttämällä alfasekoitusta. Se käyttää 16-bittistä näytön ulkopuolista FP16-puskuria, joka on yleisimmin käytetty HDR-renderöintiä käyttävissä peleissä, joten tämä testi on melko ajankohtainen.

Toisen 3DMark Vantage -alitestin luvut osoittavat ROP-yksiköiden suorituskyvyn ottamatta huomioon videomuistin kaistanleveyden määrää (ns. "tehokas täyttöaste"), ja testi mittaa tarkasti ROP:n suorituskyvyn. Tänään tarkastelemamme Geforce GTX Titan X -levy on huomattavasti edellä molempia Nvidia-kortteja, GTX 980:aa ja jopa GTX Titan Z:ta, ylittäen GM204-pohjaisen yksisirulevyn jopa 45 % - ROP-korttien ja niiden lukumäärän. Maxwell-arkkitehtuurin huipputason GPU:n tehokkuus on erinomainen!

Ja jos verrataan uuden Geforce GTX Titan X -näytönohjaimen kohtauksen täyttönopeutta AMD-näytönohjainkorttiin, niin tässä testissä harkitsemamme Nvidia-levy näyttää parhaan kohtauksen täyttönopeuden jopa verrattuna tehokkaimpaan kaksisiruiseen Radeon R9:ään. 295X2, puhumattakaan huomattavasti jälkeen jääneestä Radeon R9 290X:stä. Suuri määrä ROP-lohkoja ja optimointeja kehyspuskuritiedon pakkaamisen tehostamiseksi teki tehtävänsä.

Ominaisuustesti 3: Parallax-okkluusiokartoitus

Yksi mielenkiintoisimmista ominaisuustesteistä, koska tätä tekniikkaa käytetään jo peleissä. Se piirtää yhden nelikulmion (tarkemmin kaksi kolmiota) käyttämällä erityistä Parallax Occlusion Mapping -tekniikkaa, joka jäljittelee monimutkaista geometriaa. Käytetään melko resurssiintensiivisiä säteenseurantatoimintoja ja korkearesoluutioista syvyyskarttaa. Tämä pinta varjostetaan myös raskaalla Strauss-algoritmilla. Tämä on testi videosirun erittäin monimutkaiselle ja raskaalle pikselivarjostimelle, joka sisältää lukuisia tekstuurihakuja säteenjäljityksen, dynaamisen haaroittamisen ja monimutkaisten Straussin valaistuslaskelmien aikana.

Tämä 3DMark Vantage -paketin testi eroaa aikaisemmista siinä, että sen tulokset eivät riipu pelkästään matemaattisten laskelmien nopeudesta, haaran suorituksen tehokkuudesta tai tekstuurin haun nopeudesta, vaan useista parametreista samanaikaisesti. Suuren nopeuden saavuttamiseksi tässä tehtävässä on tärkeää GPU:n oikea tasapaino sekä monimutkaisten varjostimien suorittamisen tehokkuus.

Tässä tapauksessa sekä matemaattinen että tekstuurin suorituskyky ovat tärkeitä, ja tässä 3DMark Vantagen "syntetiikassa" uusi Geforce GTX Titan X -kortti osoittautui yli kolmanneksen nopeammaksi kuin saman Maxwell-arkkitehtuurin GPU:hun perustuva malli. . Ja jopa kaksisiruinen Kepler GTX Titan Z:n muodossa ylitti uutuuden alle 10 prosentilla.

Nvidian yksisiruinen huippukortti ylitti tässä testissä selvästi yksisirun Radeon R9 290X:n, mutta molemmat ovat huomattavasti parempia kuin kaksisiruinen Radeon R9 295X2. AMD:n GPU:t ovat tässä tehtävässä jonkin verran tehokkaampia kuin Nvidia-sirut, ja R9 295X2:ssa on niitä kaksi.

Ominaisuustesti 4: GPU-kangas

Neljäs testi on mielenkiintoinen, koska se laskee fyysiset vuorovaikutukset (kangasjäljitelmä) videosirun avulla. Vertex-simulaatiota käytetään käyttämällä vertexin ja geometrian varjostimien yhdistettyä toimintaa useilla kierroksilla. Käytä stream out -toimintoa pisteiden siirtämiseen simulaatiokierroksesta toiseen. Siten testataan vertex- ja geometriavarjostimien suorituksen suorituskykyä ja ulosvirtausnopeutta.

Tässä testissä renderöintinopeus riippuu myös useista parametreista kerralla, ja tärkeimmät vaikuttajat tulisivat olla geometrian käsittelyn suorituskyky ja geometrian varjostimien tehokkuus. Eli Nvidia-sirujen vahvuuksien pitäisi näkyä, mutta valitettavasti - näimme erittäin oudon tuloksen (tarkistettu uudelleen), uusi Nvidia-näytönohjain ei osoittanut lievästi sanoen liian suurta nopeutta. Geforce GTX Titan X tässä osatestissä osoitti kaikista ratkaisuista huonoimman tuloksen, jäljessä jopa GTX 980:sta lähes 20 %!

No, vertailu Radeon-levyihin tässä testissä on aivan yhtä ruma uudelle tuotteelle. Huolimatta teoreettisesti pienemmästä geometristen suoritusyksiköiden määrästä ja AMD-sirujen geometrisesta suoritusviiveestä kilpaileviin ratkaisuihin verrattuna, molemmat Radeon-levyt toimivat erittäin tehokkaasti tässä testissä ja ylittävät vertailussa kaikki kolme esitettyä Geforce-korttia. Jälleen näyttää siltä, että Nvidia-ajureissa ei ole optimoitua tiettyä tehtävää varten.

Ominaisuustesti 5: GPU-hiukkaset

Testi efektien fyysiseen simulointiin, joka perustuu videosirun avulla laskettuihin hiukkasjärjestelmiin. Vertex-simulaatiota käytetään myös, jokainen huippu edustaa yhtä hiukkasta. Stream out -toimintoa käytetään samaan tarkoitukseen kuin edellisessä testissä. Lasketaan useita satojatuhansia hiukkasia, kaikki animoidaan erikseen, lasketaan myös niiden törmäykset korkeuskarttaan.

Kuten yhdessä RightMark3D 2.0 -testissämme, hiukkaset piirretään geometriavarjostimella, joka luo jokaisesta pisteestä neljä kärkeä hiukkasen muodostamiseksi. Mutta testi lataa Shader-lohkot ennen kaikkea vertex-laskelmilla, myös stream out testataan.

3DMark Vantagen toisessa "geometrisessa" testissä tilanne on muuttunut vakavasti, tällä kertaa kaikki Geforcet osoittavat jo enemmän tai vähemmän normaalia tulosta, vaikka kaksisiruinen Radeon pysyy edelleen kärjessä. Uusi GTX Titan X -malli on 24 % nopeampi kuin sen sisar GTX 980 ja suunnilleen saman verran jäljessä edellisen sukupolven GPU:n kaksoisgrafiikkasuorittimesta Titan Z:sta.

Nvidian uutuuden vertailu kilpaileviin AMD:n näytönohjaimiin tällä kertaa on positiivisempi - se osoitti tuloksen kahden kilpailevan yrityksen levyn välillä ja osoittautui lähempänä Radeon R9 295X2:ta, jossa on kaksi GPU:ta. Uutuus on kaukana Radeon R9 290X:n edellä ja tämä osoittaa meille selvästi, kuinka erilaisia kaksi näennäisesti samanlaista testiä voivat olla: kangassimulaatio ja hiukkassysteemisimulaatio.

Ominaisuustesti 6: Perlin Noise

Vantage-paketin viimeinen ominaisuustesti on matemaattisesti intensiivinen videosirun testi, joka laskee pikselivarjostimessa useita Perlin-kohinaalgoritmin oktaaveja. Jokainen värikanava käyttää omaa kohinatoimintoaan lisätäkseen videosirun kuormitusta. Perlin-kohina on standardialgoritmi, jota käytetään usein proseduurin teksturointiin, se käyttää paljon matemaattisia laskelmia.

Tässä tapauksessa ratkaisujen suorituskyky ei aivan vastaa teoriaa, vaikka se on lähellä sitä, mitä näimme vastaavissa testeissä. Futuremark-paketin matemaattisessa testissä, joka näyttää videosirujen huippusuorituskyvyn rajatehtävissä, näemme erilaisen tulosten jakautumisen verrattuna testipakettimme vastaaviin testeihin.

Olemme tienneet jo pitkään, että GCN-arkkitehtuurilla varustetut AMD-videosirut selviävät edelleen tällaisista tehtävistä kilpailijoita paremmin, varsinkin tapauksissa, joissa suoritetaan intensiivistä "matematiikkaa". Mutta Nvidian uusi huippumalli perustuu suureen GM200-siruun, joten Geforce GTX Titan X suoriutui tässä testissä huomattavasti paremmin kuin Radeon R9 290X.

Jos verrataan uutta tuotetta Geforce GTX 900 -perheen parhaaseen malliin, niin tässä testissä ero niiden välillä oli lähes 40% - tietysti tänään harkitsemamme näytönohjaimen hyväksi. Tämä on myös lähellä teoreettista eroa. Ei huono tulos Titan X:lle, vain kaksisiruinen Radeon R9 295X2 oli edellä ja kaukana edellä.

Direct3D 11: Laske varjostimet

Testaaksemme Nvidian äskettäin julkaistua huippuluokan ratkaisua tehtäviin, joissa käytetään DirectX 11 -ominaisuuksia, kuten tessellaatiota ja laskentavarjostimia, käytimme Microsoftin, Nvidian ja AMD:n SDK-esimerkkejä ja demoja.

Ensin tarkastellaan vertailuarvoja, jotka käyttävät Compute-varjostimia. Niiden ulkonäkö on yksi tärkeimmistä innovaatioista DX API:n uusimmissa versioissa, niitä käytetään jo nykyaikaisissa peleissä erilaisten tehtävien suorittamiseen: jälkikäsittelyyn, simulaatioihin jne. Ensimmäinen testi näyttää esimerkin HDR-renderöimisestä sävykartoituksella. DirectX SDK:sta, jossa on jälkikäsittely, joka käyttää pikseli- ja laskentavarjostimia.

Laskentanopeus laskenta- ja pikselivarjostimissa kaikilla AMD- ja Nvidia-korteilla on suunnilleen sama, eroja havaittiin vain aikaisempien arkkitehtuurien GPU:ihin perustuvissa näytönohjaimissa. Aikaisempien testiemme perusteella ongelman tulokset eivät useinkaan riipu niinkään matemaattisesta tehosta ja laskentatehosta, vaan muista tekijöistä, kuten muistin kaistanleveydestä.

Tässä tapauksessa uusi huippuluokan näytönohjain on nopeampi kuin yksisiruinen Geforce GTX 980 ja Radeon R9 290X, mutta takana kaksisiruinen R9 295X2, mikä on ymmärrettävää, koska siinä on R9 290X -parin teho. . Jos vertaamme uutta tuotetta Geforce GTX 980:een, niin tänään tarkastellun kalifornialaisen yrityksen emolevy on 34-36% nopeampi - täsmälleen teorian mukaan.

Toinen laskentavarjostimen testi on myös otettu Microsoft DirectX SDK:sta, ja se näyttää N-kappaleen (N-body) painovoimalaskentaongelman, simulaation dynaamisesta hiukkasjärjestelmästä, joka on alttiina fyysisille voimille, kuten painovoimalle.

Tässä testissä painotetaan useimmiten monimutkaisten matemaattisten laskutoimitusten suorittamisen nopeutta, geometrian käsittelyä ja koodin suorittamisen tehokkuutta haaroituksella. Ja tässä DX11-testissä kahden eri yrityksen ratkaisujen välisten voimien kohdistus osoittautui täysin erilaiseksi - selvästi Geforce-näytönohjainkorttien hyväksi.

Eri siruihin perustuvan Nvidia-ratkaisuparin tulokset ovat kuitenkin myös outoja - Geforce GTX Titan X ja GTX 980 ovat lähes yhtä suuret, niitä erottaa vain 5 % suorituskyvyn ero. Dual-chip renderöinti ei toimi tässä tehtävässä, joten kilpailijat (yksisiruiset ja kaksisiruiset Radeon-mallit) ovat suunnilleen yhtä nopeita. No, GTX Titan X on kolme kertaa heitä edellä. Näyttää siltä, että tämä tehtävä lasketaan paljon tehokkaammin Maxwell-arkkitehtuurin GPU:illa, jonka totesimme aiemmin.

Direct3D 11: Tessellation Performance

Laskennalliset varjostimet ovat erittäin tärkeitä, mutta toinen tärkeä uusi Direct3D 11:n ominaisuus on laitteiston tessellointi. Käsittelimme sitä hyvin yksityiskohtaisesti teoreettisessa artikkelissamme Nvidia GF100:sta. Tessellationia on käytetty DX11-peleissä pitkään, kuten STALKER: Call of Pripyat, DiRT 2, Aliens vs Predator, Metro Last Light, Civilization V, Crysis 3, Battlefield 3 ja muut. Jotkut niistä käyttävät tessellaatiota hahmomalleissa, toiset simuloivat realistista vedenpintaa tai maisemaa.

Graafisten primitiivien osiointiin (tessellaatioon) on olemassa useita erilaisia järjestelmiä. Esimerkiksi phong-tessellaatio, PN-kolmiot, Catmull-Clark-alajako. Joten PN-kolmioiden laatoitusjärjestelmää käytetään STALKER: Call of Pripyatissa ja Metro 2033 - Phong tessellaatiossa. Nämä menetelmät ovat suhteellisen nopeita ja helppoja ottaa käyttöön pelin kehitysprosessissa ja olemassa olevissa moottoreissa, minkä vuoksi niistä on tullut suosittuja.

Ensimmäinen tessellaatiotesti on ATI Radeon SDK:n Detail Tessellation -esimerkki. Se toteuttaa paitsi tesselloinnin, myös kaksi erilaista pikselikohtaista käsittelytekniikkaa: yksinkertaisen normaalien karttojen päällekkäisyyden ja parallaksien okkluusiokartoituksen. No, verrataan AMD:n ja Nvidian DX11-ratkaisuja eri olosuhteissa:

Yksinkertaisessa bumpmapping-testissä levyjen nopeudella ei ole suurta merkitystä, koska tämä tehtävä on tullut liian helpoksi pitkään ja sen suorituskyky riippuu muistin kaistanleveydestä tai täyttönopeudesta. Tämän päivän arvostelun sankari on 23% edellä GM204-siruun perustuvaa edellistä huippumallia Geforce GTX 980 ja hieman huonompi kuin kilpailijansa Radeon R9 290X:n muodossa. Kaksisiruinen versio on jopa hieman nopeampi.

Toisessa osatestissä monimutkaisemmilla pikselikohtaisilla laskelmilla uusi tuote on jo 34 % nopeampi kuin Geforce GTX 980, mikä on lähempänä niiden välistä teoreettista eroa. Mutta tällä kertaa Titan X on jo hieman nopeampi kuin yhden sirun ehdollinen kilpailija, joka perustuu yhteen Havaijiin. Koska Radeon R9 295X2:n kaksi sirua toimivat täydellisesti, tämä tehtävä suoritetaan vielä nopeammin. Vaikka matemaattisten laskelmien suorituskyky pikselivarjostimissa on parempi GCN-arkkitehtuurisirujen osalta, Maxwell-arkkitehtuuriratkaisujen julkaisu paransi Nvidia-ratkaisujen sijoituksia.

Kevyessä tessellaatio-alitestissä äskettäin julkistettu Nvidia-levy on jälleen vain neljänneksen nopeampi kuin Geforce GTX 980 - ehkä nopeutta rajoittaa muistin kaistanleveys, koska teksturointi ei tässä testissä juuri vaikuta. Jos verrataan uutta tuotetta AMD-kortteihin tässä osatestissä, niin Nvidia-levy on jälleen huonompi kuin molemmat Radeonit, koska tässä tessellaatiotestissä kolmion halkaisu on erittäin maltillista eikä geometrinen suorituskyky rajoita yleistä renderöintinopeutta.

Toinen tessellaatiotesti on toinen esimerkki 3D-kehittäjille ATI Radeon SDK - PN Trianglesista. Itse asiassa molemmat esimerkit sisältyvät myös DX SDK:han, joten olemme varmoja, että pelien kehittäjät luovat oman koodinsa niiden perusteella. Testasimme tätä esimerkkiä eri tessellaatiokertoimella nähdäksemme, kuinka paljon se vaikuttaa yleiseen suorituskykyyn.

Tässä testissä käytetään monimutkaisempaa geometriaa, joten eri ratkaisujen geometristen tehojen vertailu tuo erilaisia johtopäätöksiä. Materiaalissa esitetyt nykyaikaiset ratkaisut kestävät melko hyvin kevyitä ja keskisuuria geometrisia kuormituksia osoittaen suurta nopeutta. Mutta vaikka Havaijin yksi ja kaksi GPU:ta Radeon R9 290X:ssä ja R9 295X2:ssa toimivat hyvin valoisissa olosuhteissa, Nvidian levyt ovat huippuluokkaa raskaassa käytössä. Joten vaikeimmissa tiloissa tänään esitelty Geforce GTX Titan X näyttää nopeuden jo huomattavasti paremmin kuin kaksisiruinen Radeon.

Mitä tulee GM200- ja GM204-siruihin perustuvien Nvidia-levyjen vertailuun, tänään tarkasteltavana oleva Geforce GTX Titan X -malli lisää etuaan geometrisen kuormituksen kasvun myötä, koska valotilassa kaikki riippuu muistin kaistanleveydestä. Tämän seurauksena uusi tuote on Geforce GTX 980 -korttia edellä tilan monimutkaisuudesta riippuen jopa 31 %.

Katsotaanpa toisen testin, Nvidia Realistic Water Terrain -demo-ohjelman, joka tunnetaan myös nimellä Island, tuloksia. Tämä demo käyttää tessellaatio- ja siirtymäkartoitusta realistisen näköisen valtameren pinnan ja maaston luomiseksi.

Island-testi ei ole puhtaasti synteettinen testi puhtaasti geometrisen GPU-suorituskyvyn mittaamiseen, koska se sisältää sekä monimutkaisia pikseli- että laskentavarjostimia, ja tällainen kuormitus on lähempänä oikeita pelejä, joissa käytetään kaikkia GPU-yksiköitä, ei vain geometrisia, kuten edellisessä. geometrian testit. Vaikka geometrian prosessointiyksiköiden kuormitus pysyy edelleen pääasiallisena, esimerkiksi sama muistin kaistanleveys voi myös vaikuttaa.

Testaamme kaikki näytönohjaimet neljällä eri tessellaatiokertoimella - tässä tapauksessa asetusta kutsutaan nimellä Dynamic Tessellation LOD. Ensimmäisellä kolmion jakokertoimella geometristen lohkojen suorituskyky ei rajoita nopeutta, ja Radeon-näytönohjaimet näyttävät melko korkean tuloksen, etenkin kaksisiruinen R9 295X2, joka jopa ylittää ilmoitetun Geforce GTX Titan X -levyn tuloksen. , mutta jo seuraavilla geometrisilla kuormitustasoilla Radeon-korttien suorituskyky heikkenee ja ratkaisut Nvidia ovat ottamassa johtoasemaan.

Uuden GM200-videosiruun perustuvan Nvidia-levyn etu kilpailijoihinsa nähden tällaisissa testeissä on jo varsin kohtuullinen ja jopa moninkertainen. Jos vertaamme Geforce GTX Titan X:ää GTX 980:een, niin ero niiden suorituskyvyn välillä on 37-42%, mikä on täysin selitetty teorialla ja vastaa sitä tarkasti. Maxwellin grafiikkasuorittimet ovat huomattavasti tehokkaampia sekakuormituksessa ja siirtyvät nopeasti grafiikasta tietojenkäsittelyyn ja takaisin, ja Titan X on paljon nopeampi kuin jopa kaksisiruinen Radeon R9 295X2 tässä testissä.

Analysoituamme uuden Nvidia Geforce GTX Titan X -näytönohjaimen synteettisten testien tulokset, jotka perustuvat uuteen huippuluokan GM200-grafiikkasuorittimeen sekä ottamalla huomioon muiden näytönohjainmallien tulokset molemmilta erillisten videosirujen valmistajilta, voimme päätellä, että tänään harkitsemamme näytönohjaimen pitäisi olla markkinoiden nopein ja kilpailla vahvimman AMD:n kaksisiruisen näytönohjaimen kanssa. Yleensä tämä on hyvä Geforce GTX Titan Black -seuraaja - tehokas yksisiru.

Nvidian uusi näytönohjain näyttää melko vahvoja tuloksia synteettisessä - monissa testeissä, mutta ei kaikissa. Radeonilla ja Geforcella on perinteisesti erilaisia vahvuuksia. Useissa testeissä Radeon R9 295X2 -mallin kaksi GPU:ta olivat nopeampia, muun muassa suuremman kokonaismuistin kaistanleveyden ja teksturointinopeuden ansiosta, jotka suorittivat laskennalliset tehtävät erittäin tehokkaasti. Mutta muissa tapauksissa Maxwell-arkkitehtuurin huippugrafiikkaprosessori voittaa takaisin, erityisesti geometrisissä testeissä ja tessellaatioesimerkeissä.

Todellisissa pelisovelluksissa kaikki on kuitenkin hieman erilaista "synteettisiin" verrattuna ja Geforce GTX Titan X:n nopeus pitäisi olla huomattavasti korkeampi kuin yksisiruinen Geforce GTX 980 ja vielä enemmän Radeon R9 290X . Ja uutuutta on vaikea verrata kaksisiruisiin Radeon R9 295X2 -järjestelmiin - kahteen tai useampaan GPU:hun perustuvilla järjestelmillä on omat epämiellyttävät ominaisuutensa, vaikka ne lisäävät keskimääräistä kuvanopeutta asianmukaisella optimoinnilla.

Mutta arkkitehtoniset ominaisuudet ja toiminnallisuus tukevat selvästi Nvidian premium-ratkaisua. Geforce GTX Titan X kuluttaa paljon vähemmän energiaa kuin sama Radeon R9 295X2, ja Nvidian uusi malli on erittäin vahva energiatehokkuuden suhteen - tämä on Maxwell-arkkitehtuurin erottuva piirre. Älä unohda Nvidian uuden tuotteen parempaa toiminnallisuutta: DirectX 12:ssa on tuki ominaisuustasolle 12.1, VXGI-laitteistokiihdytykseen, uusi MFAA-anti-aliasing-menetelmä ja muita teknologioita. Puhuimme jo markkinoiden näkökulmasta ensimmäisessä osassa - eliittisegmentissä ei niinkään riipu hinnasta. Pääasia on, että ratkaisu on pelisovelluksissa mahdollisimman toimiva ja tuottava. Yksinkertaisesti sanottuna se oli parasta kaikessa.

Pelkästään uutuuden nopeuden arvioimiseksi peleissä, materiaalimme seuraavassa osassa määritämme Geforce GTX Titan X:n suorituskyvyn peliprojektiemme sarjassa ja vertaamme sitä kilpailijoiden suorituskykyyn, mukaan lukien perustelujen arviointi. uutuuden vähittäishinnasta harrastajien näkökulmasta ja selvitä myös kuinka paljon nopeampi se on Geforce GTX 980 jo peleissä.

Yrityksen toimittama Asus ProArt PA249Q näyttö työtietokoneeseen Asustek

Yrityksen toimittama Cougar 700K näppäimistö työtietokoneeseen puuma

TITAN X -näytönohjain on suunniteltu kaikkein resursseja vaativien pelien ystäville. Siinä yhdistyvät huipputeknologia ja uuden NVIDIA Maxwell™ -arkkitehtuurin äärimmäinen suorituskyky ja se tarjoaa planeetan nopeimman ja edistyneimmän näytönohjaimen.

SUORITUSKYKY

TITAN X jatkaa TITAN-näytönohjainperheen perintöä ja tarjoaa maailman tehokkaimman peligrafiikkasuorittimen. Se käyttää tehokasta Maxwell-arkkitehtuuria tuottamaan uusinta teknologiaa kaksinkertaisella suorituskyvyllä ja tehotehokkuudella alkuperäiseen GTX TITAN -näytönohjaimeen verrattuna.

ERINOMAINEN DESIGN

TITAN X on suunniteltu ja ammattitaidolla valmistettu korkealaatuisista komponenteista, jotka parantavat merkittävästi suorituskykyä säilyttäen samalla ylittämättömän akustisen ja lämpösuorituskyvyn.

Tämä edistyksellinen grafiikkasuoritin tukee hyperrealistista reaaliaikaista globaalia valaistusta NVIDIA VXGI -tekniikalla sekä NVIDIA G-SYNC™ -teknologialla, joka takaa sujuvan, repeytymättömän pelaamisen. Lisäksi voit kokea DSR-teknologian, joka tarjoaa 4K-kokemuksen jopa 1080p-näytöillä.

EXTREME PELIT

TITAN X on ainoa yksittäinen GPU-näytönohjain, jolla voi pelata helposti 4K-pelejä korkeilla asetuksilla. Se toimii sujuvasti GeForce® Experience™ -sovelluksen kanssa, joka antaa sinulle pääsyn uusimpiin ohjaimiin ja optimoi peliasetukset yhdellä napsautuksella. Voit jopa tallentaa parhaat pelihetket ja jakaa ne ystäviesi kanssa NVIDIA® ShadowPlay™ -tekniikan avulla.

NVIDIAn ensimmäinen markkinoille tullut Pascal-arkkitehtuuri oli GP104-prosessoriin perustuva GeForce GTX 1080. Uuden 16 nm:n FinFET-prosessitekniikan sekä sirun arkkitehtuurin ja piirien optimoinnin ansiosta GTX 1080 on mahdollistanut pelien suorituskyvyn, joka on noin 30 % korkeampi kuin NVIDIA:n edellisen sukupolven lippulaivanäytönohjain. GeForce GTX TITAN X. Samaan aikaan GTX 1080:n kehittäjät onnistuivat pienentämään kiihdytin tehobudjettia 70 W verrattuna edeltäjänsä TDP:hen - 250:stä 180 wattiin. Samaan aikaan 250 W:n lämpöpaketti on vakiotavoite NVIDIAn viimeisten sukupolvien parhaille pelinäyttökorteille, joten vieläkin tuottavamman tuotteen ilmestyminen GTX 1080:n jälkeen, joka vie Pascal-sarjan tämän markkinaraon, oli vain asia. ajasta.

Kepler-arkkitehtuurista alkaen NVIDIA on omaksunut seuraavan strategian GPU:iden julkaisuun eri suorituskykyluokissa. Ensinnäkin toisen tason siru debytoi: GK104 Kepler-perheessä, GM204 Maxwellin versiossa 2 ja nyt GP104 Pascalissa. Myöhemmin NVIDIA täyttää yhden tai kaksi alempana olevaa tasoa, ja merkittävän aukon jälkeen ilmestyy huipputason GPU, joka muodostaa perustan NVIDIA:n tehokkaimmalle kiihdyttimelle, samalla kun virrankulutus pysyy 250 W:n sisällä nykyisellä työnkululla.

Pascal-arkkitehtuurin nykyinen huippu on GP100-prosessori, jossa on ennennäkemätön määrä Shader ALU:ita (3840 CUDA-ydintä) ja 16 Gt HBM2-muistia yhdistettynä piisubstraatilla olevaan GPU:han. GP100:aa käytetään osana Tesla P100 -kiihdytintä, jonka käyttö rajoittuu supertietokoneiden alaan NVLINK-väylällä ja 300 W:n TDP:llä varustetun erityisen muotokertoimen vuoksi. Tesla P100:n odotetaan myös julkaistavan vakiona PCI Express -laajennuskorttimuodossa vuoden lopussa.

Alan harrastajien unelmissa juuri GP100-siru olisi pitänyt kruunata GeForce 10 -pelisovittimien valikoima tulevaisuudessa, ja NVIDIA olisi voinut aiemmin julkaista uuden TITANin - vain välipysähdyksellä tässä paikassa, edellinen suuri GPU:t saapuivat pelitietokoneisiin (GK110 osana TITANia ja GM200 - TITAN X:ssä).

Tällä kertaa asiantuntijat kuitenkin ilmeisesti osoittautuivat oikeaksi ennustaessaan NVIDIA GPU -linjan lopullisen jakautumisen kahteen ei-päällekkäiseen ryhmään - toisaalta pelisiruihin ja prosumer-suuntiin (sanoista tuottaja ja kuluttaja) , ja sirut tietojenkäsittelyä varten - toisaalta. Erottava tekijä tässä tapauksessa on grafiikkasuorittimen nopeus kaksinkertaisella tarkkuudella liukulukuluvuilla (FP64). Kepler-linjassa kehittäjät ovat jo uhraaneet tämän ominaisuuden kaikille siruille (1/24 FP32:sta), paitsi vanhemmalle - GK110/GK210 (1/3 FP32:sta), vähentääkseen GPU-virrankulutusta. Seuraavassa sukupolvessa tämä suuntaus paheni: kaikki Maxwell-prosessorit käyttävät FP64:ää nopeudella 1/32 FP32:sta.

Pascalin tilanne osoitti, että FP64:n suorituskyvyn säästö ei jäänyt väliaikaiseksi toimenpiteeksi 28 nm:n prosessitekniikan viiveen vuoksi. NVIDIA tarvitsee edelleen GPU:n palvelimille, supertietokoneille ja työasemille, jotka pystyvät käsittelemään FP64:ää korkealla suorituskyvyllä. Pelivideosovittimille tämä transistorin budjettia ja GPU-virrankulutusta lisäävä toiminto on kuitenkin vain taakka.

Sen sijaan, että NVIDIA olisi siirtänyt GP100:n (ilmeisesti kallis siru sekä alueen että integroidun HBM2-muistin vuoksi) pelinäyttökorteille, se julkaisi lisätuotteen - GP102:n, joka keskittyi toimiin FP32:n kanssa. 3D-grafiikkaa ja lukuisissa laskentatehtävissä. GP102:n ainoa toimiva ominaisuus on tuki int8-muodon kokonaislukuoperaatioille. Tämä on tärkeä asia NVIDIAlle, koska int8:aa käytetään laajalti koneoppimistehtävissä, jotka yritys on asettanut itselleen yhdeksi prioriteeteistaan (tarkemmin sanottuna yksi tällaisten tehtävien luokista on syväoppiminen). Lähitulevaisuudessa aiomme julkaista erillisen artikkelin, joka on omistettu tälle aiheelle.

Uusi TITAN X, ensimmäinen GP102-prosessoriin perustuva laite, on sijoitettu ensisijaisesti ammattitason kiihdyttimeksi, joka on suunniteltu syväoppimiseen liittyviin tutkimukseen ja kaupallisiin sovelluksiin. Tämän vahvistaa GeForce-brändin puuttuminen kortin nimestä. Uutuuden laajat pelimahdollisuudet ovat kuitenkin myös kiistattomat. Kaikkia aiemmin julkaistuja Titaaneja laskentatoimintojensa lisäksi pidettiin premium-pelinäytönohjainkortteina, jotka pystyivät tarjoamaan grafiikan laatua ja suorituskykyä, joita ei ollut saatavilla heidän nykyisille GeForce-linjan malleille.

⇡ NVIDIA GP102

Tämä GPU on suunniteltu vaihtoehdoksi supertietokoneelle GP100, joka ei ole huonompi kuin jälkimmäinen 3D-grafiikka- ja FP32-laskennan toiminnoissa. Samaan aikaan GP102:n luojat ovat vähentäneet kaikkia komponentteja, jotka eivät vastaa tuotteen tarkoitusta.

Esimerkiksi GP100:n yksittäinen SM (Streaming Multiprocessor - lohko, joka yhdistää CUDA-ytimet tekstuurikartoitusyksiköiden, ajoittajien, lähettäjien ja paikallisten muistisegmenttien kanssa) sisältää 64 CUDA-ydintä FP32-toimintoja varten, kun taas GP102:n SM:llä on tässä suhteessa peritty konfiguraatio. Maxwellilta: 128 CUDA-ydintä. Tarkempi CUDA-ytimien jakautuminen GP100:ssa mahdollistaa sen, että prosessori voi suorittaa samanaikaisesti enemmän käskyvirtoja (ja myös säieryhmiä - loimi- ja loimilohkoja) sekä SM:n sisällä olevien tallennustyyppien kokonaismäärän, kuten jaetun muistin (jaettu muisti) ja rekisteritiedosto, koko GPU:n osalta on kasvanut Maxwell-arkkitehtuuriin verrattuna.

NVIDIA GP102 lohkokaavio

Lisäksi GP100:ssa jokaista FP32-toimintojen 64 CUDA-ydintä kohden on 32 ydintä FP64:lle, kun taas GP102:n SM:ssä on Maxwellilta peritty konfiguraatio tässä suhteessa: 128 CUDA-ydintä FP32:lle ja 4 FP64:lle. Tästä syystä GP102:n lyhennetty kaksinkertainen tarkkuussuorituskyky.

Lopuksi GP100:ssa on suurempi L2-välimuisti: 4096 kt verrattuna GP102:n 3072 kt:iin. Ja tietysti, GP102:sta puuttuu NVLINK-väyläohjain, ja HBM2-muistiohjaimet (jonka väylän kokonaisleveys on 4096 bittiä) korvataan GDDR5X SDRAM -ohjaimilla. 12 näistä 32-bittisistä ohjaimista tarjoavat yhteisen 384-bittisen muistiväylän.

Muissa meitä kiinnostavissa asioissa GP100- ja GP102-sirut ovat identtisiä. Molemmat suulakkeet sisältävät 3840 FP32-yhteensopivaa CUDA-ydintä ja 240 pintakuviokartoitinta sekä 96 ROP:ta. Täten yleisestä näkökulmasta katsottuna GP102-laskentayksiköiden rakenne toistaa GP104-sirun rakennetta määrällisillä muutoksilla korjattuna. Vaikka emme vieläkään tiedä joitain parametreja (L1-välimuisti, jaettu muisti ja rekisteritiedostojen koot), ne ovat luultavasti samat näissä kahdessa GPU:ssa.

TSMC:n 16 nm:n FinFET-prosessitekniikalla valmistettu GP102-siru sisältää 12 miljardia transistoria 471 mm2:n alueella. Vertailun vuoksi: GP100:n ominaisuudet ovat 15,3 miljardia transistoria ja 610 mm 2. Tämä on erittäin merkittävä ero. Lisäksi, jos TSMC ei ole lisännyt fotomaskin kokoa 16 nm:n prosessissa verrattuna 28 nm:iin, GP100 on melkein lopussa, kun taas GP102:n kevyt arkkitehtuuri antaa NVIDIAlle mahdollisuuden luoda suuremman ytimen laajalle kuluttajamarkkinoille tulevaisuudessa käyttämällä samaa tuotantolinjaa (mikä ei kuitenkaan todennäköisesti tapahdu, elleivät kehittäjät harkitse uudelleen huippumallien TDP-standardejaan).

Mitä tulee Pascal-arkkitehtuurin ja Maxwellin välisiin eroihin, suosittelemme tutustumaan GeForce GTX 1080 -arvosteluumme. Tässä iteraatiossa kehittäjät ovat kehittäneet edellisen sukupolven etuja ja kompensoineet sen luontaiset puutteet.

Huomioimme lyhyesti seuraavat seikat:

parannettu värin pakkaussuhde jopa 8:1;
PolyMorph Enginen Simultaneous Multi-Projection -toiminto, jonka avulla voit luoda jopa 16 projektiota kohtauksen geometriasta yhdellä kertaa (VR:lle ja järjestelmille, joissa on useita näyttöjä NVIDIA Surround -kokoonpanossa);
kyky keskeyttää (ennakkoosto) piirtokutsua (renderöinnin aikana) ja komentovirtaa (laskelmien aikana) suoritettaessa, mikä yhdessä GPU-laskentaresurssien dynaamisen allokoinnin kanssa tarjoaa täyden tuen asynkroniselle laskennalle (Async Compute) - lisäsuorituskyvyn lähde peleissä DirectX 12 API:n alaisuudessa ja pienempi viive VR:ssä;
DisplayPort 1.3/1.4- ja HDMI 2.b -liitäntöjen kanssa yhteensopiva näytönohjain. Tuki korkealle dynaamiselle alueelle (HDR);
SLI-väylä suurennetulla kaistanleveydellä.

⇡ Tekniset tiedot, hinta

TITAN X ei käytä täysin toimivaa versiota GP102 GPU:sta: 30 SM:stä kaksi on poistettu käytöstä tässä. Siten CUDA-ytimien ja pintakuvioyksiköiden lukumäärän suhteen Titan vastaa Tesla P100:aa, jossa GP100-siru on myös osittain "leikattu" (3584 CUDA-ydintä ja 224 pintakuvioyksikköä).

Uutuuden grafiikkaprosessori toimii korkeammilla taajuuksilla (1417/1531 MHz) kuin Tesla P100:ssa (jopa 1328/1480 MHz supertietokoneversiossa ja jopa 1300 MHz PCI-Express-levyn muotokertoimessa). Silti "Titanin" taajuudet ovat melko konservatiivisia verrattuna GeForce GTX 1080:n (1607/1733 MHz) ominaisuuksiin. Kuten ylikellotuskokeissa nähdään, rajoittava tekijä oli laitteen virrankulutus, jonka NVIDIA asetti tutuille 250 W:lle.

TITAN X on varustettu 12 Gt:n GDDR5X SDRAM-muistilla, jonka kaistanleveys on 10 Gbps per pin. 384-bittinen väylä tarjoaa tiedonsiirron nopeudella 480 Gt / s: tässä indikaattorissa TITAN X on vain hieman huonompi kuin nykyinen ennätyksen haltija - Radeon R9 Fury X sekä muut GPU Fiji -pohjaiset AMD-tuotteet ( 512 Gt/s).

Valmistaja	NVIDIA
Malli	GeForce GTX TITAN	GeForce GTX TITAN musta	GeForce GTX TITAN Z	GeForce GTX TITAN X	GeForce GTX 1080	TITAN X
GPU
Nimi	GK110	GK110	2 × GK110	GM200	GP104	GP102
mikroarkkitehtuuri	Kepler	Kepler	Kepler	Maxwell	Pascal	Pascal
Prosessitekniikka, nm	28 nm	28 nm	28 nm	28 nm	16nm FinFET	16nm FinFET
Transistorien lukumäärä, milj	7 080	7 080	2×7080	8 000	7 200	12 000
Kellotaajuus, MHz: peruskello / tehostuskello	837/876	889/980	705/876	1 000 / 1 089	1 607 / 1 733	1 417 / 1531
Shader ALU:iden lukumäärä	2 688	2 880	2×2880	3 072	2 560	3 584
Tekstuuripeittokuvien määrä	224	240	2×240	192	160	224
ROP:ien määrä	48	48	2×48	96	64	96
RAM
Bussin leveys, vähän	384	384	2×384	384	256	384
Sirun tyyppi	GDDR5 SDRAM	GDDR5 SDRAM	GDDR5 SDRAM	GDDR5 SDRAM	GDDR5X SDRAM	GDDR5X SDRAM
Kellotaajuus, MHz (kaistanleveys kontaktia kohti, Mbps)	1 502 (6 008)	1 750 (7 000)	1 750 (7 000)	1 753 (7 012)	1 250 (10 000)	1 250 (10 000)
Tilavuus, MB	6 144	6 144	2×6144	12 288	8 192	12 288
I/O-väylä	PCI Express 3.0 x16	PCI Express 3.0 x16	PCI Express 3.0 x16	PCI Express 3.0 x16	PCI Express 3.0 x16	PCI Express 3.0 x16
Esitys
Huippusuorituskyky FP32, GFLOPS (perustuu määritettyyn enimmäistaajuuteen)	4 709	5 645	10 092	6 691	8 873	10 974
Suorituskyky FP32/FP64	1/3	1/3	1/3	1/32	1/32	1/32
RAM-muistin kaistanleveys, GB/s	288	336	2×336	336	320	480
Kuvan ulostulo
Kuvan ulostuloliitännät		DL DVI-I, DisplayPort 1.2, HDMI 1.4a	DL DVI-D, DL DVI-I, DisplayPort 1.2, HDMI 1.4a	DL DVI-I, DisplayPort 1.2, HDMI 1.4a		DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b
TDP, W	250	250	375	250	180	250
Suositeltu vähittäismyyntihinta julkaisuhetkellä (USA, ilman veroja), $	999	999	2 999	999	599/699	1 200
Suositeltu vähittäismyyntihinta julkaisuhetkellä (Venäjä), hiero.	34 990	35 990	114 990	74 900	— / 54 990	—

Teoreettisen suorituskyvyn osalta TITAN X on ensimmäinen yhden GPU:n näytönohjain, joka ylittää 10 TFLOPS:n FP32-suorituskyvyssä. Aiemmista NVIDIA-tuotteista vain GK110-sirulle rakennettu TITAN Z pystyi tähän. Toisaalta, toisin kuin Tesla P100 (ja samoin kuin GeForce GTX 1060/1070/1080), TITAN X:lle on ominaista erittäin vaatimaton suorituskyky kaksinkertaisella (1/32 FP32:sta) ja puoleisella tarkkuudella (1/64 FP32:sta). laskelmia, mutta pystyy suorittamaan operaatioita int8-numeroilla nopeudella, joka on 4 kertaa nopeampi kuin FP32:lla. Muut Pascal-perheen GPU:t - GP104 (GeForce GTX 1070 /1080, Tesla P4) ja GP106 (GTX 1060) ja GP100 (Tesla P100) tukevat myös int8:aa suorituskykysuhteella 4:1 suhteessa FP32:een, mutta tällä hetkellä emme tiedä. jos tämä on rajoitettu toiminnallisuus GeForce-pelinäytönohjainkorteissa.

TITAN X on erittäin, erittäin kallis ostos, jonka valitsevat vain ne, jotka todella haluavat saada niin täydellisen näytönohjaimen. NVIDIA on nostanut hintaa 200 dollarilla aiemmista yksikantaisista malleista 1 200 dollariin. Tällä kertaa laitetta ei jaeta kumppaneiden kautta, ja sitä myydään vain NVIDIA-verkkosivustolla tietyissä maissa. Venäjä ei ole vielä heidän joukossaan.

⇡ Design

Näytönohjaimen kotelo on valmistettu samalla tyylillä kuin GeForce 10 -sarjan Founders Edition -tuotemerkin tuotteet. Jäähdytysjärjestelmä radiaalituulettimella (turbiinilla) on peitetty metallikotelolla ja painetun piirin takapinta levy on suojattu paksulla levyllä. Osa jälkimmäisestä voidaan irrottaa, jotta ilma pääsee esteettömästi viereisen näytönohjaimen jäähdyttimeen SLI-tilassa. Hassua, että vaikka TITAN X ei muodollisesti enää kuulu GeForce-perheeseen, on tämä vihreillä LEDeillä valaistu kirjoitus edelleen näytönohjaimen kyljessä.

Jäähdyttimen rakenne on sama kuin GTX 1070/1080:ssa: GPU luovuttaa lämpöä jäähdytyselementille haihdutuskammiolla, kun taas RAM-sirut ja jännitteenmuunnintransistorit on peitetty massiivisella alumiinirungolla, jossa on erillinen lohko. pienistä eväistä.

Muuten, kuten yksi TITAN X:n omistajista huomasi, NVIDIA antaa käyttäjille mahdollisuuden vaihtaa näytönohjaimen jäähdytysjärjestelmän johonkin tehokkaampaan (esimerkiksi LSS) menettämättä takuuta.

⇡ Maksaa

Kuten GTX 1060/1070/1080:n vertailuversiot, TITAN X -kortissa on kolme DisplayPort-liitintä ja yksi DVI- ja HDMI-liitin.

Virtajärjestelmä on rakennettu 6 + 1 -kaavion mukaan (GPU:n ja muistisirujen vaiheiden lukumäärä). Käytössä on kaksi lisävirtaliitintä - kuusi- ja kahdeksannapainen, jotka yhdessä PCI-Express-liittimen virtalinjojen kanssa tarjoavat näytönohjaimelle 300 watin tehoreservin.

GDDR5X SDRAM -muisti, kuten GeForce GTX 1080:ssa, koostuu Micron D9TXS -mikropiireistä, joiden normaali tehollinen taajuus on 10 GHz.

⇡ Testiteline, testausmenetelmät

Testitelineen kokoonpano
prosessori	Intel Core i7-5960X @ 4GHz (100×40)
Emolevy	ASUS RAMPAGE V EXTREME
RAM	Corsair Vengeance LPX, 2133 MHz, 4 × 4 Gt
ROM	Intel SSD 520 240 Gt + Crucial M550 512 Gt
Virtalähde	Corsair AX1200i 1200W
CPU jäähdytysjärjestelmä	Thermalright Archon
Kehys	CoolerMaster Test Bench V1.0
Monitori	NEC EA244UHD
Käyttöjärjestelmä	Windows 10 Pro x64
AMD GPU ohjelmisto
Kaikki	Radeon Software Crimson Edition 16.8.2 Ei-WHQL
NVIDIA GPU -ohjelmisto
Kaikki	GeForce Game Ready -ohjain 372.54 WHQL

CPU toimii vakiotaajuudella. NVIDIA-ohjainasetuksissa prosessori on valittu PhysX-laskennan prosessoriksi. AMD-ohjainasetuksissa Tesselation-asetus on siirretty AMD Optimized -asetuksesta Käytä sovellusasetuksia.

Vertailuarvot: pelit
Peli (julkaisupäivän järjestyksessä)	API	asetukset	Koko näytön anti-aliasing
Peli (julkaisupäivän järjestyksessä)	API	asetukset	1920×1080 / 2560×1440	3840×2160
Crysis 3 + FRAPS	DirectX 11	Max. laatu. Swamp-tehtävän alku	MSAA 4x	Vinossa
Battlefield 4 + FRAPS		Max. laatu. Tashgar-tehtävän alku	MSAA 4x + FXAA High
Metro: Last Light Redux, sisäänrakennettu vertailukohta		Max. laatu	SSAA 4x
GTA V, sisäänrakennettu benchmark		Max. laatu	MSAA 4x + FXAA
DiRT ralli		Max. laatu	MSAA 4x
Rise of the Tomb Raider, sisäänrakennettu vertailukohta	DirectX 12	Max. laatu, VXAO pois päältä	SSAA 4x
Tom Clancy's The Division, sisäänrakennettu benchmark	DirectX 11	Max. laatu, HFTS pois päältä	SMAA 1x Ultra
HITMAN, sisäänrakennettu benchmark	DirectX 12	Max. laatu	SSAA 4x
Ashes of the Singularity, sisäänrakennettu benchmark	DirectX 12	Max. laatu	MSAA 4x + Temporaalinen AA 4x
DOOM	Vulkan	Max. laatu. Mission valimo	TSSAA 8TX
Total War: WARHAMMER, sisäänrakennettu vertailukohta	DirectX 12	Max. laatu	MSAA 4x

Vertailuarvot: videon dekoodaus, tietojenkäsittely
Ohjelmoida	asetukset
DXVA Checker, Decode Benchmark, H.264	Tiedostot 1920 × 1080p (High Profile, L4.1), 3840 × 2160p (High Profile, L5.1). Microsoft H264 videodekooderi
DXVA Checker, Decode Benchmark, H.265	Tiedostot 1920 × 1080p (pääprofiili, L4.0), 3840 × 2160p (pääprofiili, L5.0). Microsoft H265 videodekooderi
LuxMark 3.1x64	Hotel Lobby Stage (monimutkainen vertailuarvo)
Sony Vegas Pro 13	Sonyn vertailukohta Vegas Pro 11:lle, kesto 65 s, renderöity XDCAM EX:llä, 1920×1080p 24Hz
SiSoftware Sandra 2016 SP1, GPGPU tieteellinen analyysi	OpenCL, FP32/FP64
CompuBench CL Desktop Edition X64, Ocean Surface Simulation	—
CompuBench CL Desktop Edition X64, hiukkassimulaatio – 64K	—

⇡ Testin osallistujat

Seuraavat näytönohjaimet osallistuivat suorituskykytestaukseen:

NVIDIA TITAN X (1417/10000 MHz, 12 Gt);

⇡ Esitys: 3DMark

Synteettiset testit osoittavat TITAN X:n keskimääräisen edun GeForce GTX 1080:een verrattuna 25 %. Verrattuna edelliseen TITAN-tuotemerkin sukupolveen sekä Radeon R9 Fury X:ään, uusi lippulaiva tarjoaa 61-63% paremman suorituskyvyn ja yli kaksinkertaisen suorituskyvyn verrattuna Kepler-arkkitehtuuriin perustuvaan TITANin ensimmäiseen versioon. Melko korkealla asemalla verrattuna NVIDIA-kiihdytin on Radeon R9 295X2 - uusi tuote on vain 18% nopeampi 3DMarkissa.

3DMark (grafiikkapisteet)
	Lupa
tulilakko	1920×1080	26 341	10 449	17 074	21 648	23 962	16 279
Fire Strike Extreme	2560×1440	13 025	4 766	7 945	10 207	10 527	7 745
Fire Strike Ultra	3840×2160	6 488	2 299	4 011	4 994	5 399	3 942
ajan vakooja	2560×1440	8 295	2 614	4 935	6 955	7 186	5 084
Max.			−60%	−35%	−16%	−9%	−38%
Keskiverto			−64%	−38%	−20%	−15%	−39%
Min.			−68%	−41%	−23%	−19%	−41%

⇡ Suorituskyky: pelaaminen (1920×1080, 2560 × 1440)

Testeissä suhteellisen alhaisella resoluutiolla niin tehokkaalle GPU:lle, uusi TITAN X ylittää GeForce GTX 1080:n 15-20 % (1080p:stä 1440p:hen vastaavasti) keskimääräisillä tuloksilla. Uusi lippulaiva näyttää vieläkin vaikuttavammalta verrattuna 28 nm jakson parhaisiin kiihdyttimiin: se on 47-56 % nopeampi kuin GM200:een perustuva GeForce GTX TITAN X ja 67-72 % Radeon R9 Fury X:ää nopeampi.

Jos otamme Kepler-sukupolven aivan ensimmäisen TITANin, puhumme yli kaksinkertaisesta suorituskyvyn kasvusta.

1920×1080
	Koko näytön anti-aliasing	NVIDIA TITAN X (1417/10000MHz, 12GB)	NVIDIA GeForce GTX TITAN (837/6008MHz, 6GB)	NVIDIA GeForce GTX TITAN X (1000/7012MHz, 12GB)	NVIDIA GeForce GTX 1080 (1607/10008 MHz, 8 Gt)	AMD Radeon R9 295X2 (1018/5000MHz, 8GB)	AMD Radeon R9 Fury X (1050/1000MHz, 4GB)
Ashes of the Singularity	MSAA 4x	47	20	31	42	34	26
Taistelukenttä 4	MSAA 4x + FXAA High	162	71	118	149	134	94
Crysis 3	MSAA 4x	99	45	65	79	90	60
DiRT ralli	MSAA 4x	126	57	83	101	97	65
DOOM	TSSAA 8TX	200	69	151	185	122	156
GTA V	MSAA 4x + FXAA	85	44	68	84	76	52
HITMAN	SSAA 4x	68	21	39	52	24	33
Metro: Last Light Redux	SSAA 4x	124	47	73	92	94	70
Tomb Raiderin nousu	SSAA 4x	70	28	47	62	55	41
Tom Clancy's The Division	SMAA 1x Ultra	87	35	59	80	57	58
Total War: WARHAMMER	MSAA 4x	76	38	56	73	37	49
Max.			−48%	−20%	−0%	−9%	−22%
Keskiverto			−58%	−32%	−13%	−29%	−40%
Min.			−69%	−43%	−26%	−65%	−51%

2560×1440
	Koko näytön anti-aliasing	NVIDIA TITAN X (1417/10000MHz, 12GB)	NVIDIA GeForce GTX TITAN (837/6008MHz, 6GB)	NVIDIA GeForce GTX TITAN X (1000/7012MHz, 12GB)	NVIDIA GeForce GTX 1080 (1607/10008 MHz, 8 Gt)	AMD Radeon R9 295X2 (1018/5000MHz, 8GB)	AMD Radeon R9 Fury X (1050/1000MHz, 4GB)
Ashes of the Singularity	MSAA 4x	39	16	24	33	27	21
Taistelukenttä 4	MSAA 4x + FXAA High	109	47	75	98	95	65
Crysis 3	MSAA 4x	63	27	40	53	59	39
DiRT ralli	MSAA 4x	93	40	60	74	71	48
DOOM	TSSAA 8TX	166	45	95	126	82	107
GTA V	SMAA	67	31	48	63	61	39
HITMAN	MSAA 4x + FXAA	43	13	24	33	12	17
Metro: Last Light Redux	SSAA 4x	71	26	43	52	54	43
Tomb Raiderin nousu	Ei tueta	44	16	28	38	23	27
Tom Clancy's The Division	SSAA 4x	63	24	43	58	45	44
Total War: WARHAMMER	SMAA 1x korkea	57	26	39	50	25	34
Max.			−53%	−29%	−6%	−6%	−30%
Keskiverto			−61%	−36%	−16%	−33%	−42%
Min.			−73%	−44%	−27%	−72%	−60%

merkintä:

⇡ Suorituskyky: pelaaminen (3840×2160)

Kun siirrytään 1440p:stä 4K:han, NVIDIA-näytönohjainkorttien välinen suhde pysyy samana. TITAN X on 20 % nopeampi kuin GeForce GTX 1080 ja 56 % nopeampi kuin Maxwell-pohjainen TITAN X.

Tälle mallille tyypillinen Radeon R9 Fury X selviytyy tehokkaammin 4K-testeistä, mikä lopulta laski "Titanin" edun 56 prosenttiin.

3840×2160
	Koko näytön anti-aliasing	NVIDIA TITAN X (1417/10000MHz, 12GB)	NVIDIA GeForce GTX TITAN (837/6008MHz, 6GB)	NVIDIA GeForce GTX TITAN X (1000/7012MHz, 12GB)	NVIDIA GeForce GTX 1080 (1607/10008 MHz, 8 Gt)	AMD Radeon R9 295X2 (1018/5000MHz, 8GB)	AMD Radeon R9 Fury X (1050/1000MHz, 4GB)
Ashes of the Singularity	Vinossa	45	20	29	41	38	37
Taistelukenttä 4		84	35	57	74	72	52
Crysis 3		42	18	28	36	40	29
DiRT ralli		65	26	41	50	48	33
DOOM		92	24	51	68	45	57
GTA V		55	25	39	51	49	34
HITMAN		67	21	38	53	24	33
Metro: Last Light Redux		64	23	38	47	47	38
Tomb Raiderin nousu		50	19	33	44	37	31
Tom Clancy's The Division		38	15	25	33	26	28
Total War: WARHAMMER		43	20	30	38	20	32
Max.			−53%	−29%	−7%	−5%	−18%
Keskiverto			−61%	−36%	−16%	−29%	−36%
Min.			−74%	−45%	−27%	−64%	−51%

merkintä: Total War: WARHAMMER ei tue DirectX 12:ta GeForce GTX TITANille.

⇡ Suorituskyky: videon dekoodaus

GP102 integroi saman laitteistokoodekin kuin kaksi Pascal-perheen nuorempaa GPU:ta, joten TITAN X esittelee H.264- ja HEVC-standardien dekoodausnopeutta GeForce GTX 1080:n kanssa, ja se on säädetty alhaisemmille GPU-kellonopeuksille. Pascalin suorituskyky tässä tehtävässä on lyömätön sekä Maxwell-sirujen NVIDIA-koodekkeihin että AMD Polariksen koodekkeihin verrattuna.

merkintä: koska dekooderit eivät yleensä eroa saman GPU-linjan sisällä, kaavioissa näkyy yksi laite jokaisesta perheestä (tai useampi, jos tätä sääntöä rikotaan).

Merkintä. 2: GeForce GTXTITAN X, kuten muutkin Maxwell GPU -arkkitehtuuriin perustuvat laitteet, paitsi GM204 (GeForce GTX 950/960), suorittaa osittaisen H.265-laitteiston dekoodauksen CPU-resurssien varmuuskopioituna.

⇡ Suorituskyky: Tietotekniikka

GPGPU-tehtävien eri arkkitehtuurien välinen suhde riippuu kunkin sovelluksen erityispiirteistä. TITAN X tarjoaa ennustettavia suorituskyvyn lisäyksiä GeForce GTX 1080:een verrattuna, mutta on poikkeustapauksia, joissa tehtävä riippuu GPU:n taajuudesta (kuten hiukkasfysiikan testi CompuBench CL:ssä ja renderöinti Sony Vegasissa): tässä etu on GTX 1080:n puolella. Päinvastoin, uusi TITAN X kosti tilanteessa, jossa GeForce GTX 1080 on huonompi kuin Maxwell-pohjainen TITAN X ja Radeon R9 Fury X (säteilynseuranta LuxMarkissa).

SiSoftware Sandran Matriisikerto- ja Fast Fourier Transform -testissä TITAN X on erinomainen FP32-tilassa. Mitä tulee FP64:ään, yksinkertaisesti raa'an voiman (suuri määrä CUDA-ytimiä ja korkeat kellotaajuudet) vuoksi kiihdytin saavutti paremman suorituskyvyn kuin Kepler-sukupolven alkuperäinen TITAN ja Radeon R9 Fury X - näytönohjaimet, joilla on edullisempi suhde. suorituskykyä FP32:n ja FP64:n kanssa. Tämä ei lopulta poista TITAN X:ää täysin kaksinkertaisena tarkkuuden tehtävien kiihdyttimenä. Radeon R9 295X2 sopii kuitenkin parhaiten tähän tarkoitukseen. AMD-näytönohjainkorteilla on vahva asema myös joissakin muissa testeissä: CompuBench CL:n vedenpinnan laskennassa ja Sony Vegasissa.

⇡ Kellonopeudet, virrankulutus, lämpötila, ylikellotus

Pelikuormituksella TITAN X GPU saavuttaa ajoittain samat korkeat kellotaajuudet kuin GTX 1080:n GP104 (1848 vs. 1860 MHz), mutta suurimman osan ajasta se pysyy huomattavasti alhaisemmalla alueella (1557-1671 MHz). Samaan aikaan GPU:n maksimisyöttöjännite on 1,062 V (1,05 V GTX 1080:ssa).

CO-puhallin pyörii jopa 2472 rpm:n nopeudella. Kortti vaatii vahvempaa jäähdytystä kuin GTX 1080, ja koska coolerin muotoilu on pysynyt ennallaan, se aiheuttaa enemmän kohinaa. Tämän tekijän kompensoimiseksi TITAN X:lle on asetettu 3 °C korkeampi GPU-tavoitelämpötila.

Vaikka Pascal-pohjaisella TITAN X:llä on teknisesti sama TDP kuin edellisen sukupolven TITAN X:llä, käytännössä uudella näytönohjaimella varustettu järjestelmä kehittää huomattavasti enemmän tehoa (49 W). Kuitenkin lisääntynyt kuormitus prosessorille, joka palvelee tehokkaampaa näytönohjainta, voi kuitenkin vaikuttaa tähän. Toisaalta FurMarkissa kaikki 250 W:n TDP-kiihdyttimet (samoin kuin 275 W Fury X) ovat samalla tasolla.

Titanin ylikellottamiseksi hyödynsimme varastokykyä nostaa näytönohjaimen tehorajaa 20 %, käyttää CO-turbiinia täydellä nopeudella (4837 rpm) ja nostaa GPU:n maksimijännitteen 1,093 V:iin (sama arvo kuin GTX 1080:ssa). Tämän seurauksena pystyimme nostamaan GPU:n perustaajuuden 200 MHz 1617 MHz:iin ja tehollisen muistitaajuuden 11100 MHz:iin.

Pelkästään tämä ei ole huono niin suurelle sirulle, mutta korotettu tehoraja ei ole vähemmän tärkeä. Ylikellotettu grafiikkasuoritin tukee taajuuksia alueella 1974-1987 MHz, huippuna 2063 MHz, mikä ei ole vähempää kuin hämmästyttävä saavutus. Vertailun vuoksi: GTX 1080 -esiintymämme GPU:n huipputaajuus ylikellotuksen aikana oli 2126 MHz.

Ylikellotetulla TITAN X:llä varustettu järjestelmä tuottaa 46 W enemmän tehoa kuin tavallinen näytönohjain. Suurimpaan nopeuteen nostettu tuuletin alensi grafiikkasuorittimen lämpötilaa 17-20 °C, mikä antaa käyttäjille mahdollisuuden odottaa yhtä tehokasta ylikellotusta pienemmillä nopeuksilla, mikä tarjoaa suhteellisen mukavan melutason.

⇡ Suorituskyky: ylikellotus

TITAN X:n ylikellotus mahdollistaa erittäin merkittävän suorituskyvyn kasvun - 14 % 3DMarkissa ja 18-23 % pelien vertailuarvoissa 1080p- ja 1440p-resoluutioilla. Pelissä 4K-resoluutiolla bonus on 26%.

Ero ylikellotetun TITAN X:n ja referenssitaajuuksilla toimivan GeForce GTX 1080:n välillä saavuttaa järkyttävät arvot 36%, 47% ja 50% kolmella käyttämämme resoluutiolla. Tietysti myös GTX 1080 itsessään on ylikellotuksen alainen, mutta kuten muistamme vertailunäytönohjaimen katsauksestamme, tämä lisää vain 9, 13 ja 12% tuloksiin. Siten, jos vertaamme GeForce 10 -linjan ylikellotettua lippulaivaa ja ylikellotettua TITAN X:ää, jälkimmäisen etu on 25, 30 ja 34%.

Käyttämällä vanhoja ylikellotettuja GeForce GTX TITAN X GM200 -sirun suorituskykytietojamme teemme samanlaisia laskelmia vertaillaksemme kahta Titan-sukupolvea. Pascalin ylikellotettu TITAN X on edeltäjäänsä 75, 93 ja 97 % edellä. Kun molemmat kiihdyttimet ylikellotetaan, uutuus säilyttää 74 ja 70 % johtoaseman 1440p- ja 2160p-resoluutioilla. Me (kuten tätä päätöstä kritisoivat lukijat muistavat) kieltäytyimme testaamasta 1080p-tilassa GeForce GTX TITAN X -katsauksessa.

3DMark (grafiikkapisteet)
	Lupa	NVIDIA GeForce GTX 1080 (1607/10008 MHz, 8 Gt)	NVIDIA TITAN X (1417/10000MHz, 12GB)
tulilakko	1920×1080	21 648	26 341	31 038
Fire Strike Extreme	2560×1440	10 207	13 025	15 191
Fire Strike Ultra	3840×2160	4 994	6 488	7 552
ajan vakooja	2560×1440	6 955	8 295	8 644
Max.			+30%	+51%
Keskiverto			+25%	+42%
Min.			+19%	101	126	126
DOOM	TSSAA 8TX	185	200	200
GTA V	MSAA 4x + FXAA	84	85	96
HITMAN	SSAA 4x	52	68	77
Metro: Last Light Redux	SSAA 4x	92	124	140
Tomb Raiderin nousu	SSAA 4x	62	70	94
Tom Clancy's The Division	SMAA 1x Ultra	80	87	117
Total War: WARHAMMER	MSAA 4x	73	76	88
Max.			+35%	+57%
Keskiverto			+16%	+36%
Min.			+0%	+8%

TITAN X on sijoitettu ensisijaisesti GPGPU-tehtäväkiihdyttimeksi, jonka joukossa koneoppiminen on etusijalla tukemalla int8-numeromuotoa GP102:ssa nopeudella 4:1 verrattuna FP32-toimintoihin. Useimmissa FP32-pohjaisissa laskentasovelluksissa TITAN X tarjoaa myös suorituskyvyn johtavan suorituskyvyn verrattuna mihin tahansa aiemmin julkaistuun peli- ja prosumer-luokan kiihdytin.

Älä vähättele kaksinkertaisen tarkkuuden toimintoa. Vaikka grafiikkasuorituksiin perustuvilla korteilla, kuten NVIDIAn GK110/210 ja AMD:n Tahiti ja Hawaii, on parempi FP32-FP64-suhde TITAN X:ään verrattuna, se saavuttaa ainakin kilpailukykyisiä tuloksia tässä kategoriassa edistyneen valmistusprosessinsa ansiosta. , joka toimitti näytönohjaimen. korkealla kellotaajuudella ja valtavalla valikoimalla CUDA-ytimiä.

Sivustollemme uusi TITAN X on kiinnostava ensisijaisesti pelinäytönohjaimena. Tässä ominaisuudessa uutuus tekee kaksinkertaisen vaikutelman. Toisaalta 15-20 prosentin etu GeForce GTX 1080:een verrattuna pelien vertailuarvoissa ei oikeuta ostajan näkökulmasta mallin näin korkeaa hintaa (1200 dollaria) ja lisäksi ei silti salli monien ajoa. nykyaikaisista peleistä 4K-resoluutiolla maksimaalisilla grafiikanlaadun asetuksilla mukavalla kuvanopeudella (60 FPS).

Toisaalta NVIDIAn 250 W TDP-raja ei selvästikään vastaa GPU:n ominaisuuksia. Ylikellotettuna TITAN X saavuttaa helposti yli 2 GHz:n taajuudet ja tarjoaa lopulta 34 % nopeamman suorituskyvyn kuin (myös ylikellotettu) GeForce GTX 1080 4K-tilassa. Itse asiassa ylikellotus tekee TITAN X:stä ensimmäisen pelinäytönohjaimen, joka sopii ehdottomasti tällaisiin asetuksiin.

2560×1440
	Koko näytön anti-aliasing	NVIDIA GeForce GTX 1080 (1607/10008 MHz, 8 Gt)	NVIDIA TITAN X (1417/10000MHz, 12GB)	NVIDIA TITAN X (1617/11110MHz, 12GB)
Ashes of the Singularity	MSAA 4x	33	39	48
Taistelukenttä 4	MSAA 4x + FXAA High	98	109	146
Crysis 3	MSAA 4x	53	63	81
DiRT ralli	MSAA 4x	74	93	93
DOOM	TSSAA 8TX	126	166	183
GTA V	SMAA	63	67	86
HITMAN	MSAA 4x + FXAA	33	43	49
Metro: Last Light Redux	SSAA 4x	52	71	82
Tomb Raiderin nousu	Ei tueta	38	44	59
Tom Clancy's The Division	SSAA 4x	58	63	86
Total War: WARHAMMER	SMAA 1x korkea	50	57	74
Max.			+36%	+58%
Keskiverto			+20%	+47%
Min.
DOOM	68	92	104
GTA V	51	55	75
HITMAN	53	67	77
Metro: Last Light Redux	47	64	74
Tomb Raiderin nousu	44	50	69
Tom Clancy's The Division	33	38	52
Total War: WARHAMMER	38	43	58
Max.			+37%	+59%
Keskiverto

Nimi- ing	Radeon R9 290X	Radeon R9 295x2	GeForce GTX 780 Ti	GeForce GTX Titan	GeForce GTX Titan Musta	GeForce GTX Titan Musta Z	GeForce GTX 980	GeForce GTX Titan X
koodinimi	Hawaii XT	Hawaii XT	GK110	GK110	GK110	GK110	GM204	GM200
Versio	GCN 1.1	GCN 1.1	Kepler	Kepler	Kepler	Kepler	Maxwell 2.x	Maxwell 2.x
Prosessitekniikka, nm	28	28	28	28	28	28	28	28
Sydämen koko/hylsyt, mm 2	438	438x2	521	521	521	521x2	398	–
Transistorien lukumäärä, milj	6200	6200x2	7100	7100	7100	7100x2	5200	8000
Ydintaajuus, MHz	–	–	880	840	890	700	1126	1000
Ydintaajuus (Turbo), MHz	1000	1018	930	880	980	880	1216	1075
Varjostimien lukumäärä (PS), kpl.	2816	5632	2880	2688	2880	5760	2048	3072
Tekstuuriyksiköiden lukumäärä (TMU), kpl.	176	352	240	224	240	480	128	192
Rasterointilohkojen lukumäärä (ROP), kpl.	64	128	48	48	48	96	64	96
Suurin täyttönopeus, Gpix/s	64	130	42	40.2	42.7	84.6	72	–
Suurin tekstuurin hakunopeus, Gtex/s	176	358	210.2	187.5	213.4	338	144.1	192
Muistin tyyppi	GDDR5	GDDR5	GDDR5	GDDR5	GDDR5	GDDR5	GDDR5	GDDR5
Tehokas muistitaajuus, MHz	5000	5000	7000	6000	7000	7000	7000	7000
Muistin koko, GB	4	4 + 4	3	6	6	6 + 6	4	12
Muistiväylä, vähän	512	512 + 512	384	384	384	384 + 384	256	384
Muistin kaistanleveys, GB/s	320	320 + 320	336	288.4	336	336 + 336	224.3	336.5
Virta, Pin-liittimet	6 + 8	8 + 8	6 + 8	6 + 8	6 + 8	8 + 8	6 + 6	6 + 8
Virrankulutus (2D / 3D), wattia	-/290	-/500	-/250	-/250	-/250	-/375	-/165	-/250
CrossFire/Sli	V	V	V	V	V	V	V	V
Ilmoitushinta, $	550	1500	700	1000	1000	3000	550	999
Vaihdettava malli	–	HD 7990	GTX 780	–	GTX Titan	GTX 690	GTX 780 Ti	Titan Black

Ja nyt puhutaan hinnasta ja Venäjän todellisuudesta, koska taulukko näyttää näytönohjaimen arvioidut kustannukset. Loppujen lopuksi, ilmoituksesta huolimatta, Nvidia ei ollut kirjoittamishetkellä vielä viimeistellyt hintalappua, joten arvioijat voivat vain arvailla. Ilman tällaista tietoa on vaikea tehdä johtopäätöksiä.

Oletettavasti uusien tuotteiden tavoitehinta on 1000-1300 dollaria. Oletetaan, että se maksaa tasan tuhat dollaria. Kaupoissa tällainen hintalappu muunnetaan vähintään 65 000 ruplaksi, mikä kaventaa automaattisesti potentiaalisten kuluttajien piirin yhteen tai kahteen henkilöön kuukaudessa. Samaan aikaan korkea dollarin vaihtokurssi tyrmäsi sekä GeForce GTX 970:n että GeForce GTX 980:n ostajilta - ne kaikki ovat nyt yksinkertaisesti tavallisen pelaajan ulottumattomissa. Ja kyllä, GeForce GTX Titan X tulee olemaan nopea.

Näiden tapahtumien valossa monet käyttäjät joko eivät halua päivittää ollenkaan tai säästävät rahaa ja ostavat käytetyn mallin, mikä on varsin loogista ja perusteltua. Tämä tarkoittaa, että useimmat harrastajat näkevät GeForce GTX Titan X:n arvostelun joukona suuria lukuja.

Uudet 3D-tekniikat

VXGI-tuen, erilaisten anti-aliasing-menetelmien, tavallisen GPU Boostin ja monen muun lisäksi GeForce GTX Titan X, kuten kaikki aiemmat Nvidia-näytönohjaimet, alkaa vähitellen valmistautua 3D-virtuaalitodellisuuslaseihin. Suurin ongelma olemassa olevissa 3D-laitteissa on korkea vasteaika. Yhteenvetona voidaan todeta, että tällä käsitteellä tarkoitamme matriisin vasteaikaa, gyroskooppien vasteaikaa, graafisen tiedon välittymisaikaa kaasupolkimelta lasille. Oculus on edistynyt tänä vuonna paljon, mihin on auttanut DirectX 12:n julkistus, mutta grafiikan kehittäjiltä ei odoteta vähemmän työtä.

Juuri tämän Nvidia on tehnyt ja optimoinut ohjelmistoa. Vaikka en ole varma, vaikuttaako tämä koko mallivalikoimaan, todennäköisesti innovaatiot, vaikkakin ohjelmistolliset, vaikuttavat vain viimeiseen sukupolveen. Ja mikä itse asiassa on ongelma? Oculus-tekniikka on yksi näyttölähde, joka on jaettu kahteen näkyvään vyöhykkeeseen. Tämänhetkinen tilanne kypärässä olevan kuvan korkean renderointiviiveen vuoksi saa ihmisen huimausta ja usein pahoinvointia. Kuvittele olevasi "pyörtynyt", juuri siltä tunnet 10-30 minuutin kuluttua minkä tahansa dynaamisen pelin pelaamisesta Oculus-laseilla.

VR SLI - kaksi näytönohjainta toimii erikseen kummallakin silmällä laseissa. Yleinen nopeus kasvaa, mikä vähentää huimausta.
Asynkroninen tila yhdelle näytönohjaimelle. Tiedot gyroskoopeista välitetään grafiikkakiihdytin, ja seuraava kehys lasketaan vain osittain uudelleen, mikä säästää järjestelmäresursseja.

Kuinka paljon innovaatiot parantavat tuntemuksia, on vaikea vastata, ainakin ennen kuin itse tarkistat sen. Valitettavasti tiedotushetkellä lehdistöllä ei ollut kypäriä, joten voimme vain luottaa siihen.

Nvidia GeForce GTX Titan X arvostelu

Ulkonäkö ja mitat

Edellinen viesti

Kuvaus korvattomasta. Hahmon historia. Yritetään helpottaa ihmisiä

Seuraava postaus

NVIDIA TITAN X Super Graphics Card Review and Test: Ylivertaisuuden osoittaminen

Kaikki oikeudet pidätetään 2022

Ylös

Titan x kartta. NVIDIA TITAN X Super Graphics Card Review and Test: Ylivertaisuuden osoittaminen