Titan x kartta. NVIDIA TITAN X Super Graphics Card Review and Test: Ylivertaisuuden osoittaminen
Kevät ei ole vain luonnon heräämisen aikaa, vaan myös Titan-linjan lippulaivan yksisiruisen näytönohjaimen perinteisen julkistamisen aika. Ja vaikka NVIDIA GeForce GTX Titan X:n ensimmäinen esittely oli odottamaton, tätä ilmoitusta ympäröi useita huhuja. Pari päivää sitten oli tämän videokortin virallinen esittely, usean päivän ajan meillä oli mahdollisuus tutkia sitä yksityiskohtaisesti. Mistä hän voi ylpeillä, katsotaanpa lisää.
NVIDIA GeForce GTX Titan X:stä tuli sarjan neljäs ja kolmas "titaani" yksisiruisessa järjestelmässä. Haluan muistuttaa, että GeForce GTX Titan Z kahdella GPU:lla erottuu toisistaan. Tietenkin ymmärrämme, että tällaisia järjestelmiä ei voida kutsua "suosituiksi", mutta jopa 1000-1300 dollarin puuttuessa tämä katsastus voi olla mielenkiintoista tutustua Maxwell-arkkitehtuuriin sen maksimaalisessa toteutuksessa tänään. Kuten odotettiin, se perustuu GM200-ytimeen, tämän arkkitehtuurin toiseen sukupolveen. Sen mukana tulee PolyMorph Engine 3.0, joka tukee ominaisuustason Direct3D 12:ta ja laitteistokiihdytettyä maailmanlaajuista valaistustekniikkaa. Ehkä tämä on se läpimurto realismissa ja grafiikassa, jota peliteollisuus on odottanut niin kauan?
GM200 sisältää 8 miljardia transistoria, 256 ROP:ta, 3072 CUDA:ta ja 384-bittisen muistiväylän. Kaikki nämä aseet on tarkoitettu tukemaan 4K-resoluutiota ja parantamaan 3D-suorituskykyä. Perusydintaajuus on: 1000 MHz, Boost Clock - 1076 MHz. Muisti toimii 7012 MHz taajuudella. Laitteessa on 12 Gt näytönohjainmuistia, joka ei ollut käytettävissä pelaajille suunnatuissa näytönohjaimissa ennen Titan X:n julkaisua.
Videoarvostelu NVIDIA GeForce GTX Titan X
Ulkomuoto
NVIDIA GeForce GTX Titan X ei tullut vallankumoukseksi huippuluokan näytönohjainten suunnittelussa, ulkonäkö on muuttunut vähän. Käytetään ilmajäähdytysjärjestelmää, joka ulkoisesti toistaa aiemmin näkemämme.
Muokkaukset ovat pieniä, ne rajoittuvat rungon värin muutokseen. Nyt se on melkein kokonaan maalattu mustaksi.
Näytönohjain on vailla vahvistinlevyä painetun piirilevyn takana. Haluan muistuttaa, että se oli GeForce GTX 980:n referenssisuunnittelussa.
Takapaneelissa näkyy: kolme DisplayPort, HDMI ja DVI. Kolme liitintä voi toimia jaetussa työtilassa, mutta voit yhdistää kaikki 5 liitintä samanaikaisesti. Samaa lähestymistapaa sovelletaan koko 900-linjalla.
Valoisa NVIDIA GeForce GTX -logo sivulla. Valitettavasti upeat kuvat hehkuvasta tuulettimesta ovat vain valokuvia.
Jäähdytys
Asennetun jäähdytysjärjestelmän rakenne toistaa GeForce GTX 780 Ti:ssä käytettyä.
Käytössä on haihdutuskammio, joka osoittautui vahvaksi puolelle siirrettäessä suurta lämpöä jäähdyttimeen.
Järjestelmä on kokoontaitettava, joten voit irrottaa lämmönhajottimen kokonaan, se voi olla hyödyllinen vesijäähdytysjärjestelmän asennuksessa.
Täyte
Myös sähköjärjestelmä siirtyi muutoksesta mainitsemisesta huolimatta, tarkastuksessa on kaikki samat kondensaattorit ja kuristimet. Jopa PWM-ohjain on meille tuttu - NCP4206.Mutta en ala dramatisoimaan, me itse emme löytäneet sitä melua ja vinkua, jotka mainittiin useiden videokorttien kommenteissa, edes pitkäaikaisessa kuormituksessa.
Myös jännitteen nostotanko on säilynyt. NVIDIA GeForce GTX Titan X:ssä sitä voidaan kasvattaa 25 W:iin (TDP 250W/275W).
SKhynix-muistisiruja, joiden taajuus on 1750 MHz, juotetaan 12 Gt, niitä on yhteensä 24 kappaletta.
Testataan NVIDIA GeForce GTX Titan X
Käytettiin testitelinettä.
Malli | Data |
---|---|
Kehys | Aerocool Strike-X Air |
Emolevy | Biostar Hi-Fi Z87X 3D |
prosessori | Intel Core i5-4670K Haswell |
CPU-jäähdytin | Deep Cool Ice Blade Pro v2.0 |
näytönohjain | Inno3D iChill GeForce GTX 780Ti HerculeZ X3 Ultra |
RAM | Corsair CMX16GX3M2A1600C11 DDR3-1600 16GB Kit CL11 |
HDD | ADATA XPG SX900 256 Gt |
Kiintolevy 2 | WD punainen WD20EFRX |
Virtalähde | Aerocool Templarius 750W |
wifi sovitin | TP-LINK TL-WDN4800 |
Audio | Creative Sound Blaster EVO Wireless |
Monitori | iiyama ProLite E2773HDS |
Näyttö 2 | Philips 242G5DJEB |
hiiri | ROCCAT Kone XTD |
Näppäimistö | Razer BlackWidow Chroma |
Stabilisaattori | Sven AVR PRO LCD 10000 |
Käyttöjärjestelmä | Microsoft Windows Ultimate 8 64-bittinen |
Kaikissa alla olevissa taulukoissa tiedot on annettu tehdasasetuksia käyttäen, valmistajien omaa ohjelmistoa ei ole asennettu. Myöskään muistiin ja ydintaajuuksiin ei vaikuteta, jotta ulkopuolisten tekijöiden vaikutus voidaan sulkea pois.
1. Näytönohjaimen lämpötila
- NVIDIA GeForce GTX Titan X - 31/83
- Inno3D iChill GeForce GTX 960 Ultra - 29/44
- GeForce GTX 980 - 34/79
- GeForce GTX 770 - 35/80
- GeForce GTX 780 - 35/77
- GeForce GTX 760 - 35/84
2. Melu
- NVIDIA GeForce GTX Titan X - 36/42
- GeForce GTX 980 - 34/79
3. Virrankulutus
- NVIDIA GeForce GTX Titan X-405
- Inno3D iChill GeForce GTX 960 Ultra - 260
- GeForce GTX 980-295
- Inno3D iChill GeForce GTX 780Ti HerculeZ X3 Ultra - 340
- NVIDIA GeForce GTX Titan X - 7133
- Inno3D iChill GeForce GTX 960 Ultra - 3522
- GeForce GTX 980-6050
- Inno3D iChill GeForce GTX 780Ti HerculeZ X3 Ultra - 6190
On näyttävimpien testien, FPS-mittausten aika resurssiintensiivisissä peleissä. Seuraamme useita pöytiä visuaalisilla videoilla pelin aikana. Tiedot tallennetaan Full HD -resoluutiolla Ultra-asetuksissa. On syytä ottaa huomioon, että joissain videoissa todelliset FPS-tiedot ovat alhaisemmat kuin testiajojen aikana saadut, tämä johtuu videotallennusresurssien kustannuksista. Tämän näytönohjaimen osalta testasimme erikseen työn 3840x2160 resoluutiolla Ultra-asetuksissa.
6. Crysis 3
Crysis 3 - 3840x2160 - Erittäin korkea 4xAA - 22.
- Inno3D iChill GeForce GTX 960 Ultra - 45
- GeForce GTX 980-69
- Inno3D iChill GeForce GTX 780Ti HerculeZ X3 Ultra - 61
- GeForce GTX 770-43
- GeForce GTX 780-47
7. Battlefield 4
Battlefield 4 - 3840x2160 - Ultra - 39
- NVIDIA GeForce GTX Titan X-75
- Inno3D iChill GeForce GTX 960 Ultra - 52
- GeForce GTX 980-91
- Inno3D iChill GeForce GTX 780Ti HerculeZ X3 Ultra - 82
8. Hitman: Absolution
Erittäin vaativa peli, joka perustuu Glacier 2 -moottoriin. Pelin ruokahalu on kateus vuoden muista uusista julkaisuista.
Hitman: Absolution - 3840x2160 - korkea, 2x MSAA, 16x AF - 46
- NVIDIA GeForce GTX Titan X-95
- Inno3D iChill GeForce GTX 960 Ultra - 44/li>
- GeForce GTX 980-70
- Inno3D iChill GeForce GTX 780Ti HerculeZ X3 Ultra - 62
- GeForce GTX 770-43
- GeForce GTX 780-55
- GeForce GTX 760-41
9. Metro Last Light
Toinen laitteistoa vaativa peli, joka käyttää DirectX 11:tä ja tessellaatiota.
Metro Last Light - 3840x2160 - Erittäin korkea - 35
10 Keskimaa: Varjo Mordor
- Inno3D iChill GeForce GTX 960 Ultra - 51
- GeForce GTX 980-111
11. Tomb Raider
- NVIDIA GeForce GTX Titan X - 156
- Palit GeForce GTX 960 Super JetStream - 64
- Inno3D iChill GeForce GTX 960 Ultra - 68
- GeForce GTX 980-100
12. Watch Dogs Ultra 4x AA
- NVIDIA GeForce GTX Titan X-80
- Inno3D iChill GeForce GTX 960 Ultra - 49
- GeForce GTX 980-62
13. Total War: Rome II Extreme
- NVIDIA GeForce GTX Titan X-79
- Inno3D iChill GeForce GTX 960 Ultra - 41
- GeForce GTX 980-70
14. GRID Autosport Ultra 4x MSAA
- NVIDIA GeForce GTX Titan X - 154
- Inno3D iChill GeForce GTX 960 Ultra - 80
- GeForce GTX 980-128
15. World of Tanks
- NVIDIA GeForce GTX Titan X - 124
- Palit GeForce GTX 960 Super JetStream - 71
- Inno3D iChill GeForce GTX 960 Ultra - 75
- GeForce GTX 980-116
16. World of Warships
Tämä on uusi osa testeistämme, vaikka testattujen näytönohjainkorttien määrä on rajallinen, kattava materiaali julkaistaan maaliskuun loppuun mennessä. World of Warshipsin graafisen tehokkuuden arvioiminen on vaikeaa, mutta yleisesti ottaen näistä tiedoista voi olla hyötyä rakennettaessa järjestelmää erityisesti Wargaming-peleihin.
- NVIDIA GeForce GTX Titan X-72
- Inno3D iChill GeForce GTX 780Ti - 72 -näytönohjain
- Palit GeForce GTX 960 Super JetStream - 59
- Radeon R9 280x - 70
- Radeon R9 280x - 70
Ylikellotus
Perinteisesti emme rajoitu testaamiseen vakiotaajuuksilla. Ylikellotusta varten MSI Afterburner on uusin versio testaushetkellä. NVIDIA GeForce GTX Titan X:llä pystyimme saavuttamaan seuraavat tulokset nostamatta ydinjännitettä:Suorituskyvyn kasvun vertaamiseen käytetään synteettistä testiä 3D Mark FireStrike:
Ylikellotus on mahdollista suurimmalla jännitteen nousulla. Ydintaajuus voidaan nostaa muistilla 1202 MHz:iin ja 7806 MHz:iin. Täällä maksimilämpötilapalkki nousee 88 asteeseen.
NVIDIA GeForce GTX Titan X -tulokset
NVIDIA GeForce GTX Titan X osoitti parempaa suorituskykyä alhaisemman virrankulutuksen taustalla. Nykyisellä voimien kohdistuksella tämä on suurin suorituskyky yksisirujärjestelmässä. AMD Radeonin riittäviä vastauksia ei ole vielä ilmoitettu. Vaihtoehtona voimme harkita GTX 780 Ti:tä, GTX 980:aa SLI-tilassa, Radeon R9 290X:ää, joka on edelleen ajankohtainen. Se on myös mielenkiintoinen videon renderöinnin kannalta.NVIDIA GeForce GTX Titan X voitti ansaitun kullan..
Nvidia Geforce GTX Titan X
Tehokkain yhden prosessorin kiihdytin
- Osa 2 - Käytännön tutustuminen
Uuden kiihdytin (ja sen ohjelmiston) testinäytteen myöhästymisen vuoksi sekä kirjoittajamme Aleksei Berillon osallistumisen vuoksi GTC:n työhön, osa tästä katsauksesta on omistettu uuden Nvidian arkkitehtuurille. tuote ja synteettisten testien analyysi julkaistaan myöhemmin (noin viikon kuluttua). Ja nyt esittelemme materiaalin, joka tutustuttaa lukijat näytönohjaimen ominaisuuksiin sekä pelitestien tuloksiin.
Laitteet)
Nvidia Geforce GTX Titan X 12288MB 384-bittinen GDDR5 PCI-E | ||
---|---|---|
Parametri | Merkitys | Nimellisarvo (viite) |
GPU | Geforce GTX Titan X (GM200) | |
Käyttöliittymä | PCI Express x16 | |
GPU:n toimintataajuus (ROPs), MHz | 1000—1075 | 1000—1075 |
Muistin taajuus (fyysinen (tehollinen)), MHz | 1750 (7000) | 1750 (7000) |
Muistinvaihtoväylän leveys, bitti | 384 | |
GPU:n laskentayksiköiden lukumäärä / lohkojen taajuus, MHz | 24/1000—1075 | 24/1000—1075 |
Operaatioiden määrä (ALU) lohkoa kohden | 128 | |
Operaatiot yhteensä (ALU) | 3072 | |
Tekstuuriyksiköiden määrä (BLF/TLF/ANIS) | 192 | |
Rasterointilohkojen määrä (ROP) | 96 | |
Mitat, mm | 270×100×35 | 270×100×35 |
Näytönohjaimen käyttämien järjestelmäyksikön paikkojen määrä | 2 | 2 |
Tekstioliitti väri | musta | musta |
Virrankulutus (huippu 3D-tilassa/2D-tilassa/lepotilassa), W | 257/98/14 | 257/98/14 |
Melutaso (2D-tilassa / 2D-tilassa (videon toisto) / maksimi 3D-tilassa), dBA | 20/21/29,5 | — |
Lähtöliittimet | 1×DVI (Dual-Link/HDMI), 1×HDMI 2.0, 3×DisplayPort 1.2 | |
Tuki moniprosessoinnille | SLI | |
Vastaanottimien/monitorien enimmäismäärä samanaikaista kuvan tulostamista varten | 4 | 4 |
Aputeho: 8-nastaisten liittimien määrä | 1 | 1 |
Aputeho: 6-nastaisten liittimien määrä | 1 | 1 |
Suurin 2D-resoluutio: DP/HDMI/Dual-Link DVI/Single-Link DVI | ||
Suurin 3D-resoluutio: DP/HDMI/Dual-Link DVI/Single-Link DVI | 3840×2400/3840×2400/2560×1600/1920×1200 |
Mukana paikallisen muistin kanssa | ||
---|---|---|
Kortissa on 12 288 Mt GDDR5 SDRAM -muistia 24 4 Gt:n piirissä (12 PCB:n kummallakin puolella). DirectX 11:n synteettisinä testeinä käytimme esimerkkejä Microsoftin ja AMD SDK:ista sekä Nvidia-demo-ohjelmasta. Ensimmäinen on HDRToneMappingCS11.exe ja NBodyGravityCS11.exe DirectX SDK:sta (helmikuu 2010). Otimme myös hakemuksia molemmilta videosirujen valmistajilta: Nvidialta ja AMD:ltä. DetailTessellation11 ja PNTriangles11 on otettu ATI Radeon SDK:sta (ne ovat myös DirectX SDK:ssa). Lisäksi käytettiin Nvidian Realistic Water Terrain -demo-ohjelmaa, joka tunnetaan myös nimellä Island11. Synteettiset testit suoritettiin seuraaville näytönohjaimille:
Geforce GTX Titan X -näytönohjaimen uuden mallin suorituskyvyn analysoimiseksi nämä ratkaisut valittiin seuraavista syistä. Geforce GTX 980 perustuu grafiikkasuorittimeen, jolla on sama Maxwell-arkkitehtuuri, mutta alemman tason - GM204, ja meidän on erittäin mielenkiintoista arvioida, mitä GM200: n sirun monimutkaisuus antoi. Geforce GTX Titan Z -kaksisiruinen näytönohjain otettiin vain viitteeksi - tuottavimmaksi Nvidia-näytönohjaimeksi, joka perustuu edellisen Kepler-arkkitehtuurin GK110-siruihin. Kilpailijayritykseltä AMD valitsimme vertailuun myös kaksi näytönohjainta. Ne ovat periaatteessa hyvin erilaisia, vaikka ne perustuvat samoihin Hawaii-grafiikkasuorittimiin - niillä on vain eri määrä GPU:ita korteissa ja ne eroavat sijainniltaan ja hinnaltaan. Geforce GTX Titan X:llä ei ole hintakilpailijoita, joten otimme tehokkaimman kaksisiruisen näytönohjaimen Radeon R9 295X2, vaikka tällainen vertailu ei olisi teknisesti kovin mielenkiintoinen. Jälkimmäiseen otettiin kilpailijan nopein yksisiruinen näytönohjain Radeon R9 290X, vaikka se julkaistiin liian kauan sitten ja perustuu selkeästi vähemmän monimutkaiseen GPU:han. Mutta AMD-ratkaisuista ei yksinkertaisesti ole muuta vaihtoehtoa. Direct3D 10: PS 4.0 pikselin varjostustestit (teksturointi, silmukka)Hylkäsimme vanhentuneista DirectX 9 -vertailuarvoista, sillä supertehokkaat ratkaisut, kuten Geforce GTX Titan X, eivät osoita niissä kovin hyviä tuloksia, koska niitä rajoittavat aina muistin kaistanleveys, täyttönopeus tai teksturointi. Puhumattakaan siitä, että kaksisiruiset näytönohjaimet eivät aina toimi oikein tällaisissa sovelluksissa, ja meillä on niitä kaksi. RightMark3D:n toinen versio sisältää kaksi jo tuttua PS 3.0 -testiä Direct3D 9:n alla, jotka kirjoitettiin uudelleen DirectX 10:tä varten, sekä kaksi uutta testiä. Ensimmäinen pari lisäsi mahdollisuuden ottaa käyttöön self-shadowing ja Shader supersampling, mikä lisää lisäksi videosirujen kuormitusta. Nämä testit mittaavat silmukkakuvapisteiden varjostimien suorituskykyä suurella määrällä tekstuurinäytteitä (jopa useita satoja näytteitä pikseliä kohden raskaimmassa tilassa) ja suhteellisen pienellä ALU-kuormalla. Toisin sanoen ne mittaavat tekstuurin haun nopeutta ja haaroittamisen tehokkuutta pikselivarjostimessa. Ensimmäinen pikselivarjostustesti on Fur. Alimmilla asetuksilla se käyttää 15-30 pintakuvionäytettä korkeuskartalta ja kahta näytettä päätekstuurista. Effect detail - "High" -tila lisää näytteiden lukumäärän 40-80:een, "shader" supersamplingin sisällyttäminen - jopa 60-120 näytteeseen, ja "High"-tilalle yhdessä SSAA:n kanssa on ominaista suurin "vakavuus". - 160 - 320 näytettä korkeuskartalta. Tarkastetaan ensin tilat ilman supersamplingia, ne ovat suhteellisen yksinkertaisia, ja tulosten suhteen "Matala" ja "Korkea" -tiloissa pitäisi olla suunnilleen sama. Suorituskyky tässä testissä riippuu TMU:iden lukumäärästä ja tehokkuudesta, ja myös monimutkaisten ohjelmien suorittamisen tehokkuus vaikuttaa. Ja versiossa ilman supersamplingia tehokkaalla täyttönopeudella ja muistin kaistanleveydellä on myös lisävaikutus suorituskykyyn. Tulokset "Korkea"-tasoa eriteltäessä ovat jopa puolitoista kertaa alhaisemmat kuin "Matalalla". Proseduurin turkisrenderöinnissä, jossa on suuri määrä tekstuureja, GCN-arkkitehtuuriin perustuvien videosirujen julkaisun myötä AMD on jo kauan sitten ottanut johtoaseman. Radeon-levyt ovat edelleen parhaita näissä vertailuissa tähän päivään asti, mikä osoittaa, että ne ovat tehokkaampia näiden ohjelmien suorittamisessa. Tämän johtopäätöksen vahvistaa tämän päivän vertailu - arvioimamme Nvidia-näytönohjain hävisi jopa vanhentuneelle yksisiruiselle Radeon R9 290X:lle, puhumattakaan AMD:n lähimmästä hintakilpailijasta. Ensimmäisessä Direct3D 10 -testissä Geforce GTX Titan X -mallin uusi näytönohjain osoittautui hieman nopeammaksi kuin sen nuorempi sisar perustuen saman arkkitehtuurin siruun GTX 980:n muodossa, mutta jälkimmäinen ei ole kaukana. jäljessä - 9-12%. Tämä tulos selittyy GTX 980:n huomattavasti pienemmällä teksturointinopeudella, ja se on jäljessä muissa parametreissa, vaikka ALU:iden suorituskyvyllä ei selvästikään ole merkitystä. Kaksisiruinen Titan Z on nopeampi, mutta ei yhtä nopea kuin Radeon R9 295X2. Katsotaanpa saman testin tulosta, mutta "shader" supersamplingin ollessa päällä, mikä nelinkertaistaa työn: tällaisessa tilanteessa jonkin pitäisi muuttua, ja muistin kaistanleveydellä täyttönopeudella on vähemmän vaikutusta: Geforce GTX Titan X -mallin uusi näytönohjain on vaikeissa olosuhteissa jo selvemmin edellä saman sukupolven nuorempaa mallia - GTX 980:a, ja se on nopeampi kohtuulliset 33-39%, mikä on paljon lähempänä teoreettista eroa. heidän välillään. Ja kilpailijoiden Radeon R9 295X2 ja R9 290X muodossa oleva ruuhka on vähentynyt - Nvidian uusi tuote on melkein kuronut kiinni yksisiruisen Radeonin. Kaksisiruinen on kuitenkin kaukana edellä, koska AMD-sirut pitävät pikseli-pikseliltä laskelmia ja ovat erittäin vahvoja sellaisissa laskelmissa. Seuraava DX10-testi mittaa monimutkaisten silmukoiden pikselivarjostimien suorittamisen suorituskykyä suurella määrällä tekstuurihakuja, ja sitä kutsutaan nimellä Steep Parallax Mapping. Matalilla asetuksilla se käyttää 10-50 pintakuviointinäytettä korkeuskartalta ja kolmea näytettä päätekstuureista. Kun otat raskaan tilan käyttöön itsevarjostuksen kanssa, näytteiden määrä kaksinkertaistuu ja supersampling nelinkertaistaa tämän määrän. Monimutkaisin testitila, jossa on supersampling ja itsevarjostus, valitsee 80 - 400 pintakuvioarvoa, eli kahdeksan kertaa enemmän kuin yksinkertainen tila. Tarkistamme ensin yksinkertaiset vaihtoehdot ilman supersamplingia: Toinen Direct3D 10 pikselin varjostimen testi on käytännön kannalta mielenkiintoisempi, koska parallaksikartoituslajikkeita käytetään laajasti peleissä ja raskaita variantteja, kuten jyrkkää parallaksikartoitusta, on käytetty pitkään monissa projekteissa, esimerkiksi peleissä. Crysis, Lost Planet ja monet muut sarjat. Lisäksi testissämme voit supersamplingin lisäksi ottaa käyttöön itsevarjostuksen, mikä lisää videosirun kuormitusta noin kaksinkertaiseksi - tätä tilaa kutsutaan nimellä "High". Kaavio on yleisesti ottaen samanlainen kuin edellinen, myös ilman supersamplingin sisällyttämistä, ja tällä kertaa uusi Geforce GTX Titan X osoittautui hieman lähemmäksi GTX Titan Z:ta, häviämättä niinkään kaksisiruiselle levylle. Kepler-perheen GPU-parilla. Eri olosuhteissa uusi tuote on 14-19% edellä Nvidian nykyisen sukupolven aiempaa huippumallia, ja vaikka ottaisimme vertailun AMD-näytönohjainkortteihin, tässä on jotain muuttunut - tässä tapauksessa uusi GTX Titan X on hieman huonompi kuin Radeon R9 290X. Kaksisiruinen R9 295X2 on kuitenkin kaukana kaikkia edellä. Katsotaanpa, mikä muuttaa supersamplingin sisällyttämisen: Kun supersampling ja self-shadowing ovat käytössä, tehtävä vaikeutuu, kahden vaihtoehdon yhdistäminen kerralla lisää korttien kuormitusta lähes kahdeksankertaiseksi, mikä aiheuttaa vakavan suorituskyvyn laskun. Testattujen näytönohjainkorttien nopeusindikaattoreiden välinen ero on hieman muuttunut, vaikka supersamplingin sisällyttämisellä on vähemmän vaikutusta kuin edellisessä tapauksessa. AMD Radeon -grafiikkaratkaisut toimivat tässä D3D10 pikselin varjostustestissä tehokkaammin kuin kilpailevat Geforce-levyt, mutta uusi GM200-siru muuttaa tilanteen parempaan suuntaan – Maxwell-arkkitehtuuripiiriin perustuva Geforce GTX Titan X -kortti on jo edellä Radeon R9 290X:ää kaikissa olosuhteissa (perustuu kuitenkin huomattavasti vähemmän monimutkaisempaan GPU:hun). Hawaii-pariin perustuva kaksisiruinen ratkaisu pysyy johtajana, mutta muihin Nvidian ratkaisuihin verrattuna uusi tuote ei ole huono. Se osoitti nopeutta lähes kahden sirun Geforce GTX Titan Z:n tasolla ja ylitti Geforce GTX 980:n 28-33%. Direct3D 10: PS 4.0 Pixel Shader -vertailu (tietokone)Seuraavat pari pikselivarjostustestiä sisältävät vähimmäismäärän pintakuviohakuja vähentääkseen TMU:n suorituskykyä. Ne käyttävät suurta määrää aritmeettisia operaatioita ja mittaavat tarkasti videosirujen matemaattista suorituskykyä, aritmeettisten käskyjen suoritusnopeutta pikselivarjostimessa. Ensimmäinen matematiikan koe on mineraali. Tämä on monimutkainen menettelyllinen teksturointitesti, joka käyttää vain kahta pintakuviotietonäytettä ja 65 sin ja cos -käskyä. Rajoittavien matemaattisten testien tulokset vastaavat useimmiten taajuuksien ja laskentayksiköiden lukumäärän eroa, mutta vain likimääräisesti, koska tuloksiin vaikuttavat niiden käytön erilainen tehokkuus tietyissä tehtävissä ja ajurien optimointi sekä viimeisin taajuus ja virranhallintajärjestelmät ja jopa muistin kaistanleveyden painottaminen. Mineral-testin tapauksessa uusi Geforce GTX Titan X -malli on vain 10 % nopeampi kuin saman sukupolven GM204-siruun perustuva GTX 980 -kortti, ja kaksisiruinen GTX Titan Z ei ollut niin nopea tässä testissä. - jokin estää selvästi Nvidia-kortteja avautumasta. Geforce GTX Titan X:n vertaaminen kilpaileviin AMD:n emolevyihin ei olisi niin surullista, jos R9 290X:n ja Titan X:n GPU:t olisivat monimutkaisia. Mutta GM200 on paljon suurempi kuin Havaiji, ja sen pieni voitto on luonnollista. Nvidian arkkitehtuuripäivitys Kepleristä Maxwelliin on tuonut uudet sirut lähemmäksi kilpailevia AMD-ratkaisuja tällaisissa testeissä. Mutta jopa halvempi kaksisiruinen ratkaisu Radeon R9 295X2 on huomattavasti nopeampi. Tarkastellaan toista varjostuslaskennan testiä, jota kutsutaan Fireksi. Se on ALU:lle raskaampi, ja siinä on vain yksi tekstuurinhaku, ja sin- ja cos-käskyjen määrä on kaksinkertaistettu, jopa 130. Katsotaan mikä on muuttunut kuormituksen kasvaessa: RigthMarkin toisessa matemaattisessa testissä näemme jo erilaisia tuloksia näyttökorteille suhteessa toisiinsa. Joten uusi Geforce GTX Titan X on jo vahvempi (20 %) GTX 980:a edellä saman grafiikkaarkkitehtuurin sirulla, ja kaksisiruinen Geforce on hyvin lähellä uutta tuotetta - Maxwell selviytyy laskentatehtävistä paljon parempi kuin Kepler. Radeon R9 290X on jäänyt taakse, mutta kuten jo kirjoitimme, Hawaii GPU on huomattavasti yksinkertaisempi kuin GM200, ja tämä ero on looginen. Mutta vaikka kaksisiruinen Radeon R9 295X2 on edelleen johtava matemaattisissa testeissä, yleensä uusi Nvidia-videosiru suoriutui hyvin tällaisissa tehtävissä, vaikka se ei saavuttanut teoreettista eroa GM204: n kanssa. Direct3D 10: Geometry Shader -testitRightMark3D 2.0:ssa on kaksi geometrian varjostimen nopeustestiä, ensimmäinen vaihtoehto on nimeltään "Galaxy", tekniikka on samanlainen kuin Direct3D:n aiempien versioiden "pistesprite". Se animoi hiukkasjärjestelmän GPU:ssa, geometriavarjostin jokaisesta pisteestä luo neljä kärkeä, jotka muodostavat hiukkasen. Samanlaisia algoritmeja tulisi käyttää laajalti tulevissa DirectX 10 -peleissä. Geometry shader -testien tasapainon muuttaminen ei vaikuta lopulliseen renderöintitulokseen, lopullinen kuva on aina täsmälleen sama, vain kohtausten käsittelytavat muuttuvat. "GS-kuorma"-parametri määrittää, missä varjostimessa laskelmat suoritetaan - kärjessä tai geometriassa. Laskelmien määrä on aina sama. Tarkastellaan "Galaxy" -testin ensimmäistä versiota, jossa on laskelmia vertex-varjostimessa, kolmelle geometrisen monimutkaisuuden tasolle: Kohtausten eri geometrisesti monimutkaisten nopeuksien suhde on suunnilleen sama kaikissa ratkaisuissa, suorituskyky vastaa pisteiden määrää, jokaisella askeleella FPS-pudotus on lähes kaksinkertainen. Tämä tehtävä on erittäin yksinkertainen tehokkaille nykyaikaisille näytönohjaimille, ja sen suorituskykyä rajoittaa geometrian käsittelynopeus ja joskus muistin kaistanleveys ja/tai täyttöaste. Ero Nvidia- ja AMD-siruihin perustuvien näytönohjainkorttien tulosten välillä on yleensä kalifornialaisen yrityksen ratkaisujen eduksi, ja se johtuu näiden yritysten sirujen geometristen putkien eroista. Tässäkin tapauksessa huippuluokan Nvidia-videosiruissa on monia geometrisia prosessointiyksiköitä, joten voitto on ilmeinen. Geometriatesteissä Geforce-levyt ovat aina kilpailukykyisempiä kuin Radeon. Uusi Geforce GTX Titan X -malli on hieman jäljessä edellisen sukupolven GPU:n kaksoissirun GTX Titan Z -kortista, mutta se ylittää GTX 980:n 12-25%. Radeon-näytönohjaimet näyttävät selvästi erilaisia tuloksia, sillä R9 295X2 perustuu GPU-pariin ja vain se voi kilpailla tämän testin uutuuden kanssa, ja Radeon R9 290X oli ulkopuolinen. Katsotaan kuinka tilanne muuttuu siirrettäessä osa laskelmista geometriavarjostimeen: Kun kuormitus muuttui tässä testissä, luvut muuttuivat hieman AMD-levyjen ja Nvidia-ratkaisujen osalta. Eikä se oikeastaan muuta mitään. Näytönohjaimet tässä geometriavarjostimien testissä reagoivat huonosti muutoksiin GS-kuormaparametrissa, joka on vastuussa osan laskelmien siirtämisestä geometriavarjostimeen, joten johtopäätökset pysyvät samoina. Valitettavasti "Hyperlight" on geometrian varjostimien toinen testi, joka osoittaa useiden tekniikoiden käytön kerralla: instanssi, stream-tulostus, puskurin kuorma, joka käyttää dynaamista geometrian luomista piirtämällä kahteen puskuriin, sekä uuden Direct3D 10 -ominaisuuden. - stream-lähtö, kaikki nykyaikaiset AMD-näytönohjaimet eivät vain toimi. Jossain vaiheessa toinen Catalyst-ohjainpäivitys lopetti tämän testin suorittamisen Catalyst-korteilla, eikä tätä ole korjattu useaan vuoteen. Direct3D 10: tekstuurien hakunopeus vertex-varjostimista"Vertex Texture Fetch" -testit mittaavat useiden pintakuvioiden haun nopeutta vertex-varjostimesta. Testit ovat pohjimmiltaan samanlaisia, joten "Earth"- ja "Waves"-testien korttien tulosten suhteen tulisi olla suunnilleen sama. Molemmissa testeissä käytetään pintakuvionäytteenottotietoihin perustuvaa siirtymäkartoitusta, ainoa merkittävä ero on, että "Waves"-testi käyttää ehdollisia hyppyjä, kun taas "Earth"-testi ei. Harkitse ensimmäistä testiä "Earth", ensin "Effect Detail Low" -tilassa: Aiemmat tutkimuksemme ovat osoittaneet, että sekä täyttönopeus että muistin kaistanleveys voivat vaikuttaa tämän testin tuloksiin, mikä näkyy selvästi Nvidia-levyjen tuloksissa, etenkin yksinkertaisissa tiloissa. Nvidian uusi näytönohjain tässä testissä näyttää selvästi pienemmän nopeuden kuin sen pitäisi olla - kaikki Geforce-levyt osoittautuivat suunnilleen samalla tasolla, mikä ei selvästikään vastaa teoriaa. Kaikissa tiloissa ne törmäävät selvästi muistin kaistanleveyteen. Radeon R9 295X2 ei kuitenkaan ole läheskään kaksi kertaa nopeampi kuin R9 290X. Muuten, tällä kertaa AMD:n yksisirulevy osoittautui vahvemmiksi kuin kaikki Nvidian levyt kevyessä tilassa ja suunnilleen niiden tasolla hard modessa. No, kaksisiruisesta Radeon R9 295X2:sta tuli jälleen vertailumme johtaja. Tarkastellaan suoritusta samassa testissä lisääntyneellä tekstuurinhakujen määrällä: Kaavion tilanne on hieman muuttunut, AMD:n yksisiruinen ratkaisu raskaissa tiloissa on menettänyt huomattavasti enemmän Geforce-kortteja. Uusi malli Geforce GTX Titan X osoitti jopa 14 % nopeampia nopeuksia kuin Geforce GTX 980 ja ylitti yksisirun Radeonin kaikissa tiloissa paitsi kevyimmässä - koska sama keskittyminen johonkin. Jos vertaamme uutta tuotetta AMD:n kaksoissiruratkaisuun, niin Titan X pystyi taistelemaan raskaassa tilassa osoittaen läheistä suorituskykyä, mutta jäljessä kevyissä tiloissa. Tarkastellaan toisen testin tuloksia vertex-varjostimien pintakuvioiden hauista. Waves-testissä on vähemmän näytteitä, mutta se käyttää ehdollisia hyppyjä. Bilineaaristen pintakuvionäytteiden määrä on tässä tapauksessa korkeintaan 14 ("Effect detail Low") tai enintään 24 ("Effect detail High") kärkeä kohti. Geometrian monimutkaisuus muuttuu samalla tavalla kuin edellisessä testissä. Toisen "Waves"-vertex-teksturointitestin tulokset eivät ole mitään sen kaltaisia, mitä näimme edellisissä kaavioissa. Kaikkien Geforcen nopeussuorituskyky tässä testissä on heikentynyt vakavasti, ja uusi Nvidia Geforce GTX Titan X -malli näyttää vain hieman nopeampaa nopeutta kuin GTX 980, mikä on jäljessä kaksisiruisesta Titan Z:sta. Kilpailijoihin verrattuna molemmat Radeon-levyt pystyivät näyttääksesi parhaan suorituskyvyn tässä testissä kaikissa tiloissa. Harkitse saman ongelman toista versiota: Toisessa tekstuurinäytteenottotestissä tehtävän monimutkaisuuden myötä kaikkien ratkaisujen nopeus pieneni, mutta Nvidia-näytönohjaimet kärsivät enemmän, mukaan lukien harkittava malli. Melkein mikään ei muutu päätelmissä, uusi Geforce GTX Titan X -malli on jopa 10-30% nopeampi kuin GTX 980, jääden jälkeen sekä kaksisiruisesta Titan Z:sta että molemmista Radeon-korteista. Radeon R9 295X2 oli näissä testeissä kaukana edellä, ja teorian näkökulmasta tämä on yksinkertaisesti käsittämätöntä lukuun ottamatta Nvidian riittämätöntä optimointia. 3DMark Vantage: Ominaisuustestit3DMark Vantage -paketin synteettiset testit osoittavat meille, mitä olemme aiemmin menettäneet. Tämän testipaketin ominaisuustesteissä on DirectX 10 -tuki, ne ovat edelleen relevantteja ja mielenkiintoisia, koska ne eroavat meidän ominaisuuksistamme. Analysoitaessa tämän paketin viimeisimmän Geforce GTX Titan X -näytönohjaimen tuloksia, teemme uusia ja hyödyllisiä johtopäätöksiä, jotka ovat välttyneet RightMark-perhepakettien testeistä. Ominaisuustesti 1: TekstuuritäyttöEnsimmäinen testi mittaa pintakuviohakuyksiköiden suorituskykyä. Käytetään suorakulmion täyttämiseen pienestä tekstuurista luetuilla arvoilla käyttämällä useita pintakuviokoordinaatteja, jotka muuttavat jokaista kehystä. AMD- ja Nvidia-näytönohjainten tehokkuus Futuremarkin tekstuuritestissä on melko korkea ja eri mallien lopulliset luvut ovat lähellä vastaavia teoreettisia parametreja. Nopeusero GTX Titan X:n ja GTX 980:n välillä osoittautui siis 38 % GM200:aan perustuvan ratkaisun hyväksi, mikä on lähellä teoriaa, koska uudessa tuotteessa on puolitoista kertaa enemmän TMU-yksiköitä. , mutta ne toimivat pienemmällä taajuudella. Luonnollisesti viive kaksois-GTX Titan Z:n jälkeen säilyy, sillä kahdella grafiikkasuorittimella on nopeampi teksturointinopeus. Mitä tulee uuden huippuluokan Nvidia-näytönohjaimen teksturointinopeuden vertailuun kilpailijan samanhintaisiin ratkaisuihin, niin uutuus on tässä huonompi kuin kaksisiruinen kilpailija, joka on ehdollinen naapuri hintarakossa, mutta on edellä Radeon R9 290X, vaikkakaan ei liian merkittävästi. Silti AMD-näytönohjaimet pärjäävät hieman paremmin teksturoinnin kanssa. Ominaisuustesti 2: VäritäyttöToinen tehtävä on täyttöastetesti. Se käyttää hyvin yksinkertaista pikselivarjostajaa, joka ei rajoita suorituskykyä. Interpoloitu väriarvo kirjoitetaan näytön ulkopuoliseen puskuriin (renderöintikohteeseen) käyttämällä alfasekoitusta. Se käyttää 16-bittistä näytön ulkopuolista FP16-puskuria, joka on yleisimmin käytetty HDR-renderöintiä käyttävissä peleissä, joten tämä testi on melko ajankohtainen. Toisen 3DMark Vantage -alitestin luvut osoittavat ROP-yksiköiden suorituskyvyn ottamatta huomioon videomuistin kaistanleveyden määrää (ns. "tehokas täyttöaste"), ja testi mittaa tarkasti ROP:n suorituskyvyn. Tänään tarkastelemamme Geforce GTX Titan X -levy on huomattavasti edellä molempia Nvidia-kortteja, GTX 980:aa ja jopa GTX Titan Z:ta, ylittäen GM204-pohjaisen yksisirulevyn jopa 45 % - ROP-korttien ja niiden lukumäärän. Maxwell-arkkitehtuurin huipputason GPU:n tehokkuus on erinomainen! Ja jos verrataan uuden Geforce GTX Titan X -näytönohjaimen kohtauksen täyttönopeutta AMD-näytönohjainkorttiin, niin tässä testissä harkitsemamme Nvidia-levy näyttää parhaan kohtauksen täyttönopeuden jopa verrattuna tehokkaimpaan kaksisiruiseen Radeon R9:ään. 295X2, puhumattakaan huomattavasti jälkeen jääneestä Radeon R9 290X:stä. Suuri määrä ROP-lohkoja ja optimointeja kehyspuskuritiedon pakkaamisen tehostamiseksi teki tehtävänsä. Ominaisuustesti 3: Parallax-okkluusiokartoitusYksi mielenkiintoisimmista ominaisuustesteistä, koska tätä tekniikkaa käytetään jo peleissä. Se piirtää yhden nelikulmion (tarkemmin kaksi kolmiota) käyttämällä erityistä Parallax Occlusion Mapping -tekniikkaa, joka jäljittelee monimutkaista geometriaa. Käytetään melko resurssiintensiivisiä säteenseurantatoimintoja ja korkearesoluutioista syvyyskarttaa. Tämä pinta varjostetaan myös raskaalla Strauss-algoritmilla. Tämä on testi videosirun erittäin monimutkaiselle ja raskaalle pikselivarjostimelle, joka sisältää lukuisia tekstuurihakuja säteenjäljityksen, dynaamisen haaroittamisen ja monimutkaisten Straussin valaistuslaskelmien aikana. Tämä 3DMark Vantage -paketin testi eroaa aikaisemmista siinä, että sen tulokset eivät riipu pelkästään matemaattisten laskelmien nopeudesta, haaran suorituksen tehokkuudesta tai tekstuurin haun nopeudesta, vaan useista parametreista samanaikaisesti. Suuren nopeuden saavuttamiseksi tässä tehtävässä on tärkeää GPU:n oikea tasapaino sekä monimutkaisten varjostimien suorittamisen tehokkuus. Tässä tapauksessa sekä matemaattinen että tekstuurin suorituskyky ovat tärkeitä, ja tässä 3DMark Vantagen "syntetiikassa" uusi Geforce GTX Titan X -kortti osoittautui yli kolmanneksen nopeammaksi kuin saman Maxwell-arkkitehtuurin GPU:hun perustuva malli. . Ja jopa kaksisiruinen Kepler GTX Titan Z:n muodossa ylitti uutuuden alle 10 prosentilla. Nvidian yksisiruinen huippukortti ylitti tässä testissä selvästi yksisirun Radeon R9 290X:n, mutta molemmat ovat huomattavasti parempia kuin kaksisiruinen Radeon R9 295X2. AMD:n GPU:t ovat tässä tehtävässä jonkin verran tehokkaampia kuin Nvidia-sirut, ja R9 295X2:ssa on niitä kaksi. Ominaisuustesti 4: GPU-kangasNeljäs testi on mielenkiintoinen, koska se laskee fyysiset vuorovaikutukset (kangasjäljitelmä) videosirun avulla. Vertex-simulaatiota käytetään käyttämällä vertexin ja geometrian varjostimien yhdistettyä toimintaa useilla kierroksilla. Käytä stream out -toimintoa pisteiden siirtämiseen simulaatiokierroksesta toiseen. Siten testataan vertex- ja geometriavarjostimien suorituksen suorituskykyä ja ulosvirtausnopeutta. Tässä testissä renderöintinopeus riippuu myös useista parametreista kerralla, ja tärkeimmät vaikuttajat tulisivat olla geometrian käsittelyn suorituskyky ja geometrian varjostimien tehokkuus. Eli Nvidia-sirujen vahvuuksien pitäisi näkyä, mutta valitettavasti - näimme erittäin oudon tuloksen (tarkistettu uudelleen), uusi Nvidia-näytönohjain ei osoittanut lievästi sanoen liian suurta nopeutta. Geforce GTX Titan X tässä osatestissä osoitti kaikista ratkaisuista huonoimman tuloksen, jäljessä jopa GTX 980:sta lähes 20 %! No, vertailu Radeon-levyihin tässä testissä on aivan yhtä ruma uudelle tuotteelle. Huolimatta teoreettisesti pienemmästä geometristen suoritusyksiköiden määrästä ja AMD-sirujen geometrisesta suoritusviiveestä kilpaileviin ratkaisuihin verrattuna, molemmat Radeon-levyt toimivat erittäin tehokkaasti tässä testissä ja ylittävät vertailussa kaikki kolme esitettyä Geforce-korttia. Jälleen näyttää siltä, että Nvidia-ajureissa ei ole optimoitua tiettyä tehtävää varten. Ominaisuustesti 5: GPU-hiukkasetTesti efektien fyysiseen simulointiin, joka perustuu videosirun avulla laskettuihin hiukkasjärjestelmiin. Vertex-simulaatiota käytetään myös, jokainen huippu edustaa yhtä hiukkasta. Stream out -toimintoa käytetään samaan tarkoitukseen kuin edellisessä testissä. Lasketaan useita satojatuhansia hiukkasia, kaikki animoidaan erikseen, lasketaan myös niiden törmäykset korkeuskarttaan. Kuten yhdessä RightMark3D 2.0 -testissämme, hiukkaset piirretään geometriavarjostimella, joka luo jokaisesta pisteestä neljä kärkeä hiukkasen muodostamiseksi. Mutta testi lataa Shader-lohkot ennen kaikkea vertex-laskelmilla, myös stream out testataan. 3DMark Vantagen toisessa "geometrisessa" testissä tilanne on muuttunut vakavasti, tällä kertaa kaikki Geforcet osoittavat jo enemmän tai vähemmän normaalia tulosta, vaikka kaksisiruinen Radeon pysyy edelleen kärjessä. Uusi GTX Titan X -malli on 24 % nopeampi kuin sen sisar GTX 980 ja suunnilleen saman verran jäljessä edellisen sukupolven GPU:n kaksoisgrafiikkasuorittimesta Titan Z:sta. Nvidian uutuuden vertailu kilpaileviin AMD:n näytönohjaimiin tällä kertaa on positiivisempi - se osoitti tuloksen kahden kilpailevan yrityksen levyn välillä ja osoittautui lähempänä Radeon R9 295X2:ta, jossa on kaksi GPU:ta. Uutuus on kaukana Radeon R9 290X:n edellä ja tämä osoittaa meille selvästi, kuinka erilaisia kaksi näennäisesti samanlaista testiä voivat olla: kangassimulaatio ja hiukkassysteemisimulaatio. Ominaisuustesti 6: Perlin NoiseVantage-paketin viimeinen ominaisuustesti on matemaattisesti intensiivinen videosirun testi, joka laskee pikselivarjostimessa useita Perlin-kohinaalgoritmin oktaaveja. Jokainen värikanava käyttää omaa kohinatoimintoaan lisätäkseen videosirun kuormitusta. Perlin-kohina on standardialgoritmi, jota käytetään usein proseduurin teksturointiin, se käyttää paljon matemaattisia laskelmia. Tässä tapauksessa ratkaisujen suorituskyky ei aivan vastaa teoriaa, vaikka se on lähellä sitä, mitä näimme vastaavissa testeissä. Futuremark-paketin matemaattisessa testissä, joka näyttää videosirujen huippusuorituskyvyn rajatehtävissä, näemme erilaisen tulosten jakautumisen verrattuna testipakettimme vastaaviin testeihin. Olemme tienneet jo pitkään, että GCN-arkkitehtuurilla varustetut AMD-videosirut selviävät edelleen tällaisista tehtävistä kilpailijoita paremmin, varsinkin tapauksissa, joissa suoritetaan intensiivistä "matematiikkaa". Mutta Nvidian uusi huippumalli perustuu suureen GM200-siruun, joten Geforce GTX Titan X suoriutui tässä testissä huomattavasti paremmin kuin Radeon R9 290X. Jos verrataan uutta tuotetta Geforce GTX 900 -perheen parhaaseen malliin, niin tässä testissä ero niiden välillä oli lähes 40% - tietysti tänään harkitsemamme näytönohjaimen hyväksi. Tämä on myös lähellä teoreettista eroa. Ei huono tulos Titan X:lle, vain kaksisiruinen Radeon R9 295X2 oli edellä ja kaukana edellä. Direct3D 11: Laske varjostimetTestaaksemme Nvidian äskettäin julkaistua huippuluokan ratkaisua tehtäviin, joissa käytetään DirectX 11 -ominaisuuksia, kuten tessellaatiota ja laskentavarjostimia, käytimme Microsoftin, Nvidian ja AMD:n SDK-esimerkkejä ja demoja. Ensin tarkastellaan vertailuarvoja, jotka käyttävät Compute-varjostimia. Niiden ulkonäkö on yksi tärkeimmistä innovaatioista DX API:n uusimmissa versioissa, niitä käytetään jo nykyaikaisissa peleissä erilaisten tehtävien suorittamiseen: jälkikäsittelyyn, simulaatioihin jne. Ensimmäinen testi näyttää esimerkin HDR-renderöimisestä sävykartoituksella. DirectX SDK:sta, jossa on jälkikäsittely, joka käyttää pikseli- ja laskentavarjostimia. Laskentanopeus laskenta- ja pikselivarjostimissa kaikilla AMD- ja Nvidia-korteilla on suunnilleen sama, eroja havaittiin vain aikaisempien arkkitehtuurien GPU:ihin perustuvissa näytönohjaimissa. Aikaisempien testiemme perusteella ongelman tulokset eivät useinkaan riipu niinkään matemaattisesta tehosta ja laskentatehosta, vaan muista tekijöistä, kuten muistin kaistanleveydestä. Tässä tapauksessa uusi huippuluokan näytönohjain on nopeampi kuin yksisiruinen Geforce GTX 980 ja Radeon R9 290X, mutta takana kaksisiruinen R9 295X2, mikä on ymmärrettävää, koska siinä on R9 290X -parin teho. . Jos vertaamme uutta tuotetta Geforce GTX 980:een, niin tänään tarkastellun kalifornialaisen yrityksen emolevy on 34-36% nopeampi - täsmälleen teorian mukaan. Toinen laskentavarjostimen testi on myös otettu Microsoft DirectX SDK:sta, ja se näyttää N-kappaleen (N-body) painovoimalaskentaongelman, simulaation dynaamisesta hiukkasjärjestelmästä, joka on alttiina fyysisille voimille, kuten painovoimalle. Tässä testissä painotetaan useimmiten monimutkaisten matemaattisten laskutoimitusten suorittamisen nopeutta, geometrian käsittelyä ja koodin suorittamisen tehokkuutta haaroituksella. Ja tässä DX11-testissä kahden eri yrityksen ratkaisujen välisten voimien kohdistus osoittautui täysin erilaiseksi - selvästi Geforce-näytönohjainkorttien hyväksi. Eri siruihin perustuvan Nvidia-ratkaisuparin tulokset ovat kuitenkin myös outoja - Geforce GTX Titan X ja GTX 980 ovat lähes yhtä suuret, niitä erottaa vain 5 % suorituskyvyn ero. Dual-chip renderöinti ei toimi tässä tehtävässä, joten kilpailijat (yksisiruiset ja kaksisiruiset Radeon-mallit) ovat suunnilleen yhtä nopeita. No, GTX Titan X on kolme kertaa heitä edellä. Näyttää siltä, että tämä tehtävä lasketaan paljon tehokkaammin Maxwell-arkkitehtuurin GPU:illa, jonka totesimme aiemmin. Direct3D 11: Tessellation PerformanceLaskennalliset varjostimet ovat erittäin tärkeitä, mutta toinen tärkeä uusi Direct3D 11:n ominaisuus on laitteiston tessellointi. Käsittelimme sitä hyvin yksityiskohtaisesti teoreettisessa artikkelissamme Nvidia GF100:sta. Tessellationia on käytetty DX11-peleissä pitkään, kuten STALKER: Call of Pripyat, DiRT 2, Aliens vs Predator, Metro Last Light, Civilization V, Crysis 3, Battlefield 3 ja muut. Jotkut niistä käyttävät tessellaatiota hahmomalleissa, toiset simuloivat realistista vedenpintaa tai maisemaa. Graafisten primitiivien osiointiin (tessellaatioon) on olemassa useita erilaisia järjestelmiä. Esimerkiksi phong-tessellaatio, PN-kolmiot, Catmull-Clark-alajako. Joten PN-kolmioiden laatoitusjärjestelmää käytetään STALKER: Call of Pripyatissa ja Metro 2033 - Phong tessellaatiossa. Nämä menetelmät ovat suhteellisen nopeita ja helppoja ottaa käyttöön pelin kehitysprosessissa ja olemassa olevissa moottoreissa, minkä vuoksi niistä on tullut suosittuja. Ensimmäinen tessellaatiotesti on ATI Radeon SDK:n Detail Tessellation -esimerkki. Se toteuttaa paitsi tesselloinnin, myös kaksi erilaista pikselikohtaista käsittelytekniikkaa: yksinkertaisen normaalien karttojen päällekkäisyyden ja parallaksien okkluusiokartoituksen. No, verrataan AMD:n ja Nvidian DX11-ratkaisuja eri olosuhteissa: Yksinkertaisessa bumpmapping-testissä levyjen nopeudella ei ole suurta merkitystä, koska tämä tehtävä on tullut liian helpoksi pitkään ja sen suorituskyky riippuu muistin kaistanleveydestä tai täyttönopeudesta. Tämän päivän arvostelun sankari on 23% edellä GM204-siruun perustuvaa edellistä huippumallia Geforce GTX 980 ja hieman huonompi kuin kilpailijansa Radeon R9 290X:n muodossa. Kaksisiruinen versio on jopa hieman nopeampi. Toisessa osatestissä monimutkaisemmilla pikselikohtaisilla laskelmilla uusi tuote on jo 34 % nopeampi kuin Geforce GTX 980, mikä on lähempänä niiden välistä teoreettista eroa. Mutta tällä kertaa Titan X on jo hieman nopeampi kuin yhden sirun ehdollinen kilpailija, joka perustuu yhteen Havaijiin. Koska Radeon R9 295X2:n kaksi sirua toimivat täydellisesti, tämä tehtävä suoritetaan vielä nopeammin. Vaikka matemaattisten laskelmien suorituskyky pikselivarjostimissa on parempi GCN-arkkitehtuurisirujen osalta, Maxwell-arkkitehtuuriratkaisujen julkaisu paransi Nvidia-ratkaisujen sijoituksia. Kevyessä tessellaatio-alitestissä äskettäin julkistettu Nvidia-levy on jälleen vain neljänneksen nopeampi kuin Geforce GTX 980 - ehkä nopeutta rajoittaa muistin kaistanleveys, koska teksturointi ei tässä testissä juuri vaikuta. Jos verrataan uutta tuotetta AMD-kortteihin tässä osatestissä, niin Nvidia-levy on jälleen huonompi kuin molemmat Radeonit, koska tässä tessellaatiotestissä kolmion halkaisu on erittäin maltillista eikä geometrinen suorituskyky rajoita yleistä renderöintinopeutta. Toinen tessellaatiotesti on toinen esimerkki 3D-kehittäjille ATI Radeon SDK - PN Trianglesista. Itse asiassa molemmat esimerkit sisältyvät myös DX SDK:han, joten olemme varmoja, että pelien kehittäjät luovat oman koodinsa niiden perusteella. Testasimme tätä esimerkkiä eri tessellaatiokertoimella nähdäksemme, kuinka paljon se vaikuttaa yleiseen suorituskykyyn. Tässä testissä käytetään monimutkaisempaa geometriaa, joten eri ratkaisujen geometristen tehojen vertailu tuo erilaisia johtopäätöksiä. Materiaalissa esitetyt nykyaikaiset ratkaisut kestävät melko hyvin kevyitä ja keskisuuria geometrisia kuormituksia osoittaen suurta nopeutta. Mutta vaikka Havaijin yksi ja kaksi GPU:ta Radeon R9 290X:ssä ja R9 295X2:ssa toimivat hyvin valoisissa olosuhteissa, Nvidian levyt ovat huippuluokkaa raskaassa käytössä. Joten vaikeimmissa tiloissa tänään esitelty Geforce GTX Titan X näyttää nopeuden jo huomattavasti paremmin kuin kaksisiruinen Radeon. Mitä tulee GM200- ja GM204-siruihin perustuvien Nvidia-levyjen vertailuun, tänään tarkasteltavana oleva Geforce GTX Titan X -malli lisää etuaan geometrisen kuormituksen kasvun myötä, koska valotilassa kaikki riippuu muistin kaistanleveydestä. Tämän seurauksena uusi tuote on Geforce GTX 980 -korttia edellä tilan monimutkaisuudesta riippuen jopa 31 %. Katsotaanpa toisen testin, Nvidia Realistic Water Terrain -demo-ohjelman, joka tunnetaan myös nimellä Island, tuloksia. Tämä demo käyttää tessellaatio- ja siirtymäkartoitusta realistisen näköisen valtameren pinnan ja maaston luomiseksi. Island-testi ei ole puhtaasti synteettinen testi puhtaasti geometrisen GPU-suorituskyvyn mittaamiseen, koska se sisältää sekä monimutkaisia pikseli- että laskentavarjostimia, ja tällainen kuormitus on lähempänä oikeita pelejä, joissa käytetään kaikkia GPU-yksiköitä, ei vain geometrisia, kuten edellisessä. geometrian testit. Vaikka geometrian prosessointiyksiköiden kuormitus pysyy edelleen pääasiallisena, esimerkiksi sama muistin kaistanleveys voi myös vaikuttaa. Testaamme kaikki näytönohjaimet neljällä eri tessellaatiokertoimella - tässä tapauksessa asetusta kutsutaan nimellä Dynamic Tessellation LOD. Ensimmäisellä kolmion jakokertoimella geometristen lohkojen suorituskyky ei rajoita nopeutta, ja Radeon-näytönohjaimet näyttävät melko korkean tuloksen, etenkin kaksisiruinen R9 295X2, joka jopa ylittää ilmoitetun Geforce GTX Titan X -levyn tuloksen. , mutta jo seuraavilla geometrisilla kuormitustasoilla Radeon-korttien suorituskyky heikkenee ja ratkaisut Nvidia ovat ottamassa johtoasemaan. Uuden GM200-videosiruun perustuvan Nvidia-levyn etu kilpailijoihinsa nähden tällaisissa testeissä on jo varsin kohtuullinen ja jopa moninkertainen. Jos vertaamme Geforce GTX Titan X:ää GTX 980:een, niin ero niiden suorituskyvyn välillä on 37-42%, mikä on täysin selitetty teorialla ja vastaa sitä tarkasti. Maxwellin grafiikkasuorittimet ovat huomattavasti tehokkaampia sekakuormituksessa ja siirtyvät nopeasti grafiikasta tietojenkäsittelyyn ja takaisin, ja Titan X on paljon nopeampi kuin jopa kaksisiruinen Radeon R9 295X2 tässä testissä. Analysoituamme uuden Nvidia Geforce GTX Titan X -näytönohjaimen synteettisten testien tulokset, jotka perustuvat uuteen huippuluokan GM200-grafiikkasuorittimeen sekä ottamalla huomioon muiden näytönohjainmallien tulokset molemmilta erillisten videosirujen valmistajilta, voimme päätellä, että tänään harkitsemamme näytönohjaimen pitäisi olla markkinoiden nopein ja kilpailla vahvimman AMD:n kaksisiruisen näytönohjaimen kanssa. Yleensä tämä on hyvä Geforce GTX Titan Black -seuraaja - tehokas yksisiru. Nvidian uusi näytönohjain näyttää melko vahvoja tuloksia synteettisessä - monissa testeissä, mutta ei kaikissa. Radeonilla ja Geforcella on perinteisesti erilaisia vahvuuksia. Useissa testeissä Radeon R9 295X2 -mallin kaksi GPU:ta olivat nopeampia, muun muassa suuremman kokonaismuistin kaistanleveyden ja teksturointinopeuden ansiosta, jotka suorittivat laskennalliset tehtävät erittäin tehokkaasti. Mutta muissa tapauksissa Maxwell-arkkitehtuurin huippugrafiikkaprosessori voittaa takaisin, erityisesti geometrisissä testeissä ja tessellaatioesimerkeissä. Todellisissa pelisovelluksissa kaikki on kuitenkin hieman erilaista "synteettisiin" verrattuna ja Geforce GTX Titan X:n nopeus pitäisi olla huomattavasti korkeampi kuin yksisiruinen Geforce GTX 980 ja vielä enemmän Radeon R9 290X . Ja uutuutta on vaikea verrata kaksisiruisiin Radeon R9 295X2 -järjestelmiin - kahteen tai useampaan GPU:hun perustuvilla järjestelmillä on omat epämiellyttävät ominaisuutensa, vaikka ne lisäävät keskimääräistä kuvanopeutta asianmukaisella optimoinnilla. Mutta arkkitehtoniset ominaisuudet ja toiminnallisuus tukevat selvästi Nvidian premium-ratkaisua. Geforce GTX Titan X kuluttaa paljon vähemmän energiaa kuin sama Radeon R9 295X2, ja Nvidian uusi malli on erittäin vahva energiatehokkuuden suhteen - tämä on Maxwell-arkkitehtuurin erottuva piirre. Älä unohda Nvidian uuden tuotteen parempaa toiminnallisuutta: DirectX 12:ssa on tuki ominaisuustasolle 12.1, VXGI-laitteistokiihdytykseen, uusi MFAA-anti-aliasing-menetelmä ja muita teknologioita. Puhuimme jo markkinoiden näkökulmasta ensimmäisessä osassa - eliittisegmentissä ei niinkään riipu hinnasta. Pääasia on, että ratkaisu on pelisovelluksissa mahdollisimman toimiva ja tuottava. Yksinkertaisesti sanottuna se oli parasta kaikessa. Pelkästään uutuuden nopeuden arvioimiseksi peleissä, materiaalimme seuraavassa osassa määritämme Geforce GTX Titan X:n suorituskyvyn peliprojektiemme sarjassa ja vertaamme sitä kilpailijoiden suorituskykyyn, mukaan lukien perustelujen arviointi. uutuuden vähittäishinnasta harrastajien näkökulmasta ja selvitä myös kuinka paljon nopeampi se on Geforce GTX 980 jo peleissä. |
Yrityksen toimittama Asus ProArt PA249Q näyttö työtietokoneeseen Asustek | Yrityksen toimittama Cougar 700K näppäimistö työtietokoneeseen puuma |
TITAN X -näytönohjain on suunniteltu kaikkein resursseja vaativien pelien ystäville. Siinä yhdistyvät huipputeknologia ja uuden NVIDIA Maxwell™ -arkkitehtuurin äärimmäinen suorituskyky ja se tarjoaa planeetan nopeimman ja edistyneimmän näytönohjaimen.
SUORITUSKYKY
TITAN X jatkaa TITAN-näytönohjainperheen perintöä ja tarjoaa maailman tehokkaimman peligrafiikkasuorittimen. Se käyttää tehokasta Maxwell-arkkitehtuuria tuottamaan uusinta teknologiaa kaksinkertaisella suorituskyvyllä ja tehotehokkuudella alkuperäiseen GTX TITAN -näytönohjaimeen verrattuna.
ERINOMAINEN DESIGN
TITAN X on suunniteltu ja ammattitaidolla valmistettu korkealaatuisista komponenteista, jotka parantavat merkittävästi suorituskykyä säilyttäen samalla ylittämättömän akustisen ja lämpösuorituskyvyn.
Tämä edistyksellinen grafiikkasuoritin tukee hyperrealistista reaaliaikaista globaalia valaistusta NVIDIA VXGI -tekniikalla sekä NVIDIA G-SYNC™ -teknologialla, joka takaa sujuvan, repeytymättömän pelaamisen. Lisäksi voit kokea DSR-teknologian, joka tarjoaa 4K-kokemuksen jopa 1080p-näytöillä.
EXTREME PELIT
TITAN X on ainoa yksittäinen GPU-näytönohjain, jolla voi pelata helposti 4K-pelejä korkeilla asetuksilla. Se toimii sujuvasti GeForce® Experience™ -sovelluksen kanssa, joka antaa sinulle pääsyn uusimpiin ohjaimiin ja optimoi peliasetukset yhdellä napsautuksella. Voit jopa tallentaa parhaat pelihetket ja jakaa ne ystäviesi kanssa NVIDIA® ShadowPlay™ -tekniikan avulla.
NVIDIAn ensimmäinen markkinoille tullut Pascal-arkkitehtuuri oli GP104-prosessoriin perustuva GeForce GTX 1080. Uuden 16 nm:n FinFET-prosessitekniikan sekä sirun arkkitehtuurin ja piirien optimoinnin ansiosta GTX 1080 on mahdollistanut pelien suorituskyvyn, joka on noin 30 % korkeampi kuin NVIDIA:n edellisen sukupolven lippulaivanäytönohjain. GeForce GTX TITAN X. Samaan aikaan GTX 1080:n kehittäjät onnistuivat pienentämään kiihdytin tehobudjettia 70 W verrattuna edeltäjänsä TDP:hen - 250:stä 180 wattiin. Samaan aikaan 250 W:n lämpöpaketti on vakiotavoite NVIDIAn viimeisten sukupolvien parhaille pelinäyttökorteille, joten vieläkin tuottavamman tuotteen ilmestyminen GTX 1080:n jälkeen, joka vie Pascal-sarjan tämän markkinaraon, oli vain asia. ajasta.
Kepler-arkkitehtuurista alkaen NVIDIA on omaksunut seuraavan strategian GPU:iden julkaisuun eri suorituskykyluokissa. Ensinnäkin toisen tason siru debytoi: GK104 Kepler-perheessä, GM204 Maxwellin versiossa 2 ja nyt GP104 Pascalissa. Myöhemmin NVIDIA täyttää yhden tai kaksi alempana olevaa tasoa, ja merkittävän aukon jälkeen ilmestyy huipputason GPU, joka muodostaa perustan NVIDIA:n tehokkaimmalle kiihdyttimelle, samalla kun virrankulutus pysyy 250 W:n sisällä nykyisellä työnkululla.
Pascal-arkkitehtuurin nykyinen huippu on GP100-prosessori, jossa on ennennäkemätön määrä Shader ALU:ita (3840 CUDA-ydintä) ja 16 Gt HBM2-muistia yhdistettynä piisubstraatilla olevaan GPU:han. GP100:aa käytetään osana Tesla P100 -kiihdytintä, jonka käyttö rajoittuu supertietokoneiden alaan NVLINK-väylällä ja 300 W:n TDP:llä varustetun erityisen muotokertoimen vuoksi. Tesla P100:n odotetaan myös julkaistavan vakiona PCI Express -laajennuskorttimuodossa vuoden lopussa.
Alan harrastajien unelmissa juuri GP100-siru olisi pitänyt kruunata GeForce 10 -pelisovittimien valikoima tulevaisuudessa, ja NVIDIA olisi voinut aiemmin julkaista uuden TITANin - vain välipysähdyksellä tässä paikassa, edellinen suuri GPU:t saapuivat pelitietokoneisiin (GK110 osana TITANia ja GM200 - TITAN X:ssä).
Tällä kertaa asiantuntijat kuitenkin ilmeisesti osoittautuivat oikeaksi ennustaessaan NVIDIA GPU -linjan lopullisen jakautumisen kahteen ei-päällekkäiseen ryhmään - toisaalta pelisiruihin ja prosumer-suuntiin (sanoista tuottaja ja kuluttaja) , ja sirut tietojenkäsittelyä varten - toisaalta. Erottava tekijä tässä tapauksessa on grafiikkasuorittimen nopeus kaksinkertaisella tarkkuudella liukulukuluvuilla (FP64). Kepler-linjassa kehittäjät ovat jo uhraaneet tämän ominaisuuden kaikille siruille (1/24 FP32:sta), paitsi vanhemmalle - GK110/GK210 (1/3 FP32:sta), vähentääkseen GPU-virrankulutusta. Seuraavassa sukupolvessa tämä suuntaus paheni: kaikki Maxwell-prosessorit käyttävät FP64:ää nopeudella 1/32 FP32:sta.
Pascalin tilanne osoitti, että FP64:n suorituskyvyn säästö ei jäänyt väliaikaiseksi toimenpiteeksi 28 nm:n prosessitekniikan viiveen vuoksi. NVIDIA tarvitsee edelleen GPU:n palvelimille, supertietokoneille ja työasemille, jotka pystyvät käsittelemään FP64:ää korkealla suorituskyvyllä. Pelivideosovittimille tämä transistorin budjettia ja GPU-virrankulutusta lisäävä toiminto on kuitenkin vain taakka.
Sen sijaan, että NVIDIA olisi siirtänyt GP100:n (ilmeisesti kallis siru sekä alueen että integroidun HBM2-muistin vuoksi) pelinäyttökorteille, se julkaisi lisätuotteen - GP102:n, joka keskittyi toimiin FP32:n kanssa. 3D-grafiikkaa ja lukuisissa laskentatehtävissä. GP102:n ainoa toimiva ominaisuus on tuki int8-muodon kokonaislukuoperaatioille. Tämä on tärkeä asia NVIDIAlle, koska int8:aa käytetään laajalti koneoppimistehtävissä, jotka yritys on asettanut itselleen yhdeksi prioriteeteistaan (tarkemmin sanottuna yksi tällaisten tehtävien luokista on syväoppiminen). Lähitulevaisuudessa aiomme julkaista erillisen artikkelin, joka on omistettu tälle aiheelle.
Uusi TITAN X, ensimmäinen GP102-prosessoriin perustuva laite, on sijoitettu ensisijaisesti ammattitason kiihdyttimeksi, joka on suunniteltu syväoppimiseen liittyviin tutkimukseen ja kaupallisiin sovelluksiin. Tämän vahvistaa GeForce-brändin puuttuminen kortin nimestä. Uutuuden laajat pelimahdollisuudet ovat kuitenkin myös kiistattomat. Kaikkia aiemmin julkaistuja Titaaneja laskentatoimintojensa lisäksi pidettiin premium-pelinäytönohjainkortteina, jotka pystyivät tarjoamaan grafiikan laatua ja suorituskykyä, joita ei ollut saatavilla heidän nykyisille GeForce-linjan malleille.
⇡ NVIDIA GP102
Tämä GPU on suunniteltu vaihtoehdoksi supertietokoneelle GP100, joka ei ole huonompi kuin jälkimmäinen 3D-grafiikka- ja FP32-laskennan toiminnoissa. Samaan aikaan GP102:n luojat ovat vähentäneet kaikkia komponentteja, jotka eivät vastaa tuotteen tarkoitusta.
Esimerkiksi GP100:n yksittäinen SM (Streaming Multiprocessor - lohko, joka yhdistää CUDA-ytimet tekstuurikartoitusyksiköiden, ajoittajien, lähettäjien ja paikallisten muistisegmenttien kanssa) sisältää 64 CUDA-ydintä FP32-toimintoja varten, kun taas GP102:n SM:llä on tässä suhteessa peritty konfiguraatio. Maxwellilta: 128 CUDA-ydintä. Tarkempi CUDA-ytimien jakautuminen GP100:ssa mahdollistaa sen, että prosessori voi suorittaa samanaikaisesti enemmän käskyvirtoja (ja myös säieryhmiä - loimi- ja loimilohkoja) sekä SM:n sisällä olevien tallennustyyppien kokonaismäärän, kuten jaetun muistin (jaettu muisti) ja rekisteritiedosto, koko GPU:n osalta on kasvanut Maxwell-arkkitehtuuriin verrattuna.
NVIDIA GP102 lohkokaavio
Lisäksi GP100:ssa jokaista FP32-toimintojen 64 CUDA-ydintä kohden on 32 ydintä FP64:lle, kun taas GP102:n SM:ssä on Maxwellilta peritty konfiguraatio tässä suhteessa: 128 CUDA-ydintä FP32:lle ja 4 FP64:lle. Tästä syystä GP102:n lyhennetty kaksinkertainen tarkkuussuorituskyky.
Lopuksi GP100:ssa on suurempi L2-välimuisti: 4096 kt verrattuna GP102:n 3072 kt:iin. Ja tietysti, GP102:sta puuttuu NVLINK-väyläohjain, ja HBM2-muistiohjaimet (jonka väylän kokonaisleveys on 4096 bittiä) korvataan GDDR5X SDRAM -ohjaimilla. 12 näistä 32-bittisistä ohjaimista tarjoavat yhteisen 384-bittisen muistiväylän.
Muissa meitä kiinnostavissa asioissa GP100- ja GP102-sirut ovat identtisiä. Molemmat suulakkeet sisältävät 3840 FP32-yhteensopivaa CUDA-ydintä ja 240 pintakuviokartoitinta sekä 96 ROP:ta. Täten yleisestä näkökulmasta katsottuna GP102-laskentayksiköiden rakenne toistaa GP104-sirun rakennetta määrällisillä muutoksilla korjattuna. Vaikka emme vieläkään tiedä joitain parametreja (L1-välimuisti, jaettu muisti ja rekisteritiedostojen koot), ne ovat luultavasti samat näissä kahdessa GPU:ssa.
TSMC:n 16 nm:n FinFET-prosessitekniikalla valmistettu GP102-siru sisältää 12 miljardia transistoria 471 mm2:n alueella. Vertailun vuoksi: GP100:n ominaisuudet ovat 15,3 miljardia transistoria ja 610 mm 2. Tämä on erittäin merkittävä ero. Lisäksi, jos TSMC ei ole lisännyt fotomaskin kokoa 16 nm:n prosessissa verrattuna 28 nm:iin, GP100 on melkein lopussa, kun taas GP102:n kevyt arkkitehtuuri antaa NVIDIAlle mahdollisuuden luoda suuremman ytimen laajalle kuluttajamarkkinoille tulevaisuudessa käyttämällä samaa tuotantolinjaa (mikä ei kuitenkaan todennäköisesti tapahdu, elleivät kehittäjät harkitse uudelleen huippumallien TDP-standardejaan).
Mitä tulee Pascal-arkkitehtuurin ja Maxwellin välisiin eroihin, suosittelemme tutustumaan GeForce GTX 1080 -arvosteluumme. Tässä iteraatiossa kehittäjät ovat kehittäneet edellisen sukupolven etuja ja kompensoineet sen luontaiset puutteet.
Huomioimme lyhyesti seuraavat seikat:
- parannettu värin pakkaussuhde jopa 8:1;
- PolyMorph Enginen Simultaneous Multi-Projection -toiminto, jonka avulla voit luoda jopa 16 projektiota kohtauksen geometriasta yhdellä kertaa (VR:lle ja järjestelmille, joissa on useita näyttöjä NVIDIA Surround -kokoonpanossa);
- kyky keskeyttää (ennakkoosto) piirtokutsua (renderöinnin aikana) ja komentovirtaa (laskelmien aikana) suoritettaessa, mikä yhdessä GPU-laskentaresurssien dynaamisen allokoinnin kanssa tarjoaa täyden tuen asynkroniselle laskennalle (Async Compute) - lisäsuorituskyvyn lähde peleissä DirectX 12 API:n alaisuudessa ja pienempi viive VR:ssä;
- DisplayPort 1.3/1.4- ja HDMI 2.b -liitäntöjen kanssa yhteensopiva näytönohjain. Tuki korkealle dynaamiselle alueelle (HDR);
- SLI-väylä suurennetulla kaistanleveydellä.
⇡ Tekniset tiedot, hinta
TITAN X ei käytä täysin toimivaa versiota GP102 GPU:sta: 30 SM:stä kaksi on poistettu käytöstä tässä. Siten CUDA-ytimien ja pintakuvioyksiköiden lukumäärän suhteen Titan vastaa Tesla P100:aa, jossa GP100-siru on myös osittain "leikattu" (3584 CUDA-ydintä ja 224 pintakuvioyksikköä).
Uutuuden grafiikkaprosessori toimii korkeammilla taajuuksilla (1417/1531 MHz) kuin Tesla P100:ssa (jopa 1328/1480 MHz supertietokoneversiossa ja jopa 1300 MHz PCI-Express-levyn muotokertoimessa). Silti "Titanin" taajuudet ovat melko konservatiivisia verrattuna GeForce GTX 1080:n (1607/1733 MHz) ominaisuuksiin. Kuten ylikellotuskokeissa nähdään, rajoittava tekijä oli laitteen virrankulutus, jonka NVIDIA asetti tutuille 250 W:lle.
TITAN X on varustettu 12 Gt:n GDDR5X SDRAM-muistilla, jonka kaistanleveys on 10 Gbps per pin. 384-bittinen väylä tarjoaa tiedonsiirron nopeudella 480 Gt / s: tässä indikaattorissa TITAN X on vain hieman huonompi kuin nykyinen ennätyksen haltija - Radeon R9 Fury X sekä muut GPU Fiji -pohjaiset AMD-tuotteet ( 512 Gt/s).
Valmistaja | NVIDIA | |||||
Malli | GeForce GTX TITAN | GeForce GTX TITAN musta | GeForce GTX TITAN Z | GeForce GTX TITAN X | GeForce GTX 1080 | TITAN X |
GPU | ||||||
Nimi | GK110 | GK110 | 2 × GK110 | GM200 | GP104 | GP102 |
mikroarkkitehtuuri | Kepler | Kepler | Kepler | Maxwell | Pascal | Pascal |
Prosessitekniikka, nm | 28 nm | 28 nm | 28 nm | 28 nm | 16nm FinFET | 16nm FinFET |
Transistorien lukumäärä, milj | 7 080 | 7 080 | 2×7080 | 8 000 | 7 200 | 12 000 |
Kellotaajuus, MHz: peruskello / tehostuskello | 837/876 | 889/980 | 705/876 | 1 000 / 1 089 | 1 607 / 1 733 | 1 417 / 1531 |
Shader ALU:iden lukumäärä | 2 688 | 2 880 | 2×2880 | 3 072 | 2 560 | 3 584 |
Tekstuuripeittokuvien määrä | 224 | 240 | 2×240 | 192 | 160 | 224 |
ROP:ien määrä | 48 | 48 | 2×48 | 96 | 64 | 96 |
RAM | ||||||
Bussin leveys, vähän | 384 | 384 | 2×384 | 384 | 256 | 384 |
Sirun tyyppi | GDDR5 SDRAM | GDDR5 SDRAM | GDDR5 SDRAM | GDDR5 SDRAM | GDDR5X SDRAM | GDDR5X SDRAM |
Kellotaajuus, MHz (kaistanleveys kontaktia kohti, Mbps) | 1 502 (6 008) | 1 750 (7 000) | 1 750 (7 000) | 1 753 (7 012) | 1 250 (10 000) | 1 250 (10 000) |
Tilavuus, MB | 6 144 | 6 144 | 2×6144 | 12 288 | 8 192 | 12 288 |
I/O-väylä | PCI Express 3.0 x16 | PCI Express 3.0 x16 | PCI Express 3.0 x16 | PCI Express 3.0 x16 | PCI Express 3.0 x16 | PCI Express 3.0 x16 |
Esitys | ||||||
Huippusuorituskyky FP32, GFLOPS (perustuu määritettyyn enimmäistaajuuteen) | 4 709 | 5 645 | 10 092 | 6 691 | 8 873 | 10 974 |
Suorituskyky FP32/FP64 | 1/3 | 1/3 | 1/3 | 1/32 | 1/32 | 1/32 |
RAM-muistin kaistanleveys, GB/s | 288 | 336 | 2×336 | 336 | 320 | 480 |
Kuvan ulostulo | ||||||
Kuvan ulostuloliitännät | DL DVI-I, DisplayPort 1.2, HDMI 1.4a | DL DVI-D, DL DVI-I, DisplayPort 1.2, HDMI 1.4a | DL DVI-I, DisplayPort 1.2, HDMI 1.4a | DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b | ||
TDP, W | 250 | 250 | 375 | 250 | 180 | 250 |
Suositeltu vähittäismyyntihinta julkaisuhetkellä (USA, ilman veroja), $ | 999 | 999 | 2 999 | 999 | 599/699 | 1 200 |
Suositeltu vähittäismyyntihinta julkaisuhetkellä (Venäjä), hiero. | 34 990 | 35 990 | 114 990 | 74 900 | — / 54 990 | — |
Teoreettisen suorituskyvyn osalta TITAN X on ensimmäinen yhden GPU:n näytönohjain, joka ylittää 10 TFLOPS:n FP32-suorituskyvyssä. Aiemmista NVIDIA-tuotteista vain GK110-sirulle rakennettu TITAN Z pystyi tähän. Toisaalta, toisin kuin Tesla P100 (ja samoin kuin GeForce GTX 1060/1070/1080), TITAN X:lle on ominaista erittäin vaatimaton suorituskyky kaksinkertaisella (1/32 FP32:sta) ja puoleisella tarkkuudella (1/64 FP32:sta). laskelmia, mutta pystyy suorittamaan operaatioita int8-numeroilla nopeudella, joka on 4 kertaa nopeampi kuin FP32:lla. Muut Pascal-perheen GPU:t - GP104 (GeForce GTX 1070 /1080, Tesla P4) ja GP106 (GTX 1060) ja GP100 (Tesla P100) tukevat myös int8:aa suorituskykysuhteella 4:1 suhteessa FP32:een, mutta tällä hetkellä emme tiedä. jos tämä on rajoitettu toiminnallisuus GeForce-pelinäytönohjainkorteissa.
TITAN X on erittäin, erittäin kallis ostos, jonka valitsevat vain ne, jotka todella haluavat saada niin täydellisen näytönohjaimen. NVIDIA on nostanut hintaa 200 dollarilla aiemmista yksikantaisista malleista 1 200 dollariin. Tällä kertaa laitetta ei jaeta kumppaneiden kautta, ja sitä myydään vain NVIDIA-verkkosivustolla tietyissä maissa. Venäjä ei ole vielä heidän joukossaan.
⇡ Design
Näytönohjaimen kotelo on valmistettu samalla tyylillä kuin GeForce 10 -sarjan Founders Edition -tuotemerkin tuotteet. Jäähdytysjärjestelmä radiaalituulettimella (turbiinilla) on peitetty metallikotelolla ja painetun piirin takapinta levy on suojattu paksulla levyllä. Osa jälkimmäisestä voidaan irrottaa, jotta ilma pääsee esteettömästi viereisen näytönohjaimen jäähdyttimeen SLI-tilassa. Hassua, että vaikka TITAN X ei muodollisesti enää kuulu GeForce-perheeseen, on tämä vihreillä LEDeillä valaistu kirjoitus edelleen näytönohjaimen kyljessä.
Jäähdyttimen rakenne on sama kuin GTX 1070/1080:ssa: GPU luovuttaa lämpöä jäähdytyselementille haihdutuskammiolla, kun taas RAM-sirut ja jännitteenmuunnintransistorit on peitetty massiivisella alumiinirungolla, jossa on erillinen lohko. pienistä eväistä.
Muuten, kuten yksi TITAN X:n omistajista huomasi, NVIDIA antaa käyttäjille mahdollisuuden vaihtaa näytönohjaimen jäähdytysjärjestelmän johonkin tehokkaampaan (esimerkiksi LSS) menettämättä takuuta.
⇡ Maksaa
Kuten GTX 1060/1070/1080:n vertailuversiot, TITAN X -kortissa on kolme DisplayPort-liitintä ja yksi DVI- ja HDMI-liitin.
Virtajärjestelmä on rakennettu 6 + 1 -kaavion mukaan (GPU:n ja muistisirujen vaiheiden lukumäärä). Käytössä on kaksi lisävirtaliitintä - kuusi- ja kahdeksannapainen, jotka yhdessä PCI-Express-liittimen virtalinjojen kanssa tarjoavat näytönohjaimelle 300 watin tehoreservin.
GDDR5X SDRAM -muisti, kuten GeForce GTX 1080:ssa, koostuu Micron D9TXS -mikropiireistä, joiden normaali tehollinen taajuus on 10 GHz.
⇡ Testiteline, testausmenetelmät
Testitelineen kokoonpano | |
---|---|
prosessori | Intel Core i7-5960X @ 4GHz (100×40) |
Emolevy | ASUS RAMPAGE V EXTREME |
RAM | Corsair Vengeance LPX, 2133 MHz, 4 × 4 Gt |
ROM | Intel SSD 520 240 Gt + Crucial M550 512 Gt |
Virtalähde | Corsair AX1200i 1200W |
CPU jäähdytysjärjestelmä | Thermalright Archon |
Kehys | CoolerMaster Test Bench V1.0 |
Monitori | NEC EA244UHD |
Käyttöjärjestelmä | Windows 10 Pro x64 |
AMD GPU ohjelmisto | |
Kaikki | Radeon Software Crimson Edition 16.8.2 Ei-WHQL |
NVIDIA GPU -ohjelmisto | |
Kaikki | GeForce Game Ready -ohjain 372.54 WHQL |
CPU toimii vakiotaajuudella. NVIDIA-ohjainasetuksissa prosessori on valittu PhysX-laskennan prosessoriksi. AMD-ohjainasetuksissa Tesselation-asetus on siirretty AMD Optimized -asetuksesta Käytä sovellusasetuksia.
Vertailuarvot: pelit | ||||
---|---|---|---|---|
Peli (julkaisupäivän järjestyksessä) | API | asetukset | Koko näytön anti-aliasing | |
1920×1080 / 2560×1440 | 3840×2160 | |||
Crysis 3 + FRAPS | DirectX 11 | Max. laatu. Swamp-tehtävän alku | MSAA 4x | Vinossa |
Battlefield 4 + FRAPS | Max. laatu. Tashgar-tehtävän alku | MSAA 4x + FXAA High | ||
Metro: Last Light Redux, sisäänrakennettu vertailukohta | Max. laatu | SSAA 4x | ||
GTA V, sisäänrakennettu benchmark | Max. laatu | MSAA 4x + FXAA | ||
DiRT ralli | Max. laatu | MSAA 4x | ||
Rise of the Tomb Raider, sisäänrakennettu vertailukohta | DirectX 12 | Max. laatu, VXAO pois päältä | SSAA 4x | |
Tom Clancy's The Division, sisäänrakennettu benchmark | DirectX 11 | Max. laatu, HFTS pois päältä | SMAA 1x Ultra | |
HITMAN, sisäänrakennettu benchmark | DirectX 12 | Max. laatu | SSAA 4x | |
Ashes of the Singularity, sisäänrakennettu benchmark | DirectX 12 | Max. laatu | MSAA 4x + Temporaalinen AA 4x | |
DOOM | Vulkan | Max. laatu. Mission valimo | TSSAA 8TX | |
Total War: WARHAMMER, sisäänrakennettu vertailukohta | DirectX 12 | Max. laatu | MSAA 4x |
Vertailuarvot: videon dekoodaus, tietojenkäsittely | |
---|---|
Ohjelmoida | asetukset |
DXVA Checker, Decode Benchmark, H.264 | Tiedostot 1920 × 1080p (High Profile, L4.1), 3840 × 2160p (High Profile, L5.1). Microsoft H264 videodekooderi |
DXVA Checker, Decode Benchmark, H.265 | Tiedostot 1920 × 1080p (pääprofiili, L4.0), 3840 × 2160p (pääprofiili, L5.0). Microsoft H265 videodekooderi |
LuxMark 3.1x64 | Hotel Lobby Stage (monimutkainen vertailuarvo) |
Sony Vegas Pro 13 | Sonyn vertailukohta Vegas Pro 11:lle, kesto 65 s, renderöity XDCAM EX:llä, 1920×1080p 24Hz |
SiSoftware Sandra 2016 SP1, GPGPU tieteellinen analyysi | OpenCL, FP32/FP64 |
CompuBench CL Desktop Edition X64, Ocean Surface Simulation | — |
CompuBench CL Desktop Edition X64, hiukkassimulaatio – 64K | — |
⇡ Testin osallistujat
Seuraavat näytönohjaimet osallistuivat suorituskykytestaukseen:
- NVIDIA TITAN X (1417/10000 MHz, 12 Gt);
⇡ Esitys: 3DMark
Synteettiset testit osoittavat TITAN X:n keskimääräisen edun GeForce GTX 1080:een verrattuna 25 %. Verrattuna edelliseen TITAN-tuotemerkin sukupolveen sekä Radeon R9 Fury X:ään, uusi lippulaiva tarjoaa 61-63% paremman suorituskyvyn ja yli kaksinkertaisen suorituskyvyn verrattuna Kepler-arkkitehtuuriin perustuvaan TITANin ensimmäiseen versioon. Melko korkealla asemalla verrattuna NVIDIA-kiihdytin on Radeon R9 295X2 - uusi tuote on vain 18% nopeampi 3DMarkissa.
3DMark (grafiikkapisteet) | |||||||
---|---|---|---|---|---|---|---|
Lupa | |||||||
tulilakko | 1920×1080 | 26 341 | 10 449 | 17 074 | 21 648 | 23 962 | 16 279 |
Fire Strike Extreme | 2560×1440 | 13 025 | 4 766 | 7 945 | 10 207 | 10 527 | 7 745 |
Fire Strike Ultra | 3840×2160 | 6 488 | 2 299 | 4 011 | 4 994 | 5 399 | 3 942 |
ajan vakooja | 2560×1440 | 8 295 | 2 614 | 4 935 | 6 955 | 7 186 | 5 084 |
Max. | −60% | −35% | −16% | −9% | −38% | ||
Keskiverto | −64% | −38% | −20% | −15% | −39% | ||
Min. | −68% | −41% | −23% | −19% | −41% |
⇡ Suorituskyky: pelaaminen (1920×1080, 2560 × 1440)
Testeissä suhteellisen alhaisella resoluutiolla niin tehokkaalle GPU:lle, uusi TITAN X ylittää GeForce GTX 1080:n 15-20 % (1080p:stä 1440p:hen vastaavasti) keskimääräisillä tuloksilla. Uusi lippulaiva näyttää vieläkin vaikuttavammalta verrattuna 28 nm jakson parhaisiin kiihdyttimiin: se on 47-56 % nopeampi kuin GM200:een perustuva GeForce GTX TITAN X ja 67-72 % Radeon R9 Fury X:ää nopeampi.
Jos otamme Kepler-sukupolven aivan ensimmäisen TITANin, puhumme yli kaksinkertaisesta suorituskyvyn kasvusta.
1920×1080 | |||||||
---|---|---|---|---|---|---|---|
Koko näytön anti-aliasing | NVIDIA TITAN X (1417/10000MHz, 12GB) | NVIDIA GeForce GTX TITAN (837/6008MHz, 6GB) | NVIDIA GeForce GTX TITAN X (1000/7012MHz, 12GB) | NVIDIA GeForce GTX 1080 (1607/10008 MHz, 8 Gt) | AMD Radeon R9 295X2 (1018/5000MHz, 8GB) | AMD Radeon R9 Fury X (1050/1000MHz, 4GB) | |
Ashes of the Singularity | MSAA 4x | 47 | 20 | 31 | 42 | 34 | 26 |
Taistelukenttä 4 | MSAA 4x + FXAA High | 162 | 71 | 118 | 149 | 134 | 94 |
Crysis 3 | MSAA 4x | 99 | 45 | 65 | 79 | 90 | 60 |
DiRT ralli | MSAA 4x | 126 | 57 | 83 | 101 | 97 | 65 |
DOOM | TSSAA 8TX | 200 | 69 | 151 | 185 | 122 | 156 |
GTA V | MSAA 4x + FXAA | 85 | 44 | 68 | 84 | 76 | 52 |
HITMAN | SSAA 4x | 68 | 21 | 39 | 52 | 24 | 33 |
Metro: Last Light Redux | SSAA 4x | 124 | 47 | 73 | 92 | 94 | 70 |
Tomb Raiderin nousu | SSAA 4x | 70 | 28 | 47 | 62 | 55 | 41 |
Tom Clancy's The Division | SMAA 1x Ultra | 87 | 35 | 59 | 80 | 57 | 58 |
Total War: WARHAMMER | MSAA 4x | 76 | 38 | 56 | 73 | 37 | 49 |
Max. | −48% | −20% | −0% | −9% | −22% | ||
Keskiverto | −58% | −32% | −13% | −29% | −40% | ||
Min. | −69% | −43% | −26% | −65% | −51% |
2560×1440 | |||||||
---|---|---|---|---|---|---|---|
Koko näytön anti-aliasing | NVIDIA TITAN X (1417/10000MHz, 12GB) | NVIDIA GeForce GTX TITAN (837/6008MHz, 6GB) | NVIDIA GeForce GTX TITAN X (1000/7012MHz, 12GB) | NVIDIA GeForce GTX 1080 (1607/10008 MHz, 8 Gt) | AMD Radeon R9 295X2 (1018/5000MHz, 8GB) | AMD Radeon R9 Fury X (1050/1000MHz, 4GB) | |
Ashes of the Singularity | MSAA 4x | 39 | 16 | 24 | 33 | 27 | 21 |
Taistelukenttä 4 | MSAA 4x + FXAA High | 109 | 47 | 75 | 98 | 95 | 65 |
Crysis 3 | MSAA 4x | 63 | 27 | 40 | 53 | 59 | 39 |
DiRT ralli | MSAA 4x | 93 | 40 | 60 | 74 | 71 | 48 |
DOOM | TSSAA 8TX | 166 | 45 | 95 | 126 | 82 | 107 |
GTA V | SMAA | 67 | 31 | 48 | 63 | 61 | 39 |
HITMAN | MSAA 4x + FXAA | 43 | 13 | 24 | 33 | 12 | 17 |
Metro: Last Light Redux | SSAA 4x | 71 | 26 | 43 | 52 | 54 | 43 |
Tomb Raiderin nousu | Ei tueta | 44 | 16 | 28 | 38 | 23 | 27 |
Tom Clancy's The Division | SSAA 4x | 63 | 24 | 43 | 58 | 45 | 44 |
Total War: WARHAMMER | SMAA 1x korkea | 57 | 26 | 39 | 50 | 25 | 34 |
Max. | −53% | −29% | −6% | −6% | −30% | ||
Keskiverto | −61% | −36% | −16% | −33% | −42% | ||
Min. | −73% | −44% | −27% | −72% | −60% |
merkintä:
⇡ Suorituskyky: pelaaminen (3840×2160)
Kun siirrytään 1440p:stä 4K:han, NVIDIA-näytönohjainkorttien välinen suhde pysyy samana. TITAN X on 20 % nopeampi kuin GeForce GTX 1080 ja 56 % nopeampi kuin Maxwell-pohjainen TITAN X.
Tälle mallille tyypillinen Radeon R9 Fury X selviytyy tehokkaammin 4K-testeistä, mikä lopulta laski "Titanin" edun 56 prosenttiin.
3840×2160 | |||||||
---|---|---|---|---|---|---|---|
Koko näytön anti-aliasing | NVIDIA TITAN X (1417/10000MHz, 12GB) | NVIDIA GeForce GTX TITAN (837/6008MHz, 6GB) | NVIDIA GeForce GTX TITAN X (1000/7012MHz, 12GB) | NVIDIA GeForce GTX 1080 (1607/10008 MHz, 8 Gt) | AMD Radeon R9 295X2 (1018/5000MHz, 8GB) | AMD Radeon R9 Fury X (1050/1000MHz, 4GB) | |
Ashes of the Singularity | Vinossa | 45 | 20 | 29 | 41 | 38 | 37 |
Taistelukenttä 4 | 84 | 35 | 57 | 74 | 72 | 52 | |
Crysis 3 | 42 | 18 | 28 | 36 | 40 | 29 | |
DiRT ralli | 65 | 26 | 41 | 50 | 48 | 33 | |
DOOM | 92 | 24 | 51 | 68 | 45 | 57 | |
GTA V | 55 | 25 | 39 | 51 | 49 | 34 | |
HITMAN | 67 | 21 | 38 | 53 | 24 | 33 | |
Metro: Last Light Redux | 64 | 23 | 38 | 47 | 47 | 38 | |
Tomb Raiderin nousu | 50 | 19 | 33 | 44 | 37 | 31 | |
Tom Clancy's The Division | 38 | 15 | 25 | 33 | 26 | 28 | |
Total War: WARHAMMER | 43 | 20 | 30 | 38 | 20 | 32 | |
Max. | −53% | −29% | −7% | −5% | −18% | ||
Keskiverto | −61% | −36% | −16% | −29% | −36% | ||
Min. | −74% | −45% | −27% | −64% | −51% |
merkintä: Total War: WARHAMMER ei tue DirectX 12:ta GeForce GTX TITANille.
⇡ Suorituskyky: videon dekoodaus
GP102 integroi saman laitteistokoodekin kuin kaksi Pascal-perheen nuorempaa GPU:ta, joten TITAN X esittelee H.264- ja HEVC-standardien dekoodausnopeutta GeForce GTX 1080:n kanssa, ja se on säädetty alhaisemmille GPU-kellonopeuksille. Pascalin suorituskyky tässä tehtävässä on lyömätön sekä Maxwell-sirujen NVIDIA-koodekkeihin että AMD Polariksen koodekkeihin verrattuna.
merkintä: koska dekooderit eivät yleensä eroa saman GPU-linjan sisällä, kaavioissa näkyy yksi laite jokaisesta perheestä (tai useampi, jos tätä sääntöä rikotaan).
Merkintä. 2: GeForce GTXTITAN X, kuten muutkin Maxwell GPU -arkkitehtuuriin perustuvat laitteet, paitsi GM204 (GeForce GTX 950/960), suorittaa osittaisen H.265-laitteiston dekoodauksen CPU-resurssien varmuuskopioituna.
⇡ Suorituskyky: Tietotekniikka
GPGPU-tehtävien eri arkkitehtuurien välinen suhde riippuu kunkin sovelluksen erityispiirteistä. TITAN X tarjoaa ennustettavia suorituskyvyn lisäyksiä GeForce GTX 1080:een verrattuna, mutta on poikkeustapauksia, joissa tehtävä riippuu GPU:n taajuudesta (kuten hiukkasfysiikan testi CompuBench CL:ssä ja renderöinti Sony Vegasissa): tässä etu on GTX 1080:n puolella. Päinvastoin, uusi TITAN X kosti tilanteessa, jossa GeForce GTX 1080 on huonompi kuin Maxwell-pohjainen TITAN X ja Radeon R9 Fury X (säteilynseuranta LuxMarkissa).
SiSoftware Sandran Matriisikerto- ja Fast Fourier Transform -testissä TITAN X on erinomainen FP32-tilassa. Mitä tulee FP64:ään, yksinkertaisesti raa'an voiman (suuri määrä CUDA-ytimiä ja korkeat kellotaajuudet) vuoksi kiihdytin saavutti paremman suorituskyvyn kuin Kepler-sukupolven alkuperäinen TITAN ja Radeon R9 Fury X - näytönohjaimet, joilla on edullisempi suhde. suorituskykyä FP32:n ja FP64:n kanssa. Tämä ei lopulta poista TITAN X:ää täysin kaksinkertaisena tarkkuuden tehtävien kiihdyttimenä. Radeon R9 295X2 sopii kuitenkin parhaiten tähän tarkoitukseen. AMD-näytönohjainkorteilla on vahva asema myös joissakin muissa testeissä: CompuBench CL:n vedenpinnan laskennassa ja Sony Vegasissa.
⇡ Kellonopeudet, virrankulutus, lämpötila, ylikellotus
Pelikuormituksella TITAN X GPU saavuttaa ajoittain samat korkeat kellotaajuudet kuin GTX 1080:n GP104 (1848 vs. 1860 MHz), mutta suurimman osan ajasta se pysyy huomattavasti alhaisemmalla alueella (1557-1671 MHz). Samaan aikaan GPU:n maksimisyöttöjännite on 1,062 V (1,05 V GTX 1080:ssa).
CO-puhallin pyörii jopa 2472 rpm:n nopeudella. Kortti vaatii vahvempaa jäähdytystä kuin GTX 1080, ja koska coolerin muotoilu on pysynyt ennallaan, se aiheuttaa enemmän kohinaa. Tämän tekijän kompensoimiseksi TITAN X:lle on asetettu 3 °C korkeampi GPU-tavoitelämpötila.
Vaikka Pascal-pohjaisella TITAN X:llä on teknisesti sama TDP kuin edellisen sukupolven TITAN X:llä, käytännössä uudella näytönohjaimella varustettu järjestelmä kehittää huomattavasti enemmän tehoa (49 W). Kuitenkin lisääntynyt kuormitus prosessorille, joka palvelee tehokkaampaa näytönohjainta, voi kuitenkin vaikuttaa tähän. Toisaalta FurMarkissa kaikki 250 W:n TDP-kiihdyttimet (samoin kuin 275 W Fury X) ovat samalla tasolla.
Titanin ylikellottamiseksi hyödynsimme varastokykyä nostaa näytönohjaimen tehorajaa 20 %, käyttää CO-turbiinia täydellä nopeudella (4837 rpm) ja nostaa GPU:n maksimijännitteen 1,093 V:iin (sama arvo kuin GTX 1080:ssa). Tämän seurauksena pystyimme nostamaan GPU:n perustaajuuden 200 MHz 1617 MHz:iin ja tehollisen muistitaajuuden 11100 MHz:iin.
Pelkästään tämä ei ole huono niin suurelle sirulle, mutta korotettu tehoraja ei ole vähemmän tärkeä. Ylikellotettu grafiikkasuoritin tukee taajuuksia alueella 1974-1987 MHz, huippuna 2063 MHz, mikä ei ole vähempää kuin hämmästyttävä saavutus. Vertailun vuoksi: GTX 1080 -esiintymämme GPU:n huipputaajuus ylikellotuksen aikana oli 2126 MHz.
Ylikellotetulla TITAN X:llä varustettu järjestelmä tuottaa 46 W enemmän tehoa kuin tavallinen näytönohjain. Suurimpaan nopeuteen nostettu tuuletin alensi grafiikkasuorittimen lämpötilaa 17-20 °C, mikä antaa käyttäjille mahdollisuuden odottaa yhtä tehokasta ylikellotusta pienemmillä nopeuksilla, mikä tarjoaa suhteellisen mukavan melutason.
⇡ Suorituskyky: ylikellotus
TITAN X:n ylikellotus mahdollistaa erittäin merkittävän suorituskyvyn kasvun - 14 % 3DMarkissa ja 18-23 % pelien vertailuarvoissa 1080p- ja 1440p-resoluutioilla. Pelissä 4K-resoluutiolla bonus on 26%.
Ero ylikellotetun TITAN X:n ja referenssitaajuuksilla toimivan GeForce GTX 1080:n välillä saavuttaa järkyttävät arvot 36%, 47% ja 50% kolmella käyttämämme resoluutiolla. Tietysti myös GTX 1080 itsessään on ylikellotuksen alainen, mutta kuten muistamme vertailunäytönohjaimen katsauksestamme, tämä lisää vain 9, 13 ja 12% tuloksiin. Siten, jos vertaamme GeForce 10 -linjan ylikellotettua lippulaivaa ja ylikellotettua TITAN X:ää, jälkimmäisen etu on 25, 30 ja 34%.
Käyttämällä vanhoja ylikellotettuja GeForce GTX TITAN X GM200 -sirun suorituskykytietojamme teemme samanlaisia laskelmia vertaillaksemme kahta Titan-sukupolvea. Pascalin ylikellotettu TITAN X on edeltäjäänsä 75, 93 ja 97 % edellä. Kun molemmat kiihdyttimet ylikellotetaan, uutuus säilyttää 74 ja 70 % johtoaseman 1440p- ja 2160p-resoluutioilla. Me (kuten tätä päätöstä kritisoivat lukijat muistavat) kieltäytyimme testaamasta 1080p-tilassa GeForce GTX TITAN X -katsauksessa.
3DMark (grafiikkapisteet) | ||||||
---|---|---|---|---|---|---|
Lupa | NVIDIA GeForce GTX 1080 (1607/10008 MHz, 8 Gt) | NVIDIA TITAN X (1417/10000MHz, 12GB) | ||||
tulilakko | 1920×1080 | 21 648 | 26 341 | 31 038 | ||
Fire Strike Extreme | 2560×1440 | 10 207 | 13 025 | 15 191 | ||
Fire Strike Ultra | 3840×2160 | 4 994 | 6 488 | 7 552 | ||
ajan vakooja | 2560×1440 | 6 955 | 8 295 | 8 644 | ||
Max. | +30% | +51% | ||||
Keskiverto | +25% | +42% | ||||
Min. | +19% | 101 | 126 | 126 | ||
DOOM | TSSAA 8TX | 185 | 200 | 200 | ||
GTA V | MSAA 4x + FXAA | 84 | 85 | 96 | ||
HITMAN | SSAA 4x | 52 | 68 | 77 | ||
Metro: Last Light Redux | SSAA 4x | 92 | 124 | 140 | ||
Tomb Raiderin nousu | SSAA 4x | 62 | 70 | 94 | ||
Tom Clancy's The Division | SMAA 1x Ultra | 80 | 87 | 117 | ||
Total War: WARHAMMER | MSAA 4x | 73 | 76 | 88 | ||
Max. | +35% | +57% | ||||
Keskiverto | +16% | +36% | ||||
Min. | +0% | +8% |
2560×1440 | ||||
---|---|---|---|---|
Koko näytön anti-aliasing | NVIDIA GeForce GTX 1080 (1607/10008 MHz, 8 Gt) | NVIDIA TITAN X (1417/10000MHz, 12GB) | NVIDIA TITAN X (1617/11110MHz, 12GB) | |
Ashes of the Singularity | MSAA 4x | 33 | 39 | 48 |
Taistelukenttä 4 | MSAA 4x + FXAA High | 98 | 109 | 146 |
Crysis 3 | MSAA 4x | 53 | 63 | 81 |
DiRT ralli | MSAA 4x | 74 | 93 | 93 |
DOOM | TSSAA 8TX | 126 | 166 | 183 |
GTA V | SMAA | 63 | 67 | 86 |
HITMAN | MSAA 4x + FXAA | 33 | 43 | 49 |
Metro: Last Light Redux | SSAA 4x | 52 | 71 | 82 |
Tomb Raiderin nousu | Ei tueta | 38 | 44 | 59 |
Tom Clancy's The Division | SSAA 4x | 58 | 63 | 86 |
Total War: WARHAMMER | SMAA 1x korkea | 50 | 57 | 74 |
Max. | +36% | +58% | ||
Keskiverto | +20% | +47% | ||
Min. | ||||
DOOM | 68 | 92 | 104 | |
GTA V | 51 | 55 | 75 | |
HITMAN | 53 | 67 | 77 | |
Metro: Last Light Redux | 47 | 64 | 74 | |
Tomb Raiderin nousu | 44 | 50 | 69 | |
Tom Clancy's The Division | 33 | 38 | 52 | |
Total War: WARHAMMER | 38 | 43 | 58 | |
Max. | +37% | +59% | ||
Keskiverto |
Nimi- ing | Radeon R9 290X | Radeon R9 295x2 | GeForce GTX 780 Ti | GeForce GTX Titan | GeForce GTX Titan Musta | GeForce GTX Titan Musta Z | GeForce GTX 980 | GeForce GTX Titan X |
koodinimi | Hawaii XT | Hawaii XT | GK110 | GK110 | GK110 | GK110 | GM204 | GM200 |
Versio | GCN 1.1 | GCN 1.1 | Kepler | Kepler | Kepler | Kepler | Maxwell 2.x | Maxwell 2.x |
Prosessitekniikka, nm | 28 | 28 | 28 | 28 | 28 | 28 | 28 | 28 |
Sydämen koko/hylsyt, mm 2 | 438 | 438x2 | 521 | 521 | 521 | 521x2 | 398 | – |
Transistorien lukumäärä, milj | 6200 | 6200x2 | 7100 | 7100 | 7100 | 7100x2 | 5200 | 8000 |
Ydintaajuus, MHz | – | – | 880 | 840 | 890 | 700 | 1126 | 1000 |
Ydintaajuus (Turbo), MHz | 1000 | 1018 | 930 | 880 | 980 | 880 | 1216 | 1075 |
Varjostimien lukumäärä (PS), kpl. | 2816 | 5632 | 2880 | 2688 | 2880 | 5760 | 2048 | 3072 |
Tekstuuriyksiköiden lukumäärä (TMU), kpl. | 176 | 352 | 240 | 224 | 240 | 480 | 128 | 192 |
Rasterointilohkojen lukumäärä (ROP), kpl. | 64 | 128 | 48 | 48 | 48 | 96 | 64 | 96 |
Suurin täyttönopeus, Gpix/s | 64 | 130 | 42 | 40.2 | 42.7 | 84.6 | 72 | – |
Suurin tekstuurin hakunopeus, Gtex/s | 176 | 358 | 210.2 | 187.5 | 213.4 | 338 | 144.1 | 192 |
Muistin tyyppi | GDDR5 | GDDR5 | GDDR5 | GDDR5 | GDDR5 | GDDR5 | GDDR5 | GDDR5 |
Tehokas muistitaajuus, MHz | 5000 | 5000 | 7000 | 6000 | 7000 | 7000 | 7000 | 7000 |
Muistin koko, GB | 4 | 4 + 4 | 3 | 6 | 6 | 6 + 6 | 4 | 12 |
Muistiväylä, vähän | 512 | 512 + 512 | 384 | 384 | 384 | 384 + 384 | 256 | 384 |
Muistin kaistanleveys, GB/s | 320 | 320 + 320 | 336 | 288.4 | 336 | 336 + 336 | 224.3 | 336.5 |
Virta, Pin-liittimet | 6 + 8 | 8 + 8 | 6 + 8 | 6 + 8 | 6 + 8 | 8 + 8 | 6 + 6 | 6 + 8 |
Virrankulutus (2D / 3D), wattia | -/290 | -/500 | -/250 | -/250 | -/250 | -/375 | -/165 | -/250 |
CrossFire/Sli | V | V | V | V | V | V | V | V |
Ilmoitushinta, $ | 550 | 1500 | 700 | 1000 | 1000 | 3000 | 550 | 999 |
Vaihdettava malli | – | HD 7990 | GTX 780 | – | GTX Titan | GTX 690 | GTX 780 Ti | Titan Black |
Ja nyt puhutaan hinnasta ja Venäjän todellisuudesta, koska taulukko näyttää näytönohjaimen arvioidut kustannukset. Loppujen lopuksi, ilmoituksesta huolimatta, Nvidia ei ollut kirjoittamishetkellä vielä viimeistellyt hintalappua, joten arvioijat voivat vain arvailla. Ilman tällaista tietoa on vaikea tehdä johtopäätöksiä.
Oletettavasti uusien tuotteiden tavoitehinta on 1000-1300 dollaria. Oletetaan, että se maksaa tasan tuhat dollaria. Kaupoissa tällainen hintalappu muunnetaan vähintään 65 000 ruplaksi, mikä kaventaa automaattisesti potentiaalisten kuluttajien piirin yhteen tai kahteen henkilöön kuukaudessa. Samaan aikaan korkea dollarin vaihtokurssi tyrmäsi sekä GeForce GTX 970:n että GeForce GTX 980:n ostajilta - ne kaikki ovat nyt yksinkertaisesti tavallisen pelaajan ulottumattomissa. Ja kyllä, GeForce GTX Titan X tulee olemaan nopea.
Näiden tapahtumien valossa monet käyttäjät joko eivät halua päivittää ollenkaan tai säästävät rahaa ja ostavat käytetyn mallin, mikä on varsin loogista ja perusteltua. Tämä tarkoittaa, että useimmat harrastajat näkevät GeForce GTX Titan X:n arvostelun joukona suuria lukuja.
Uudet 3D-tekniikat
VXGI-tuen, erilaisten anti-aliasing-menetelmien, tavallisen GPU Boostin ja monen muun lisäksi GeForce GTX Titan X, kuten kaikki aiemmat Nvidia-näytönohjaimet, alkaa vähitellen valmistautua 3D-virtuaalitodellisuuslaseihin. Suurin ongelma olemassa olevissa 3D-laitteissa on korkea vasteaika. Yhteenvetona voidaan todeta, että tällä käsitteellä tarkoitamme matriisin vasteaikaa, gyroskooppien vasteaikaa, graafisen tiedon välittymisaikaa kaasupolkimelta lasille. Oculus on edistynyt tänä vuonna paljon, mihin on auttanut DirectX 12:n julkistus, mutta grafiikan kehittäjiltä ei odoteta vähemmän työtä.
Juuri tämän Nvidia on tehnyt ja optimoinut ohjelmistoa. Vaikka en ole varma, vaikuttaako tämä koko mallivalikoimaan, todennäköisesti innovaatiot, vaikkakin ohjelmistolliset, vaikuttavat vain viimeiseen sukupolveen. Ja mikä itse asiassa on ongelma? Oculus-tekniikka on yksi näyttölähde, joka on jaettu kahteen näkyvään vyöhykkeeseen. Tämänhetkinen tilanne kypärässä olevan kuvan korkean renderointiviiveen vuoksi saa ihmisen huimausta ja usein pahoinvointia. Kuvittele olevasi "pyörtynyt", juuri siltä tunnet 10-30 minuutin kuluttua minkä tahansa dynaamisen pelin pelaamisesta Oculus-laseilla.
- VR SLI - kaksi näytönohjainta toimii erikseen kummallakin silmällä laseissa. Yleinen nopeus kasvaa, mikä vähentää huimausta.
- Asynkroninen tila yhdelle näytönohjaimelle. Tiedot gyroskoopeista välitetään grafiikkakiihdytin, ja seuraava kehys lasketaan vain osittain uudelleen, mikä säästää järjestelmäresursseja.
Kuinka paljon innovaatiot parantavat tuntemuksia, on vaikea vastata, ainakin ennen kuin itse tarkistat sen. Valitettavasti tiedotushetkellä lehdistöllä ei ollut kypäriä, joten voimme vain luottaa siihen.