Objavljeno: 29.6.2021 | Avtor: Jurij Kristan | Monitor Julij-avgust 2021

Grafični dvoboj na majavi brvi

Po dolgem času se konkurenčne grafične kartice znamk Geforce in Radeon spet gledajo iz oči v oči. Toda veselje ima grenak priokus, saj nam jo je pošteno zagodlo pomanjkanje čipov.

Navdušenci nad sestavljanjem računalnikov smo končno dočakali razburljivejše spremembe na tržišču, saj je postalo živahno tako na področju procesorjev kot grafičnih kartic. Na prvem je AMD ne le dohitel večnega tekmeca Intel, temveč ga je celo prehitel in ga spravil v kočljiv položaj. Na drugem s hitrimi koraki dohiteva še enega starega znanca, Nvidio. V zgolj dveh generacijah grafičnih čipov arhitekture RDNA so inženirji AMD več kot podvojili »zmogljivost na vat« kartic Radeon in tako ujeli priključek z geforcei, kar se je še pred nekaj leti zdelo skorajda nepojmljivo.

Toda situaciji pri omenjenih dvobojih se vendarle v marsičem razlikujeta. Intel je trenutno krvaveča žival, ki si poskuša lizati rane – predvsem tisto s spodletelim prehodom na nove proizvodne procese. Po drugi plati Nvidia še nikoli ni bila tako grozljivo močna. Njeni čipi si utirajo pot v oblak, superračunalnike in avtomobile, ima tudi izjemno zmogljiv razvojni oddelek. Z načrtovanim nakupom Arma bi obenem postala najpomembnejši dizajner polprevodniških vezij na svetu! AMD je tukaj pred znatno večjim izzivom. Kakšne možnosti sploh ima?

Ob testu aktualne generacije geforceov in radeonov si pobliže oglejmo, na katere tehnologije stavijo v enem in drugem taboru in kako se je področje igričarske grafike v zadnjem času pravzaprav razvilo.

Prosti tek zelenega tabora

Pri Nvidii so imeli v preteklih osmih letih le enega poglavitnega tekmeca: sami sebe. AMD radeoni so bili sicer čisto zgledne kartice, toda sleherni generaciji je kaj manjkalo; bodisi so se preveč greli bodisi so bili omejeni na le srednji del trga, kot serija RX 400. Geforcei so zato večji del prevladovali. Nvidijini osrednji letni dogodki, konference GPU Technology Conference, rdečega nasprotnika praktično niso niti omenjali. Namesto tega smo tam opazovali širokopotezne projekte s strojnim učenjem in širitev Nvidijinih čipov v oblak. V letu 2020 je tako promet iz naslova podatkovnih centrov že dosegel približno štiri petine tistega od geforceov.

Tisti, ki se radi igrajo z novimi tehnologijami, enostavno potrebujejo katerega od geforceov RTX 30, saj gre za tehnološko daleč najnaprednejše grafične kartice ta hip.

V podjetju so zato lahko eksperimentirali in se pred dvema letoma z arhitekturo Turing, oziroma serijo geforceov RTX 20, lotili korenitega premika, ki smo ga na področju grafičnih tehnologij že dolgo pričakovali: uvedli so strojno podporo sledenju žarkov, oziroma s tujko ray tracingu. Gre za strojno zahtevnejši, predvsem pa v temelju drugačen način izrisovanja 3D-scen v primerjavi z rasterizacijo, ki je trenutno uveljavljeni prijem. Ker je seveda industrijo 3D-grafike nemogoče v eni potezi obrniti na glavo, se novost uvaja postopno – sprva zgolj skozi določene elemente izrisovanja. To pomeni, da so geforcei RTX v osnovi še vedno podobni ostalim grafičnim karticam, imajo pa dodana vezja za pospeševanje sledenja žarkov (RT cores). Poleg njih tehnologija RTX vsebuje še en dodatek: namenski sklop za pospeševanje strojnega učenja oziroma globokih nevronskih mrež, kar imenujejo tensor cores. Sliši se vesoljsko, toda v praksi je bil RTX del čipa ob nastopu prešibak, da bi novitete zares prišle do izraza. Kakor hitro smo vklopili ray tracing bonbončke, je število sličic na sekundo strmoglavilo. Geforcei RTX 20 so se zato zdeli kvečjemu kot (pre)drag tehnološki demo.

Eden od razlogov za divje cene kartic je povpraševanje s strani rudarjev kriptovalut. Nvidia je tokrat aktivno ukrepala in s februarjem pričela omejevati zmogljivost novejših geforcov RTX 30 za rudarjenje ethra. Tako imenovani hash limiter prepolovi računsko zmogljivost pri rudarjenju in gre očitno globlje od ravni gonilnikov, saj mora biti kartica zanj prilagojena. Funkcionalnost imajo izdelki od RTX 3060 dalje, medtem ko starejši modeli s takšno osvežitvijo nosijo oznako LHR (lite hash rate). Podjetje je hkrati predstavilo čip, namenjen izključno rudarjenju ethra, Crypto-Mining Processor HX.

Arhitektura Ampere

Cilj s naslednikom turinga je bil torej jasen: narediti grafični procesor, ki bo znal tehnične novosti tudi poganjati pri »pravi« hitrosti. To so inženirji poskušali doseči tako z izpopolnitvijo procesnih sklopov kot s prehodom na naprednejši proizvodni proces: medtem ko so turingi narejeni pri TSMC v 12 nanometrih, ampere v geforceih RTX 30 proizvaja Samsung – v 8 nanometrih. Tako je v amperih preprosto vsega mnogo več: jeder CUDA oziroma splošnih senčilnikov, jeder RT in tenzorskih jeder ... Zgolj za primer: Geforce RTX 2080 Ti ima 4352 jeder CUDA, Geforce RTX 3090 pa kar 10.496! To daje na papirju navdušujoče pribitke zmogljivosti, in sicer med 50 in 100 odstotki, kar so skoki, ki jih v razmiku ene generacije nismo vajeni.

Omembe vrednih zanimivosti je še več. Močnejše med karticami nosijo nov tip pomnilnika, GDDR6X. Nastal je v sodelovanju Nvidie z Micronom in uporablja modulacijo s štirimi vrednostmi signala namesto dveh, kar pomeni, da lahko v enem urinem ciklu prenese dva bita namesto enega, kot v običajnem GDDR6. V praksi to pomeni, da ima starejši pomnilnik v RTX 3070 prepustnost 16 Gb/s, novejši v RTX 3090 pa 19,5 Gb/s, pri čimer se Nvidia malo drži nazaj, saj Micronove specifikacije omenjajo celo prepustnost 21 Gb/s. Po drugi plati je GDDR6X za zdaj še velikostno omejen, zato se pomnilnik na karticah RTX 30 po zmogljivosti ne razlikuje bistveno od starejših. Edini član, ki štrli iz množice, je RTX 3090 s 24 gigabajti RAM.

Druga posebnost je pri funkcijah, ki jih bomo pri grafičnih karticah srečevali vse pogosteje, namreč naprednega usmerjanja podatkov. Z rastjo igralnih ločljivosti na 4K in vse večjo kompleksnostjo 3D-scen skokovito raste tudi gora podatkov, ki potujejo med raznimi sklopi, kot sta procesor in pomnilnik. To ustvarja zastoje in porablja energijo, zato se vse več truda usmerja v to, da bi se izognili odvečnim tokovom (giga)bajtov. Eden takšnih prijemov je Microsoftov DirectStorage, ki omogoča nalaganje podatkov iz delovnega polnilnika neposredno v GPU, mimo centralnega procesorja. Nvidia je zamisel v Amperu implementirala pod imenom RTX I/O. Druga podobna tehnologija je Resizable BAR, ki prihaja iz naslova standarda za vodilo PCI Express in omogoča, da si CPU in GPU podatke izmenjujeta v večjih kosih, kar zmanjša število povpraševanj.

ASRock Phantom Gaming OC

Rdeča dednina

Medtem ko so si v Nvidii belili glavo s tem, kako optimizirati RTX, so imeli v AMD drugačno težavo: njihovi grafični čipi so za tekmečevimi kratko malo zaostajali v goli hitrosti izrisovanja. Za nameček se niso mogli več zanašati na pridobitve iz smeri boljšega proizvodnega procesa, saj so jih že uporabili, ko so pred dvema letoma prešli z arhitekture Vega na Navi prve generacije oziroma RDNA, ki sestavlja radeone RX 5000. Takrat so prestopili na aktualno 7-nanometrsko proizvodnjo TSMC, ki je v dobršni meri zaslužna za več kot 50-odstotno izboljšavo v zmogljivosti na vat. Za RDNA2 oziroma Navi druge generacije v radeonih RX 6000 so lahko izumljali zgolj v okviru same arhitekture.

Toliko bolj navdušujoče je zato, da jim je namera uspela, saj so podvig v izboljšavi učinkovitosti ponovili, in to zgolj z optimizacijo vezij! Žal natančnega vpogleda v RDNA2 v tem trenutku še vedno ni na voljo, vemo pa, da so inženirji dodobra spremenili osnovne izrisovalne enote, pri čemer so imeli eno poglavitno vodilo: varčevanje z elektriko. Pri tem naj bi jim močno pomagal procesorski oddelek v AMD, ki je nekaj podobnega počel v ryzenih. Rezultat je bistveni dvig frekvenc v jedru radeonov RX 6000 v primerjavi s prejšnjo generacijo – in sicer za tretjino! Takti tako presegajo dva gigaherca, kar je za čipe GPU vsekakor redkost.

AMD uporablja klasičen pomnilnik GDDR6, saj je GDDR6X Nvidijina pogruntavščina, zato pa ima še vedno prednost v velikosti, saj radeoni zvečine nosijo od 12 do 16 GB, geforcei pa od 8 do 12 GB pomnilnika. Toda RDNA2 ima v tem oziru še eno prav posebno novost: ogromen medpomnilnik, ki ga v AMD imenujejo Infinity Cache. V RX 6800 (XT) znaša 128 MB, v RX 6700 XT pa 96 MB. Tovrstne vmesne shrambe podatkov poznamo na igralnih konzolah, medtem ko so pri PC redkost in tako velikih, kot je Infinity Cache, tu doslej še nismo videli. Brez dvoma gre za posledico sodelovanja z Microsoftom in s Sonyjem, saj grafične rešitve na podlagi RDNA2 stojijo tudi v novih Xboxu in Playstationu. Smisel takšnega medpomnilnika je vnovič v zmanjšanju prometa med oddaljenimi deli sistema pa tudi varčevanju z energijo. Ni pa odveč omemba, da na čipu zavzame kar precejšen del prostora.

Minecraft z novimi karticami RTX zaživi popolnoma novo življenje. Oz. grafiko.

Po poti svetlobe

Če povzamemo: geforcei RTX 30 so tehnološko čudo, s katerim poskuša Nvidia v ospredje potisniti moderne funkcije, kot je ray tracing. Radeoni RX 6000 so bolj klasične sorte kartic, pri katerih se je AMD usmeril v surovo hitrost, torej število sličic na sekundo. Že res, da tudi RDNA2 pozna sledenje žarkov, toda implementacija je mnogo manj zmogljiva od Nvidijine – za več kot polovico. Toda preden preidemo na končne sklepe, se moramo te famozne grafične novitete lotiti podrobneje.

Pri rasteriziranju se za vsak piksel vprašamo, kako blizu so mu določeni geometrični elementi. Skozi desetletja smo se naučili pristop tako optimizirati, da danes lahko z njim pričaramo cele svetove. Izjemno učinkovit je pri izrisu geometrije, toda njegova šibka točka je svetloba. Tu pa pride do izraza ray tracing, saj ponazarja ravno naravno širjenje svetlobe skozi žarke ... a je po drugi plati strojno tako požrešen, da ga je nesmiselno uporabljati še za izrisovanje celotne geometrije. Ni torej presenečenje, da so Nvidijini inženirji zastavili hibridni pristop, kjer se geometrije še vedno lotevamo z rasteriziranjem, medtem ko nam žarki pomagajo pri svetlobnih in sorodnih učinkih.

Natančneje lahko trenutno rabo RT-efektov spravimo v tri skupine. V prvi je globalna osvetlitev, s čimer imenujemo simulacijo odboja svetlobe od površin, kar da prizorom naravnejše, mehkejše odtenke. Druga skupina se tiče verodostojnejših senc, tretja pa realističnih odsevov v zrcalih. Na primer okna na ulicah v Watch Dogs: Legion vestno odsevajo londonsko okolico. Snovalci iger lahko med omenjenimi funkcijami poljubno izbirajo in večina jih je trenutno v tem oziru še precej plahih. Edina igra, ki ta hip izkorišča poln repertoar RT-učinkov, je Control, sledi Metro Exodus, posebno z nedavno posodobitvijo Enhanced Edition. Ray tracing je brez dvoma prihodnost igričarske grafike in v nekaterih prizorih že zasije. Kljub temu ne bi mogli reči, da gre že za nujno pritiklino iger ali grafičnih kartic. Učinke še vedno podpira premalo studiev in pri tem so vse premalo pogumni. Počakati bo treba vsaj še eno generacijo kartic, če ne več, da se tehnologija res razširi.

Z RX 6000 je AMD končno ujel Nvidio - tudi pri podpori najmodernejšega programskega vmesnika DirectX 12 Ultimate.

Superločljivost

Ustavimo se za hip še pri drugem segmentu tehnologije RTX, podpori strojnemu učenju. Najprej velja poudariti, da je tenzorskih jeder v geforceih RTX 30 premalo, da bi te kartice lahko uporabljali prvinsko za poganjanje nevronskih mrež. Kdor išče take sorte izdelek, naj se ozre po namenskih čipih, kot je A100. Ta del hardvera v geforceih je namenjen zgolj podpori igričarskim funkcijam, in sicer trenutno na dva načina. Prvi je brisanje šuma v procesu računanja sledenja žarkov. To med drugim razloži, zakaj je Nvidia v RTX spakirala obe noviteti naenkrat – ker ray tracing brez odstranjevanja šuma pravzaprav ni izvedljiv.

Drugi način je s strojno pametjo podprta implementacija superločljivosti, kar Nvidia imenuje DLSS ali deep learning super sampling. 3D-scena se izriše pri nizki ločljivosti, nakar se jo v postprocesni fazi raztegne. Zamisel je še posebej uporabna pri kompenzaciji hardverske zahtevnosti ray tracinga, saj ta z rastočo ločljivostjo hitro poskoči. Prvotni način, DLSS 1.0, se je za vsako igro posebej učil izboljševanja slike, kar pa se ni obneslo. Z nastopom novih geforceov smo zato dobili DLSS 2.0, kjer je nevronska mreža ena sama za vse igre, a upošteva tudi gibanje objektov v sceni. To da precej boljše rezultate, toda obenem zahteva podporo snovalcev posamezne igre. Gre za uporabno tehnologijo in tudi AMD jo namerava uvesti še letos, pod imenom FidelityFX Super Resolution.

Kredit za grafično

Na tem mestu članka običajno stoji podrobnejša primerjava cen med posameznimi modeli. Tokrat pa bo drugače, ker je tržišče trenutno v takšnem razsulu, da je pametovati o posameznih cenah res povsem brez smisla. Pandemija, nadstandardno povpraševanje in kriptonorija so povzročili krizno pomanjkanje polprevodnikov v različnih vrstah industrije, še posebej na udaru je avtomobilska. Kot pravi spremna beseda k besedilu, so cene vrhunskih grafičnih kartic prav groteskno podivjale, in če dobite karkoli pod tisočakom, pojdite takoj vplačat še srečko na loterijo. Nič ne kaže, da se bo stanje jeseni bistveno izboljšalo in zaskrbljeni analitiki namigujejo, da bo kaos trajal celo do prihodnje pomladi.

Gainward RTX3080 Phantom

Odločitev o nakupu je v teh časih tako bistveno odvisna od tega, koliko ste pripravljeni reči preplačati. Na to sami ne moremo vplivati, lahko pa pomagamo s spoznanji o aktualni tehnologiji. Kogar v igrah zanima predvsem surovo število sličic na sekundo, lahko na posebnosti RTX še vedno mirne duše pozabi, saj so si novi geforcei in radeoni po goli hitrosti povsem primerljivi, medtem ko ray tracing za zdaj še ni nujna pridobitev. Posezite po tistem, kar vam uspe naribariti v mlakuži. Vsi vključeni modeli se dobro obnesejo pri ločljivosti 2.560×1.440, medtem ko je vrh ponudbe namenjen 4K. Tisti, ki se zares radi igrajo z novimi tehnologijami, pa enostavno potrebujejo katerega od geforceov RTX 30, saj gre za tehnološko daleč najnaprednejše grafične kartice ta hip. Pri tem naj merijo vsaj na RTX 3070, ker ray tracing šele tam postane praktičen. Če dobijo RTX 3080, toliko bolje. Naj vam obenem zaželimo srečo. Potrebovali jo boste.