Objavljeno: 25.2.2014 | Avtor: Simon Peter Vavpotič | Monitor Marec 2014

Več jeder in predpomnilnika, boljša grafika

Kaj lahko pričakujemo letošnje in prihodnje leto? Bodo nove procesorske arhitekture bistveno hitrejše? Bo vsa pohitritev temeljila predvsem na veliko večjih pomnilnikih in dodanih procesorskih jedrih? Se lahko delovni takt sploh še kaj poveča? Bo grafični procesor postal obvezni del glavnega procesorja, ki bo obenem še enako zmogljiv kakor kak superračunalnik iz devetdesetih let preteklega stoletja?

Silicijeva rezina s procesorji z arhitekturo Haswell, na katero je položen majhen žebljiček

Boj za prevlado na trgu 64-bitnih procesorjev med Intelom in AMD se nadaljuje. Lani so številni testi zmogljivosti pokazali, da lahko AMDjevi APUji (accelerated processing unit, slov. pospešena procesna enota) ponudijo nekaj večjo grafično zmogljivost, Intelovi procesorji z vgrajeno grafiko pa imajo nekaj več procesorske zmogljivosti. Vendar se zdi, da AMD caplja za Intelom predvsem zaradi manj natančnega proizvodnega procesa. Intel je lani skoraj vse procesorje izdeloval po 22 nm postopku, AMD pa le po 32 nm postopku. Šele 14. januarja letos je AMD začel tržiti 28 nm družino procesorjev, Kaveri.

Strategija vgradnje vse zmogljivejših grafičnih procesorjev v procesorska jedra se je izkazala za pravilno. Statistika kaže, da devet od desetih novih PCjev uporablja grafični procesor v procesorskem čipu. Trg za grafične kartice postaja s tem vse manjši.

Na vidiku so tudi prvi procesorji in osnovne plošče s podporo pomnilniškim modulom SDRAM DDR4 DIMM. A vse kaže, da bodo nekoliko zamudili, vsaj do jeseni letos. Poglavitna težava ni v nezrelosti tehnologije, temveč v optimalnem razmerju cena/zmogljivost. Slednje se vedno bolj nagiba na stran cene. Podporo DDR4 sta sicer že lani obljubila tako Intel kot AMD, a bo AMD vsaj letos še ostal pri modulih DDR3. Intel naj bi jeseni predstavil procesorje z novo arhitekturo, Haswell-E, ki bodo omogočali uporabo novih pomnilniških modulov DDR4.

Intelova pot razvoja procesorjev

Intel ostaja zvest »dvotaktni« metodi uvajanja novih procesorskih arhitektur, »tik«-»tak« (angl. »tick«-»tock«). V prvem taktu (»tik«) preidejo na množično proizvodnjo integriranih vezij z natančnejšo tehnologijo, denimo z 22 nm na 14 nm, pri čemer zmanjšajo fizično velikost integriranega vezja v čipu. V drugem taktu (»tak«) dodajo nove funkcionalnosti, pri čemer spet izdelujejo integrirana vezja z večjo površino.

Primerjava velikosti procesorjev z arhitekturo Ivy Bridge (levo) in Haswell (desno)

Procesor Core i7 – 4771 z arhitekturo Haswell

Prav zato aktualna 22-nanometrska mikroarhitektura, Haswell, prinaša številne novosti, Ivy Bridge pa je pomenil predvsem prehod na 22 nm proizvodni proces. A že konec letošnjega leta naj bi Haswell nadomestila arhitektura Broadwell s 14 nm proizvodnim procesom. Prihodnje leto naj bi sledil Skylake z novimi funkcionalnostmi. Naslednik Skylaka naj bi bil Cannonlake z 10 nm proizvodnim procesom. Pričakujemo ga lahko leta 2016. Nadaljnja pot razvoja zaenkrat še ni znana. Precej je odvisno tudi od bodočih razmer na trgu računalniške opreme.

Osnove sodobnih procesorjev

Sodobni procesorji so sestavljenih iz procesorskih jeder, ki smo jim včasih pravili izvajalne enote. Včasih je imel procesor samo eno izvajalno enoto in je lahko izvajal samo en program v strojnem jeziku hkrati, danes jih ima veliko in lahko hkrati izvaja veliko strojnih programov (programskih niti), ki vsi delujejo znotraj istega procesa ali pa so v različnih procesih.

Procesorska jedra potrebujejo za izvajanje strojne kode (program v strojnem jeziku, ki ga sestavljajo strojni ukazi) funkcijske enote, od katerih je vsaka specializirana za določene vrste operacij. Izvajanje strojnega ukaza poteka večstopenjsko; podobno, kot če opazujemo nastajanje izdelka na tekočem traku. »Delavci« ob traku so funkcijske enote. Več procesorskih jeder si jih medsebojno deli, a ena funkcijska enota lahko dela največ na enem »tekočem traku« naenkrat. Če isto funkcijsko enoto hkrati zahtevata dve ali več procesorskih jeder ali ta že obdeluje zahteve enega od jeder, morajo preostala jedra počakati. Več istovrstnih funkcijskih enot omogoča manj čakanja med procesorskimi jedri, oziroma hitrejše izvajanje strojnih ukazov pri enakem delovnem taktu.

Strukturo, ki v strojni opremi izvaja funkcijo tekočega traku, strokovno imenujemo cevovod (angl. pipeline). Sodobni Intelovi procesorji imajo jedra z okoli 20-stopenjskimi cevovodi. Vendar ni nujno, da mora strojni ukaz čez vse stopnje. Hkrati enota za »prednabavo« strojnih ukazov (angl. prefetch unit) iz predpomnilnika pobira strojne ukaze in z njimi neprestano polni cevovod.

Sodobni procesorji so kot velike tovarne, kjer gre lahko pri proizvodnji tudi kaj narobe. Takrat je treba tekoči trak zaustaviti in ga po odpravi napake spet zagnati. Enota za prednabavo strojnih ukazov ima največ težav s strojnimi ukazi za vejitve. Cevovoda ni smiselno zaustaviti, tudi če še ne vemo, kako se bo izvedel ukaz za vejitev. Tu priskoči na pomoč enota za napovedovanje izida vejitev (angl. branch prediction unit) oziroma napovedovalnik vejitev (angl. branch predictor). Pravilna napoved pomeni, da bo program tekel nemoteno naprej, napačna pa, da bo treba cevovod v celoti izprazniti in začeti prevzemati strojne ukaze na drugi pomnilniški lokaciji. Če je takih praznjenj cevovoda v povprečju veliko, to zelo zmanjša zmogljivost procesorja.

Arhitektura Haswell

Lani smo najprej veliko slišali o novi mikroarhitekturi s kodnim imenom Haswell; 2. junija pa smo že dobili prve procesorje s to arhitekturo. Nova »pošiljka »haswellov« je sledila 1. septembra, ko so bile posodobljene že vse procesorske družine, razen Celeronov. Slednji so dobili novo arhitekturo 1. decembra. Zanimivo, čeprav ne nenavadno, je, da imajo vgrajene grafične procesorje tudi nekateri Xenoni E3, ki so namenjenih strežnikom. S tem je mogoče poenostaviti strežniške osnovne plošče.

Haswell ima izboljšave na vseh področjih. Ima širše poti do predpomnilnikov in izboljšan krmilnik pomnilnika. To pomeni, da so podatki procesorju prej na voljo. V procesorje so vgrajeni novi grafični procesorji. Procesor ima tudi štiri aritmetično-logične funkcijske enote, kar nekoliko pohitri izvajanje celoštevilčnih ukazov. Dodana je tudi druga enota za napovedovanje izida vejitev. Izboljšan je sistem varčevanje z energijo, kar notesom, tablicam in dlančnikom omogoča daljši čas avtonomije. Izbirno je podprto tudi vodilo Thunderbolt 2.0, o katerem smo septembra lani že podrobno pisali. Skoraj gotovo bo izvedeno v vseh Applovih osebnih računalnikih, na navadnih PCjih pa … No, bomo videli. Procesor ima integriran celo svoj napetostni regulator (FIVR, angl. fully integrated voltage regulator), kar pomeni, da so lahko poslej osnovne plošče tudi zaradi tega nekoliko preprostejše.

Nova so tudi podnožja in čipovni nabori. Podnožje LGA1150 za namizne računalnike sicer ohranja oznako in število priključkov, a ima zaščito, ki preprečuje, da bi vanj vstavili procesor, ki nima arhitekture Haswell. Čipovna nabora sta dva, Z97 in H97. Oba sta namenjena procesorjem Haswell in Broadwell. Z97 je za visoko zmogljive namizne računalnika, H97 za vse druge.

Za strežnike – Haswell-E

Intelove družine procesorjev Xeon E3, E5 in E7 so namenjene zmogljivim delovnim postajam in strežnikom. Številka za črko E pomeni podobno kot številka za črko i pri procesorjih Core i3, i5 in i7. »Eji« se kljub temu od »Ijev« precej razlikujejo. Imajo večje predpomnilnike, tudi do 35 MB (Haswell-EP) oz. 40 MB (Haswell-EX), in več procesorskih jeder. Xeon E3 je že lani doživel prenovo z arhitekturo Haswell. Letos ga verjetno čaka posodobitev s Haswell-EP; najzmogljivejša, Xeon E5 in E7, pa bosta proti koncu letošnjega izdelana z arhitekturo Haswell-E, ki se deli na: Haswell-EP za Xeon E5 2600 v3 z do 14 procesorskimi jedri in Haswell-EX (verjetno namenjen Xeon E7) z od 18 do 20 procesorskimi jedri. Nova bosta tudi podnožje, LGA2011-3, in čipovni nabor, X99. Bistvena novost Haswella-E je podpora pomnilniku DDR4.

Zmogljivejši grafični procesor in eDRAM

Glede na izbrani procesor so na voljo štiri različice grafičnega procesorja: GT1, GT2, GT3 in GT3e. Najzmogljivejša je GT3 s 40 izvajalnimi enotami. Najzmogljivejši grafični procesor v arhitekturi Ivy Bridge je imel le 16 izvajalnih enot. Grafični procesor GT3e ima še 128 MB eDRAM.

Vgrajeni eDRAM omogoča širše podatkovne poti do procesorja in s tem hitrejši dostop do podatkov. Hkrati eDRAM zasede trikrat manjšo površino, kot bi jo eSRAM (vgrajeni statični RAM) pri enaki zmogljivosti (v MB). eDRAM sicer danes najdemo tudi pri številnih igralnih konzolah, tudi Sonyjevi PlayStation 2. Zanimivo, da ga uporablja tudi IBMov procesor POWER7.

Intel trži grafične procesorje GTx z blagovnima znamkama HD Graphics in Iris Graphics. Vstopni modeli procesorjev: Pentium za namizne računalnike in prenosnike ter Celeron za prenosnike, imajo vgrajen HD Graphics (GT1). Procesorji Core i3, Core i5 in Core i7 pa imajo HD Graphics 4200, 4400, 4600, 5000, 5100, ali 5200. HD Graphics 4xxx so izpeljanke iz grafičnega procesorja GT2, ki ima 20 izvajalnih enot; HD Graphics 5xxx izpeljanke iz grafičnih procesorjev GT3 pa so GT3e. Najzmogljivejša grafika je HD Graphics 5200, ki edina temelji na procesorju GT3e s 128 MB eDRAMa. Namenjena je le procesorjem za namizne in prenosne računalnike.

Morda ni odveč omeniti še, da sta zdaj Direct3D 11.1 in OpenGL 4.2 strojno podprta.

Aktualni Intelovi procesorji za namizne računalnike in njihove arhitekture

Zmogljivejši vektorski ukazi

Napredne vektorske razširitve 2 (AVX 2, angl. Advanced Vector Extensions 2) omogočajo hitrejše operacije nad matrikami celih števil. To pride še kako prav tudi pri kompleksni trirazsežni grafiki. Prej smo to tehnologijo poznali pod imenom SIMD (single instruction multiple data, slov. en ukaz, veliko podatkov). Intel je vektorske ukaze nad 128-bitnimi registri sprva tržil kot Streaming SIMD Extensions (SSE, slov. tokovne razširitve SIMD). Ko je prišel do različice SSE 4.2, se je novi tehnologiji očitno namenil dati bolj logično ime: »napredne vektorske razširitve«. AVX je na voljo v procesorjih z arhitekturami: Sandy Bridge (E), Ivy Bridge (E) in aktualni, Haswell, in Broadwell, ki jo pričakujemo konec letošnjega leta, AVX 2 pa je podprt samo pri Haswellu in prihajajočem Broadwellu.

V pripravi je že naslednja različica naprednih vektorskih razširitev, AVX 3.1, ki naj bi jo dobili prihodnje leto z arhitekturo Knights Landing. Slednja naj bi ugledala luč sveta s procesorjem Xeon Phi. Ima povečan nabor vektorskih strojnih ukazov in povečano dolžino registrov na 512 bitov.

Ukazi za delo z biti

Ukazi za delo z biti (BMI, bit manipulation instructions) so uporabni za najrazličnejše algoritme za varnostno kodiranje in/ali podpisovanje podatkov ter algoritme za stiskanje in razširjanje podatkov. Haswell podpira naslednje nabore strojnih ukazov za delo z biti: BMI1 in BMI2 ter ABM (advanced bit manipulation, slov. napredna manipulacija z biti). Intel je sicer ABM vključil že v arhitekturo Nehalem (SSE 4.2). BMI1 in BMI2 dodajata skupaj še 14 novih ukazov.

Arhitektura Skylake

Ko se pomikamo po časovni premici v prihodnost, se odpirajo nove arhitekture z vedno več funkcionalnostmi. Arhitektura Skylake bo prinesla novo procesorsko podnožje, LGA1151. Običajni namizni računalniki naj bi podpirali do 64 GB SDRAM DDR4 DIMM. Mogočih naj bi bilo do 20 vmesnikov PCI Express 3.0, Skylake-E/EP/EX pa naj bi imeli še podporo PCI Express 4.0. Procesorski predpomnilniki naj bi se krepko povečali, obenem pa naj bi bil dodan še predpomnilnik na četrti ravni (L4, angl. layer 4), ki bi bil tipa eDRAM in bi imel 128 MB. Posodobljeni naj bi bili tudi vektorski ukazi, saj naj bi bil podprt AVX 3.2.

Skylake predvideva novosti tudi na področju tehnologij za varovanje podatkov. Nove naj bi bile razširitve Intel SHA-1 in SHA-256 (Secure Hash Algorithms, slov. algoritmi za varnostne kode), s katerimi bi procesor lahko nad podatki računal varnostne kode. Na podlagi slednjih je med drugim mogoče ugotoviti, ali je bil neki dokument neavtorizirano popravljan.

Intel MPX (Memory Protection Extensions, slov. razširitve za zaščito pomnilnika) naj bi zagotovil boljšo zaščito pomnilnika. V ta namen bodo dodani novi registri in novi strojni ukazi.

Procesor z arhitekturo AMD Temash

Pot razvoja procesorjev AMD

AMD je svoje APUje začel razvijati že leta 2010, da bi z njimi laže prodrl na trg poceni notesov in namiznih računalnikov. Doslej je razvil štiri družine takih mikroprocesorskih arhitektur: Llano, Bobcat, Bulldozer in Jaguar.

Llano je dvanajsta družina arhitektur AMD (gledano od začetka). Predstavlja naslednjo evolucijsko stopnjo razvoja 64-bitnih procesorjev K10. Ima dvonivojski predpomnilnik (L1 in L2), izboljšan zajemalnik strojnih ukazov (angl. prefetcher), nov krmilnik pomnilnika, tehnologije za zmanjševanje porabe energije in vmesnika Onion (čebula) and Garlic (česen) za povezovanje grafičnih procesorjev na istem integriranem vezju. Uporabljena je bila za prvo generacijo procesorjev AMD Fusion: A10, A8, A6, A4 in E2.

Naslednja družina arhitektur, Bobcat, ni trinajsta po vrsti, temveč štirinajsta. Gre za posebno družino 64-bitnih arhitektur z nizko porabo energije, z izgubno močjo med 1 W in 10 W, namenjeno ultralahkim prenosnim napravam. Prvi arhitekturi iz te družine sta bili Ontario in Zacate.

Prihodnost pripada APU, menijo v AMD. Ali je 47 % zasedene površine integriranega vezja v procesorskem čipu za grafični procesor smiselno ali ne, presodite sami …

Petnajsta družina arhitektur, Bulldozer, je namenjena najširšemu segmentu računalnikov: od notesov do velikih računalniških strežnikov. Je naslednica arhitekture AMD K10 Barcelona. Omogoča širok spekter procesorjev z izgubno močjo od 10 W do 220 W. Podpira nove ukaze XOP (eXtended OPerations, slov. razširjene operacije: vektorski ukazi, kot razširitev SSE), FMA4 (fused multiply-add, slov. zlito množenje in seštevanje: razširitev 128- in 256-bitnih ukazov SIMD, ki jo podpira tudi Intelov Haswell) in CVT16 (vsebuje ukaze za pretvorbo med števili s plavajočo vejico v polovični natančnosti v enojno natančnost po standardu IEEE). Družina Bulldozer ima že štiri generacije arhitektur: Bulldozer, Piledriver, Steamroller in prihajajočo, Excavator, ki naj bi jo dobili prihodnje leto.

Zadnja izmed družin arhitektur je Jaguar, naslednica Bobcata. Vsebuje arhitekturi za ultralahke mobilne naprave: Kabini in Temash.

Integrirano vezja procesorja Kaveri

AMDjevi procesorji: Brazos, Trinity in Tahiti

Llano, Bulldozer in Piledriver

Najzmogljivejši družini APU, A8 in A10, sta začeli svojo pot z arhitekturama Llano (iz junija 2011) in Piledriver (iz oktobra 2012). Arhitektura Trinity z jedrom Piledriver je v procesorski čip dodala nov grafični procesor, zmogljivosti med Radenom 6000 HD in 7000 HD. Obenem je nova arhitektura postala tudi nadomestek za arhitekturo Bulldozer prve generacije, ki se je s procesorjem K10 poslovila. Dobili smo tudi nove procesorje za najzmogljivejše namizne računalnike, FX-9xxx, z arhitekturo Piledriver, ki so nadomestili starejše FX-8xxx. Pomenljivo je, da je Trinity omogočil predvsem višje delovne frekvence, vse do 5 GHz v načinu turbo, in tudi temu primerno rekordno izgubno moč, 220 W (FX-9590).

V svetu mobilnih računalnikov smo procesorje iz družine Trinity dobili že prej, maja 2012. Velika pričakovanja so se hitro razblinila, ko je postalo jasno, da so AMDjevi izdelki energetsko veliko bolj požrešni od Intelovih, saj so izdelani po 32 nm tehnologiji, ki ni kos Intelovim 22 nm procesorjem z arhitekturo Haswell. Trenutno AMD vodi le v segmentu najcenejših namiznih osebnih računalnikov, kjer večja poraba energije ni tako pomembna.

Kaj je izgubna moč procesorja?

Koristno delo, ki ga opravlja procesor, je izvajanje strojnih programov. Pri tem se zaradi številnih preklopov stanj tranzistorjev v njem močno segreva. Čeprav se zmogljivejši procesorji praviloma bolj segrevajo, je segrevanje zelo odvisno tudi od uporabljene tehnologije za izdelavo tranzistorjev. Manjši tranzistorji se veliko manj segrevajo.

Ker segrevanje ni lastnost, ki bi si jo pri procesorju želeli, govorimo o izgubni moči, ki pove, kako dobro nas bo računalnik grel in kako velik hladilni sistem bo potreboval. Večja izgubna moč pomeni tudi, da bomo za poganjanje procesorja potrebovali zmogljivejši napajalnik ... Bi imeli ves dan prižgan sesalnik s 1500 W izgubne moči? Kaj pa računalnik s procesorjem z 220 W izgubne moči in 1500 W napajalnikom?

Steamroller in Excavator

Zagato naj bi rešila nova procesorska družina Kaveri, izdelana po 28 nm proizvodnem procesu. Kaveri temelji na procesorski arhitekturi Steamroller. Še vedno zajema po dva modula s procesorskimi jedri, vendar ima večjo stopnjo vzporednosti. Vsako procesorsko jedro ima zdaj svojo, neodvisno enoto za dekodiranje strojnih ukazov. Boljša je enota za napovedovanje izida vejitev (branch predictor), ki zmanjšuje število napačnih napovedi za 20 %. Večji so tudi predpomnilniki, ki omogočajo do 30 % manj zgrešitev, ko je treba vsebino naložiti iz glavnega pomnilnika. Več je tudi notranjih registrov ali pa so ti daljši. Krmilnik pomnilnika je nov. Natančnejša tehnologija izdelave omogoča tudi manjšo porabo energije.

Prve štiri procesorje iz družine Kaveri za namizne računalnike smo dobili 14. januarja letos. Imajo do osem jeder Steamroller B (Stramroller z nekaj manjšimi izboljšavami) s frekvenco 3,7 GHz in vgrajen 720 MHz grafični procesor Radeon 7 s 512 ali s 384 izvajalnimi enotami. Radeon 7 zasede kar 47 % površine integriranega vezja v čipu; to je za tiste, ki ne nameravajo kupiti grafične kartice posebej, dobro, za druge pa slabo. Intel grafičnemu procesorju bistveno manjši delež integriranega vezja procesorja. Kaveri prinaša tudi novo procesorsko podnožje, FM2+, ki ni združljivo za nazaj. Zato bo treba osnovno ploščo in procesor nadgraditi skupaj. Obeta se tudi nova strojna osnova za notese, imenovana Indus.

Žal arhitektura Steamroller ne podpira pomnilnika SDRAM DDR4. Podporo zanj naj bi AMD ponudil šele prihodnje leto z arhitekturo Excavator. APU s to arhitekturo ima kodno ime Carriza. Podpiral bo nove ukaze: SSE4.1, SSE4.2, AES, PCLMUL, AVX, BMI1, F16C, MOVBE, AVX2, BMI2 in RDRAND. RDRAND so ukazi za strojno generiranje naključnih števil. Intelovi procesorji imajo ukaze RDRAND že od arhitekture Ivy Bridge naprej. Tudi ukazi AES (advanced encryption standard) za napredno kriptografiranje pri Intelu niso novost… Bistvena novost Exavatorja bo hkratna podpora pomnilniškim modulom DDR3 in DDR4, kar je značilno tudi za Intelovo arhitekturo Haswell. Zdi se, da bo AMD z Excavatorjem še vedno »lovil Intel za rep« …

Intel veliko stavi na majhno porabo energije in ultralahke notese ter druge mobilne in nosljive računalnike. Bolje pozno kot nikoli …

Negotova prihodnost

Medtem ko se delež prodanih mobilnih naprav vztrajno veča, hitro upada zanimanje za namizne računalnike. Samo lani je bilo po vsem svetu prodano za 6,9 % manj osebnih računalnikov kot leta 2012. V Intelu so verjetno prav zato kljub ugodnim lanskim poslovnim rezultatom januarja napovedali, da bodo do konca letošnjega leta po »mehkih metodah« odpustili 5 % zaposlenih.

Na drugi strani navdušence za računalništvo, ki hočejo zmogljiv podmizni računalnik, boli, da bo poslej vsak procesor »poročen« z grafičnim procesorjem, ki odžira prostor na njegovem integriranem vezju. Zmogljiva grafična kartica bo poskrbela, da bo grafični procesor v procesorskem čipu za vedno ostal izklopljen …

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!