Objavljeno: 31.1.2024 07:00 | Teme: oblak, umetna inteligenca

Veliki ponudniki oblakov imajo na tisoče grafičnih procesorjev, a je precej neizkoriščenih

Ponudniki storitev v oblakov so v preteklih letih v svojih podatkovnih centrih namestili več deset tisoč grafičnih procesorjev in pospeševalnikov umetne inteligence v tekmi, da bi izkoristili priložnost zaradi povečanja povpraševanja po velikih jezikovnih modelih umetne inteligence.

Toda kljub tem množičnim uvedbam raziskave kažejo, da je večina teh procesorjev premalo izkoriščenih. Po ocenah analitičnega podjetja TechInsights je bilo leta 2023 nameščenih in uporabljenih okoli 878.000 pospeševalnikov, ki so omogočili sedem milijonov ur dela procesorjev GPU.

Po mnenju raziskovalce to pomeni priložnost za približno 5,8 milijarde dolarjev prihodkov, ob upoštevanju povprečnih cen, ki veljajo za uro uporabe GPU v oblaku. Amazon AWS denimo ponuja storitev za okoli 98 dolarjev na GPU/uro.

Čeprav ponudniki storitev v oblaku nimajo navade deliti svoje dejanske ravni izkoriščenosti, TechInsights poudarja, da če bi gruče GPU delovale kjer koli blizu zmogljivosti, bi bil ta prihodek bistveno višji. Analitiki sicer priznavajo, da številni ponudniki oblakov uporabljajo pospeševalnike tudi za notranje delovna bremena, kar lahko nekoliko izkrivlja ta sklep. Toda kljub temu ocenjujejo, da je velik delež procesnih zmogljivosti tega gromozanskega števila GPU neizkoriščen, povzroča pa stroške in porabi energijo.

Zdi se, da je težava povezana z načinom, kako uporabniki običajno uporabljajo tovrstne storitve v oblaku. Ker gre za drage storitve, marsikdo procesiranje GPU naroča glede na dejansko rabo in nima v naprej zakupljene zmogljivosti, kar pa ponudnikom v oblaku ne omogoča predvidljivega modela uporabe sredstev.

Zato morajo podjetja, kot sta AWS ali Microsoft, zagotoviti veliko več zmogljivosti, kot pričakujejo, da bodo prodala. Posledično ponudniki zaradi tega storitve zaračunajo več, kot bi lahko, da pokrijejo stroške tudi v obdobju manjše zasedenosti.

Seveda je vse skupaj daleč od optimalne izrabe sredstev (in energije, ki je za to potrebna), končno ceno pa plačajo uporabniki storitev. Rešitev bi lahko bila v abstrakciji rabe procesorjev GPU, tako najmanjšega dela procesne zmogljivosti, kot tudi enotnega programskega modela, ki bi naslavljal različne variante GPU, ki imajo danes vsaka različno programsko zasnovo.

Več novic

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Kaj se zgodi, če Samsungov Galaxy Z Fold prepognete 200.000-krat?

    Ustvarjalec vsebin tech-it je s prenosom v živo na YouTubu izvedel maratonski test, v katerem je ročno odprl in zaprl Samsung Galaxy Z Fold 7 kar 200.000-krat

    Objavljeno: 8.8.2025 10:00
  • Programerska naloga, ki je ni rešil nihče

    Vsako leto se najboljši dijaki v programiranju na svetu merijo na olimpijadi iz informatike, kjer nastopa tudi slovenska ekipa. Tekmovalci v dveh tekmovalnih dneh rešujejo šest nalog, kodo pa pišejo v jeziku C++. Ene izmed nalog letos ni rešil nihče izmed 330 tekmovalci.

    Objavljeno: 6.8.2025 07:00
  • Xiaomi predstavil pametni ventilator

    Xiaomi je v poletni vročini za evropske trge predstavil Smart Desktop Air Circulation Fan, kompakten pametni ventilator, zasnovan za močan pretok zraka v manjših prostorih. 

    Objavljeno: 6.8.2025 11:00
  • Microsoft bo ukinil enoto GitHub

    Ko je Microsoft leta 2018 prevzel GitHub, se ni nič bistvenega spremenilo, saj je ostal samostojna enota z istim direktorjem. A Thomas Dohmke, ki je od leta 2021čas vodil GitHub, je napovedal odhod iz podjetja, saj ima druge podjetniške cilje. Microsoft zamenjave ne bo iskal.

    Objavljeno: 13.8.2025 05:00
  • Linus Torvalds spet ponorel

    Linus Torvalds, izumitelj in še vedno glavni skrbnik Linuxa, je vedno slovel kot vzkipljiv človek, zato tudi njegov zadnji izbruh ni zelo presenetljiv. Ob pripravi nove verzije jedra 6.17 jih je pošteno napel Palmerju Dabbeltu, ki je predložil kopico popravkov za RISC-V. Torvalds je, milo rečeno, ponorel.

    Objavljeno: 14.8.2025 05:00
  • HBO Max bo še otežil deljenje gesel

    Warner Bros. Discovery bo od prihodnjega meseca začel strožje uveljavljati prepoved deljenja gesel na pretočni storitvi HBO Max. 

    Objavljeno: 8.8.2025 09:00
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji