Objavljeno: 31.1.2024 07:00 | Teme: oblak, umetna inteligenca

Veliki ponudniki oblakov imajo na tisoče grafičnih procesorjev, a je precej neizkoriščenih

Ponudniki storitev v oblakov so v preteklih letih v svojih podatkovnih centrih namestili več deset tisoč grafičnih procesorjev in pospeševalnikov umetne inteligence v tekmi, da bi izkoristili priložnost zaradi povečanja povpraševanja po velikih jezikovnih modelih umetne inteligence.

Toda kljub tem množičnim uvedbam raziskave kažejo, da je večina teh procesorjev premalo izkoriščenih. Po ocenah analitičnega podjetja TechInsights je bilo leta 2023 nameščenih in uporabljenih okoli 878.000 pospeševalnikov, ki so omogočili sedem milijonov ur dela procesorjev GPU.

Po mnenju raziskovalce to pomeni priložnost za približno 5,8 milijarde dolarjev prihodkov, ob upoštevanju povprečnih cen, ki veljajo za uro uporabe GPU v oblaku. Amazon AWS denimo ponuja storitev za okoli 98 dolarjev na GPU/uro.

Čeprav ponudniki storitev v oblaku nimajo navade deliti svoje dejanske ravni izkoriščenosti, TechInsights poudarja, da če bi gruče GPU delovale kjer koli blizu zmogljivosti, bi bil ta prihodek bistveno višji. Analitiki sicer priznavajo, da številni ponudniki oblakov uporabljajo pospeševalnike tudi za notranje delovna bremena, kar lahko nekoliko izkrivlja ta sklep. Toda kljub temu ocenjujejo, da je velik delež procesnih zmogljivosti tega gromozanskega števila GPU neizkoriščen, povzroča pa stroške in porabi energijo.

Zdi se, da je težava povezana z načinom, kako uporabniki običajno uporabljajo tovrstne storitve v oblaku. Ker gre za drage storitve, marsikdo procesiranje GPU naroča glede na dejansko rabo in nima v naprej zakupljene zmogljivosti, kar pa ponudnikom v oblaku ne omogoča predvidljivega modela uporabe sredstev.

Zato morajo podjetja, kot sta AWS ali Microsoft, zagotoviti veliko več zmogljivosti, kot pričakujejo, da bodo prodala. Posledično ponudniki zaradi tega storitve zaračunajo več, kot bi lahko, da pokrijejo stroške tudi v obdobju manjše zasedenosti.

Seveda je vse skupaj daleč od optimalne izrabe sredstev (in energije, ki je za to potrebna), končno ceno pa plačajo uporabniki storitev. Rešitev bi lahko bila v abstrakciji rabe procesorjev GPU, tako najmanjšega dela procesne zmogljivosti, kot tudi enotnega programskega modela, ki bi naslavljal različne variante GPU, ki imajo danes vsaka različno programsko zasnovo.

Več novic

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Severna Koreja s kriptovalutami in lažnimi zaposlenimi nakradla milijarde

    Za razliko od praktično vseh ostalih držav se Severna Koreja v veliki meri zanaša na internetni kriminal in kriptoprevare za financiranje delovanja države in izogibanje sankcijam. Tudi eden večjih letošnjih vdorov, ko so neznanci z borze Bybit ukradli za poldrugo milijardo dolarjev kriptovalute ether, je bil plod Severne Koreje.

    Objavljeno: 27.10.2025 07:00
  • Popolnoma drugačno električno kolo

    Rivianovo hčerinsko podjetje Also, specializirano za mikromobilnost, je predstavilo inovativno električno kolo TM-B (Transcendent Mobility - Bike), ki obljublja povsem novo izkušnjo vožnje. 

    Objavljeno: 23.10.2025 16:00
  • V Londonu vam bodo verjetno ukradli telefon

    Samo v lanskem letu so v Londonu ukradli 80.000 pametnih telefonov, kar je v milijonski metropoli sicer malo, a vseeno precej več kot v drugih podobno velikih mestih v Evropi. In približno tretjino več kot leto pred tem. Trend je torej zaskrbljujoč.

    Objavljeno: 23.10.2025 05:00
  • V ZDA bodo retroaktivno prepovedali DJI-jeve letalnike

    Ameriška Zvezna komisija za telekomunikacija (FCC) je sprejela sila nenavadno odločitev in za nazaj prepovedala uporabo naprav, ki jih je že odobrila in sprostila njihov uvoz v ZDA. Odločitev, da to smejo storiti, so sprejeli s tremi glasovi za in nobenim proti. Uperjena je proti kitajskemu proizvajalcu letalnikov DJI.

    Objavljeno: 3.11.2025 07:00
  • Uvodnik: Vedno je kriv DNS!

    Konec oktobra se je zgodilo nekaj, kar bi lahko imenovali že klasika digitalne dobe – Amazonov oblak AWS je spet odpovedal poslušnost. Tokrat je šlo za podatkovni center US-EAST-1, tisti najbolj obremenjeni in najstarejši del Amazonove infrastrukture, ki poganja velik del svetovnega spleta.

    Objavljeno: 28.10.2025 | Avtor: Matjaž Klančar | Monitor November 2025
  • Umetno inteligentni brskalniki prikažejo plačljive vsebine zastonj!

    Nekateri novi brskalniki, ki temeljijo na umetni inteligenci, lahko zaobidejo plačljive mehanizme medijskih vsebin. 

    Objavljeno: 4.11.2025 16:00
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji