Objavljeno: 19.9.2024 07:00 | Teme: umetna inteligenca, microsoft, windows

Microsoft ponuja orodje za testiranje kakovosti AI agentov

Microsoft je predstavil novo platformo za testiranje umetne inteligence, imenovano Windows Agent Arena (WAA), ki omogoča preizkus AI asistentov v okolju operacijskega sistema Windows. Rešitev je zasnovana z namenom pospešitve razvoja naprednih AI asistentov, ki bodo sposobni izvajati kompleksne računalniške naloge v različnih aplikacijah.

Microsoft ponuja orodje za testiranje kakovosti AI agentov

Za velike jezikovne modele velja, da se jih lahko učinkovito uporablja tudi kot računalniške agente. Tako uporabljeni modeli lahko izboljšajo produktivnost ljudi ter omogočijo avtomatizacijo programske opreme pri opravljanju večmodalnih nalog, ki zahtevajo načrtovanje in razmišljanje.

WAA omogoča AI agentom, da se soočijo z nalogami, ki so podobne uporabi programov s strani ljudi. Microsoftovi AI agenti se lahko trenutno preizkusijo v več kot 150 različnih nalogah, kot so urejanje dokumentov, brskanje po spletu, programiranje in konfiguracija sistemov. Ključna inovacija platforme je sposobnost paralelnega testiranja na več virtualnih strojih v oblaku Azure, kar močno pospeši razvojni cikel.

Trenutno je še precej izzivov glede tega, kako učinkovito meriti uspešnost teh agentov v realnih okoljih, kar Windows Agent Arena skuša rešiti. Eden najbolj uspešnih AI asistentov, multi-modalnim agentom z imenom Navi, je na testih dokazal 19,5 % uspešnost pri opravljanju nalog znotraj WAA, medtem ko je za primerjavo uspešnost pri ljudeh znašala 74,5 %. Rezultati sicer kažejo napredek pri kakovosti delovanja agentov, a hkrati opozarjajo na še vedno obstoječe izzive pri razvoju AI, ki bi lahko dosegel enako stopnjo spretnosti kot ljudje pri uporabi računalnikov.

Microsoftova odločitev, da odpre dostop do Windows Agent Arena, je pomemben korak, saj bo tako širša raziskovalna skupnost lahko prispevala k nadaljnjemu razvoju tovrstnih tehnologij. Strokovnjaki ob tem opozarjajo, da se s tem žal odpirajo tudi vrata za potencialno zlorabo teh orodij. Sposobnost AI agentov, da prostovoljno upravljajo datoteke, pošiljajo e-pošto ali spreminjajo nastavitve sistema, pomeni, da bo treba uvesti robustne varnostne ukrepe in protokole za zagotavljanje uporabniške zasebnosti. Z nadaljnjim razvojem teh agentov bo zato ključnega pomena tudi, da se uporabniki jasno zavedali, kdaj komunicirajo z AI, še posebej v profesionalnih ali kritičnih okoljih.

Microsoft ponuja orodje za testiranje kakovosti AI agentov

Več novic

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Steam Machine razprodan, na eBayu tudi za 3200 USD!

    Žrebanje, ki naj bi preprečilo predprodajo nove konzole podjetja Valve, je končano.

    Objavljeno: 27.6.2026 13:00
  • Google zapira zadnja vrata za blokiranje oglasov

    Google bo s prihajajočimi posodobitvami spletnega brskalnika Chrome dokončno onemogočil delovanje priljubljenih razširitev za blokiranje oglasov, kot je uBlock Origin.

    Objavljeno: 16.6.2026 10:00
  • Google nam bo zaklenil ekosistem Android

    Dolgo vrsto let je bila ena izmed glavnih prednosti ekosistema Android njegova odprtost, saj za razliko od konkurenčnega Applovega iOS-a ni imel omejitev za nameščanje aplikacij. Resda je Google preverjal aplikacije, ki jih je uvrstil na svojo tržnico Play Store, a vsakdo je lahko mimo te tržnice namestil karkoli, če je z interneta prenesel namestitveno datoteko. Postopek se imenuje sideloading in je na primer na iOS onemogočen. To se bo zdaj zgodilo tudi na Androidu.

    Objavljeno: 19.6.2026 05:00
  • Getty Images bo sodeloval z OpenAI, delnica se je čez noč podvojila!

    Podjetje Getty Images je v nedeljo sporočilo, da bodo sodelovali z OpenAI. Priljubljeno orodje umetne inteligence ChatGPT bo lahko brskalo po Gettyjevi knjižnici podob, se iz njih učilo in jih uporabnikom tudi streglo, kar seveda ne bo zastonj. Koliko bo Getty Images z dogovorom zaslužil, podjetji nista razkrili. Vlagatelji pa menijo, da ogromno.

    Objavljeno: 23.6.2026 05:00
  • Microsoft odkril črva, ki krade kriptovalute

    Microsoft je opozoril na odkritje novega in naprednega črva, poimenovanega Crypto Clipper, ki se širi prek okuženih USB ključkov in je namenjen kraji kriptovalut.

    Objavljeno: 23.6.2026 10:00
  • Prihodnji teden bodo potekli certifikati za zagon računalnikov

    Bliža se datum, ki se je pred 15 leti zdel nedosegljivo daleč v prihodnosti. Potekli bodo certifikati iz leta 2011, s katerimi se varuje zagon osebnih računalnikov (Secure Boot), da se nanje ne ugnezdi škodljiva programska oprema že v UEFI/BIOS. Ne glede na operacijski sistem morajo posodobljene certifikate dobiti vsi starejši računalniki, najsi na njih teče Windows ali Linux. Prvi se večinoma posodobi sam.

    Objavljeno: 18.6.2026 05:00
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji