Objavljeno: 19.9.2024 07:00 | Teme: umetna inteligenca, microsoft, windows

Microsoft ponuja orodje za testiranje kakovosti AI agentov

Microsoft je predstavil novo platformo za testiranje umetne inteligence, imenovano Windows Agent Arena (WAA), ki omogoča preizkus AI asistentov v okolju operacijskega sistema Windows. Rešitev je zasnovana z namenom pospešitve razvoja naprednih AI asistentov, ki bodo sposobni izvajati kompleksne računalniške naloge v različnih aplikacijah.

Za velike jezikovne modele velja, da se jih lahko učinkovito uporablja tudi kot računalniške agente. Tako uporabljeni modeli lahko izboljšajo produktivnost ljudi ter omogočijo avtomatizacijo programske opreme pri opravljanju večmodalnih nalog, ki zahtevajo načrtovanje in razmišljanje.

WAA omogoča AI agentom, da se soočijo z nalogami, ki so podobne uporabi programov s strani ljudi. Microsoftovi AI agenti se lahko trenutno preizkusijo v več kot 150 različnih nalogah, kot so urejanje dokumentov, brskanje po spletu, programiranje in konfiguracija sistemov. Ključna inovacija platforme je sposobnost paralelnega testiranja na več virtualnih strojih v oblaku Azure, kar močno pospeši razvojni cikel.

Trenutno je še precej izzivov glede tega, kako učinkovito meriti uspešnost teh agentov v realnih okoljih, kar Windows Agent Arena skuša rešiti. Eden najbolj uspešnih AI asistentov, multi-modalnim agentom z imenom Navi, je na testih dokazal 19,5 % uspešnost pri opravljanju nalog znotraj WAA, medtem ko je za primerjavo uspešnost pri ljudeh znašala 74,5 %. Rezultati sicer kažejo napredek pri kakovosti delovanja agentov, a hkrati opozarjajo na še vedno obstoječe izzive pri razvoju AI, ki bi lahko dosegel enako stopnjo spretnosti kot ljudje pri uporabi računalnikov.

Microsoftova odločitev, da odpre dostop do Windows Agent Arena, je pomemben korak, saj bo tako širša raziskovalna skupnost lahko prispevala k nadaljnjemu razvoju tovrstnih tehnologij. Strokovnjaki ob tem opozarjajo, da se s tem žal odpirajo tudi vrata za potencialno zlorabo teh orodij. Sposobnost AI agentov, da prostovoljno upravljajo datoteke, pošiljajo e-pošto ali spreminjajo nastavitve sistema, pomeni, da bo treba uvesti robustne varnostne ukrepe in protokole za zagotavljanje uporabniške zasebnosti. Z nadaljnjim razvojem teh agentov bo zato ključnega pomena tudi, da se uporabniki jasno zavedali, kdaj komunicirajo z AI, še posebej v profesionalnih ali kritičnih okoljih.

Več novic

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Starlinkovi sateliti padajo na Zemljo

    Kot v obrabljeni frazi je Starlink tudi v resnici upokojil že več satelitov, kot so jih druga podjetja sploh izstrelila. Vsak dan na Zemljo pade kakšen, kar ni malo. Že marca letos smo poročali, da je Starlink deorbitiral 865 satelitov, še dobrih tristo pa jih je bilo na seznamu. Trend se nadaljuje.

    Objavljeno: 13.10.2025 05:00
  • Telefone nam bodo prodajali še brez kablov

    ​​Sony je s svojim novim modelom pametnega telefona Xperia 10 VII dvignil precej prahu.

    Objavljeno: 9.10.2025 14:00
  • Miške so lahko tudi prisluškovalne naprave!

    Mikrofoni ne počno nič drugega kot zaznavajo potovanje zvočnih valov po mediju, ki je običajno zrak. A na enak način se zvok širi tudi po trdninah, kar ni le znanstvenofantastični način prisluškovanja. Raziskovalci s kalifornijske univerze v Irvinu so pokazali, da lahko tudi zmogljive igričarske miške delujejo kot prisluškovalna naprava.

    Objavljeno: 8.10.2025 05:00
  • Uvodnik - Telefon 'AI'

    Včasih me kdo vpraša: »Kaj je sploh ta umetna inteligenca na telefonih, ki jo menda vsi zdaj imajo, na kaj je treba paziti pri nakupu?« Naj poskusim odgovoriti.

    Objavljeno: 30.9.2025 | Avtor: Matjaž Klančar | Monitor Oktober 2025
  • Windows 11 ne bo možno namestiti brez interneta in spletnega profila

    Ni skrivnost, da Microsoft resnično motijo namestitve in uporaba Windows brez spletnih profilov. Že doslej so takšno, lokalno uporabo oteževali, sedaj pa so naredili še korak naprej. V novi testni verziji Windows 11 so onemogočili vse znane načine za izogibanje spletnemu profilu.

    Objavljeno: 8.10.2025 07:00
  • Kako onesposobiti mobilno omrežje milijonske metropole

    Mobilna omrežja, ki v današnjem svetu predstavljajo ključno infrastrukturo, je sorazmerno enostavno mogoče povsem onesposobiti, ne da bi se jih fizično dotaknili. Najpreprostejši napad je preobremenitev, za kar potrebujemo zgolj zadosti kartic SIM, ki jih uporabimo za zasutje omrežja s prometom. Takšno opremo so nedavno odkrili v New Yorku in okolici.

    Objavljeno: 6.10.2025 07:00
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji