Objavljeno: 14.5.2025 07:00

Način, da vam umetna inteligenca ne bo lagala

Vsi modeli umetne inteligence halucinirajo, včasih kakšen novejši celo bolj kot starejši, a obstajajo načini za zmanjšanje tega problema. Odpraviti ga za zdaj še ne moremo, lahko pa se mu v veliki meri izognemo, če pravilno sprašujemo. Najnovejša primerjava je pokazala, da je eden preprostejših načinov zahtevati daljše odgovore.

Francosko podjetje Giskard, ki se ukvarja s testiranjem modelov AI in razvojem metrik za njihovo ocenjevanje, ugotavlja, da so krajši odgovori bolj obremenjeni s halucinacijami. Razlogi za takšno obnašanje še niso v celoti jasni, a kot kaže, modelom nekako »zmanjka prostora« za oceno pravilnost ali resničnosti. Če dovolimo ali celo zahtevamo daljše odgovore, so ti v povprečju pravilnejši.

Ko modelom izrecno ukažemo, naj se odzovejo jedrnato, to prioritizirajo bolj od pravilnosti. Poleg tega so odkrili, da imajo modeli res precej človeških lastnosti. Če uporabniki postavljajo asertivne in prepričljive izjave, bodo manj verjetno opozorili na napake. Po drugi strani imajo ljudje raje modele, ki niso vedno povsem resnicoljubni. Optimizacija za čim boljšo uporabniško izkušnjo prinaša halucinacije. Res nam je umetna inteligenca čedalje bolj podobna!

Analiza

Več novic

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Šibko geslo in hekerski vdor pogubila 158 let staro podjetje

    Britansko podjetje KNP iz Northamptonshira, ki se je ukvarjalo s prevozi, je po 158 letih obratovanja zaprlo vrata, zaradi česar je brez dela ostalo 700 ljudi. Razlog ni slabo poslovanje, težke tržne razmere, izgube ali celo poneverbe, temveč precej bolj banalen. Podjetje je opustošil hekerski napad, v katerem so napadalci odnesli podatke o vseh strankah.

    Objavljeno: 23.7.2025 05:00
  • Windows 11 se bo popravil sam

    Najpozneje ob lanski polomiji s posodobitvijo CrowdStrike je svet spoznal, kakšen glavobol lahko povzroči en sam okvarjeni gonilnik, ki prepreči normalni zagon Windows 11. Reševanje takšnih sistemov je načeloma možno, a terja nekaj znanja in predvsem fizični dostop do vsakega računalnika. Microsoft bo z naslednjo posodobitvijo izpolnil obljubo in postopek avtomatiziral.

    Objavljeno: 14.7.2025 07:00
  • Tehnologija je orodje za množično nadzorovanje

    Ko je minuli teden kamera na koncertu skupine Coldplay v Bostonu prikazala par, ki objet posluša Chrisa Martina, bi bil lahko to le še eden izmed množice povsem običajnih in dolgočasni prizor. A ker se je ženska na posnetku obrnila proč in obraz zakopal v roke, moški pa se je sklonil pod kader, je posnetek vzbudil veliko pozornosti. Pevec Chris Martin ga je na odru komentiral z besedami, da sta bodisi zelo sramežljiva bodisi razmerje skrivata – in ostalo je bilo zgodovina.

    Objavljeno: 21.7.2025 05:00
  • ChatGPT je bogatejši za pravega raziskovalnega agenta

    ChatGPT agent je nova generacija digitalnega pomočnika, ki združuje sposobnosti vizualnega in tekstovnega brskanja ter neposredne interakcije z zunanjimi platformami, kot so Google Drive, GitHub in SharePoint.

    Objavljeno: 18.7.2025 08:00
  • Grafična kartica za pol milijona dolarjev

    ASUS je na dogodku Bilibili World 2025 presenetil z razkritjem najdražje grafične kartice na svetu, posebne različice ROG Astral RTX 5090, izdelane iz pravega 24-karatnega zlata. 

    Objavljeno: 14.7.2025 10:00
  • ChatGPT je slab v šahu

    Najboljši šahist sveta Magnus Carlsen je v spletnem dvoboju premagal umetno inteligenco ChatGPT v vsega 53-ih potezah, pri čemer sam ni izgubil niti ene same figure. 

    Objavljeno: 21.7.2025 09:00
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji