Objavljeno: 4.12.2023 06:00 | Teme: umetna inteligenca

Pol stoletja stara umetna inteligenca boljša od GPT-3.5

ChatGPT in druščina bi nas zlahka zavedli, da so prvi roboti, ki omogočajo pogovarjanje. A njihova zgodovina je precej daljša, saj se je ELIZA že v 60. letih precej dobro pogovarjala. Izkaže se, da je bila celo boljša od GPT-3.5, če sodimo po rezultatih Turingovega testa.

Raziskovalci z Universite v San Diegu izvedli simulacijo Turingovega testa, v kateri so primerjali človeka, GPT-4, GPT-3.5 in ELIZO. To je znameniti test, ki si ga je Alan Turing zamislil davnega leta 1950. V njem sodelujeta človek in stroj, s katerima se pogovarja človeški izpraševalec. Ta komunicira v pisni obliki in ne ve, s kom se pogovarja. Njegova naloga je ugotoviti, kateri sogovornik je človek in kateri je stroj.

Preizkus, v katerem je sodelovalo 652 ljudi, ki so opravili 1810 pogovorov, med njimi 1405 primernih za nadaljnjo analizo, je pokazal zanimive rezultate. Najbolje se je odrezal človek, ki je v 62 odstotkih opravil Turingov test. To ni tako nenavadno, saj so tudi druge raziskave pokazale, da nikoli ne dosežemo 100 odstotkov. Na drugem mestu je GPT-4, ki je v vseh primerih nekoliko pod 50 odstotki, sledi pa ELIZA. Zadnji je GPT-3.5.

To pomeni, da ljudje večkrat prepoznajo GPT-3.5 kot stroj kakor pa ELIZO. Razlogov je več, eden je gotovo navajenost. V zadnjem letu smo bili izpostavljeni odzivom GPT-3.5, zato približno vemo, kaj pričakovati. ELIZA je manj znana, po drugi strani pa tudi precej bolj redkobesedna in manj ustrežljiva. Tega od modernih jezikovnih modelov nismo vajeni, zato so jo ljudje prej zamenjali za nekooperativnega človeka kakor za stroj. Tudi GPT-4, ki je bil najboljši, se še vedno ne more dobro pretvarjati, da je človek.

ArXiv

Več novic

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Redka zmaga malega rudarja kriptovalut

    V času, ko rudarjenje bitcoina obvladujejo velika podjetja s specializirano opremo in ogromnimi viri, je neodvisnemu solo rudarju uspel izjemen podvig. 

    Objavljeno: 27.7.2025 13:00
  • Šibko geslo in hekerski vdor pogubila 158 let staro podjetje

    Britansko podjetje KNP iz Northamptonshira, ki se je ukvarjalo s prevozi, je po 158 letih obratovanja zaprlo vrata, zaradi česar je brez dela ostalo 700 ljudi. Razlog ni slabo poslovanje, težke tržne razmere, izgube ali celo poneverbe, temveč precej bolj banalen. Podjetje je opustošil hekerski napad, v katerem so napadalci odnesli podatke o vseh strankah.

    Objavljeno: 23.7.2025 05:00
  • ChatGPT je bogatejši za pravega raziskovalnega agenta

    ChatGPT agent je nova generacija digitalnega pomočnika, ki združuje sposobnosti vizualnega in tekstovnega brskanja ter neposredne interakcije z zunanjimi platformami, kot so Google Drive, GitHub in SharePoint.

    Objavljeno: 18.7.2025 08:00
  • Tehnologija je orodje za množično nadzorovanje

    Ko je minuli teden kamera na koncertu skupine Coldplay v Bostonu prikazala par, ki objet posluša Chrisa Martina, bi bil lahko to le še eden izmed množice povsem običajnih in dolgočasni prizor. A ker se je ženska na posnetku obrnila proč in obraz zakopal v roke, moški pa se je sklonil pod kader, je posnetek vzbudil veliko pozornosti. Pevec Chris Martin ga je na odru komentiral z besedami, da sta bodisi zelo sramežljiva bodisi razmerje skrivata – in ostalo je bilo zgodovina.

    Objavljeno: 21.7.2025 05:00
  • ChatGPT je slab v šahu

    Najboljši šahist sveta Magnus Carlsen je v spletnem dvoboju premagal umetno inteligenco ChatGPT v vsega 53-ih potezah, pri čemer sam ni izgubil niti ene same figure. 

    Objavljeno: 21.7.2025 09:00
  • ChatGPT-5 bo na voljo avgusta

    Sam Altman, izvršni direktor OpenAI, je potrdil, da bo model GPT-5 izšel že v začetku avgusta. 

    Objavljeno: 25.7.2025 09:00
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji