Objavljeno: 4.12.2023 06:00 | Teme: umetna inteligenca

Pol stoletja stara umetna inteligenca boljša od GPT-3.5

ChatGPT in druščina bi nas zlahka zavedli, da so prvi roboti, ki omogočajo pogovarjanje. A njihova zgodovina je precej daljša, saj se je ELIZA že v 60. letih precej dobro pogovarjala. Izkaže se, da je bila celo boljša od GPT-3.5, če sodimo po rezultatih Turingovega testa.

Raziskovalci z Universite v San Diegu izvedli simulacijo Turingovega testa, v kateri so primerjali človeka, GPT-4, GPT-3.5 in ELIZO. To je znameniti test, ki si ga je Alan Turing zamislil davnega leta 1950. V njem sodelujeta človek in stroj, s katerima se pogovarja človeški izpraševalec. Ta komunicira v pisni obliki in ne ve, s kom se pogovarja. Njegova naloga je ugotoviti, kateri sogovornik je človek in kateri je stroj.

Preizkus, v katerem je sodelovalo 652 ljudi, ki so opravili 1810 pogovorov, med njimi 1405 primernih za nadaljnjo analizo, je pokazal zanimive rezultate. Najbolje se je odrezal človek, ki je v 62 odstotkih opravil Turingov test. To ni tako nenavadno, saj so tudi druge raziskave pokazale, da nikoli ne dosežemo 100 odstotkov. Na drugem mestu je GPT-4, ki je v vseh primerih nekoliko pod 50 odstotki, sledi pa ELIZA. Zadnji je GPT-3.5.

To pomeni, da ljudje večkrat prepoznajo GPT-3.5 kot stroj kakor pa ELIZO. Razlogov je več, eden je gotovo navajenost. V zadnjem letu smo bili izpostavljeni odzivom GPT-3.5, zato približno vemo, kaj pričakovati. ELIZA je manj znana, po drugi strani pa tudi precej bolj redkobesedna in manj ustrežljiva. Tega od modernih jezikovnih modelov nismo vajeni, zato so jo ljudje prej zamenjali za nekooperativnega človeka kakor za stroj. Tudi GPT-4, ki je bil najboljši, se še vedno ne more dobro pretvarjati, da je človek.

ArXiv

Več novic

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Severna Koreja s kriptovalutami in lažnimi zaposlenimi nakradla milijarde

    Za razliko od praktično vseh ostalih držav se Severna Koreja v veliki meri zanaša na internetni kriminal in kriptoprevare za financiranje delovanja države in izogibanje sankcijam. Tudi eden večjih letošnjih vdorov, ko so neznanci z borze Bybit ukradli za poldrugo milijardo dolarjev kriptovalute ether, je bil plod Severne Koreje.

    Objavljeno: 27.10.2025 07:00
  • Popolnoma drugačno električno kolo

    Rivianovo hčerinsko podjetje Also, specializirano za mikromobilnost, je predstavilo inovativno električno kolo TM-B (Transcendent Mobility - Bike), ki obljublja povsem novo izkušnjo vožnje. 

    Objavljeno: 23.10.2025 16:00
  • V Londonu vam bodo verjetno ukradli telefon

    Samo v lanskem letu so v Londonu ukradli 80.000 pametnih telefonov, kar je v milijonski metropoli sicer malo, a vseeno precej več kot v drugih podobno velikih mestih v Evropi. In približno tretjino več kot leto pred tem. Trend je torej zaskrbljujoč.

    Objavljeno: 23.10.2025 05:00
  • SD-kartica na dnu Atlantika preživela implozijo Titana

    Raziskovalci so na dnu Atlantskega ocena v bližini razbitine Titanika našli SanDiskovo spominsko kartico SD, s katere so lahko sneli 12 fotografij in devet videoposnetkov. Kartica je tja potonila pred dvema letoma, ko je implodirala podmornica Titan, s katero je podjetje OceanGate želelo obiskati razbitine slavnega parnika.

    Objavljeno: 22.10.2025 05:00
  • Tri četrtine vseh satelitov je Starlinkovih!

    S precej manj pozornosti javnosti, kot bi si tako pomembne spremembe zaslužile, v Zemljino orbito izstreljujemo satelite hitreje kot kdajkoli doslej. Prednjačijo ponudniki satelitskega dostopa do interneta, med katerimi je najhitrejši Starlink. Ta je 19. oktobra z raketo Falcon 19 v vesolje poslal še 28 satelitov, s čimer je presegel magično mejo 10.000.

    Objavljeno: 22.10.2025 07:00
  • Uvodnik: Vedno je kriv DNS!

    Konec oktobra se je zgodilo nekaj, kar bi lahko imenovali že klasika digitalne dobe – Amazonov oblak AWS je spet odpovedal poslušnost. Tokrat je šlo za podatkovni center US-EAST-1, tisti najbolj obremenjeni in najstarejši del Amazonove infrastrukture, ki poganja velik del svetovnega spleta.

    Objavljeno: 28.10.2025 | Avtor: Matjaž Klančar | Monitor November 2025
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji