Kdo poje največ hotdogov ali kako ukaniti umetno inteligenco
Navajeni smo, da umetna inteligenca občasno laže, kar tehnično imenujemo haluciniranje. Čeprav je to posledica njihovega ustroja, lahko modele umetne inteligence tudi zlonamerno prepričamo, da lažejo. To je na neškodljivem primeru pokazal BBC-jev novinar Thomas Germain, ki se je razglasil za prvaka v najhitrejšem uživanju hotdogov.
Sodobni generativni modeli pogosto poiščejo informacije na internetu, kadar jih sprašujemo za specifične podrobnosti, ki jih ne poznajo. S tem ni nič narobe, a na internetu so tudi neumnosti in neresnice, ki jih ne prepoznajo. V zgodnjih časih interneta je bil to problem tudi pri iskalnikih, nato pa ga je Google sorazmerno dobro rešil. Iskalni algoritem precej dobro odfiltrira lažne strani in spam.
To slabše zmorejo modeli, kot so ChatGPT, Gemini ali Claude. Ko je Thomas Germain ustvaril prepričljivo spletno stran, na kateri se je razglasil za prvaka in navedel še nekaj drugih hitrih jedcev, si je seveda vse izmislil. A modeli umetne inteligence so v nekaj dneh začeli te podatke ponavljati kot dejstva. Primer je sicer smešen in neškodljiv, a razkriva resnične nevarnosti.
Na podoben način lahko zlonamerni akterji modele prepričajo v širjenje drugih neresnic, ki so lahko precej bolj škodljive. Za zdaj varovalk, ki jih Googlovo iskanje že sorazmerno dobro obvlada, še ni.


