Objavljeno: 3.7.2024 07:00

OpenAI izdal CriticGPT, ki išče napake v odzivih GPT-4

Aktualni veliki jezikovni modeli, kakršen je GPT-4, se učijo ob pomoči ljudi. Da bi v prihodnosti lahko to ozko grlo odpravili ali pa zgolj z manj strahu pred izmišljotinami uporabili končne izdelke, je OpenAI izdal model CriticGPT. Počne točno to, na kar namiguje ime. CriticGPT kritično motri izdelke GPT-4 in opozarja na napake.

Klasični način učenja GPT se imenuje RLHF (Reinforcement Learning from Human Feedback), ker v njem sodelujejo ljudje. V praksi to pomeni, da pri treningu namesto uporabe popolnih ali vsaj zelo natančno sistematično urejenih podatkov končne izdelke ocenjujejo ljudje. A rezultat nikoli ni popoln, saj je ena večjih težav teh modelov haluciniranje.

OpenAI je zato izdelal model CriticGPT, ki je namenjen analizi programske kode, ki jo piše GPT-4. CriticGPT prepoznava hrošče v kodi in jih odpravi ter pojasni, kaj je bilo narobe. CriticGPT so izdelali s pomočjo ljudi, saj so mu dali v pregled ogromno kode, ki je imela namerno vstavljene hrošče.

Analize delovanja CriticGPT kaže, da so njegovi rezultati dobri. V eni raziskavi je njegove komentarje v 63 odstotkih primerov človek laže bral in razumel kot komentarje človeških preglednikov kode. Nato so ugotovili, da zmore CriticGPT še več, saj je na primer prepoznal napake tudi v podatkih za trening, ki so jih za GPT pripravili ljudje in naj bi bili brezhibni.

CriticGPT bo na neki način ulovil svoj rep, saj bo OpenAI z njim opremil ljudi, ki pomagajo umetni inteligenci pri treningu.

OpenAI

Več novic

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Konec poti za slovensko upravljanje z računi

    Storitev noprintZ, ki je uporabnikom omogočala prejemanje digitalnih računov in ročni vnos fizičnih računov, se bo ob koncu leta 2025 dokončno poslovila. 

    Objavljeno: 12.11.2025 06:00 | Teme: android, mobilna aplikacija, Slovenija
  • V ZDA bodo retroaktivno prepovedali DJI-jeve letalnike

    Ameriška Zvezna komisija za telekomunikacija (FCC) je sprejela sila nenavadno odločitev in za nazaj prepovedala uporabo naprav, ki jih je že odobrila in sprostila njihov uvoz v ZDA. Odločitev, da to smejo storiti, so sprejeli s tremi glasovi za in nobenim proti. Uperjena je proti kitajskemu proizvajalcu letalnikov DJI.

    Objavljeno: 3.11.2025 07:00
  • Microsoft pokazal Windows 11 26H1, ki na običajnih računalnikih ne bo deloval

    Verzija Windows 11, ki bo izšla prihodnje leto, se bo predvidljivo imenovala Windows 11 26H1, a je zelo verjetno ne bomo mogli uporabljati. Na kanalu Canary v programu Insider Preview se je predogledna izdaja (Build 28000) pojavila te dni, kar naznanja začetek nekoliko bolj javnega testiranja. Zdi pa se, da bo omejena na ARM-jeve procesorje.

    Objavljeno: 11.11.2025 05:00
  • Umetno inteligentni brskalniki prikažejo plačljive vsebine zastonj!

    Nekateri novi brskalniki, ki temeljijo na umetni inteligenci, lahko zaobidejo plačljive mehanizme medijskih vsebin. 

    Objavljeno: 4.11.2025 16:00
  • Kdo bo Python rešil pred smrtjo?

    Fundacija Python, ki skrbi za razvoj izjemno popularnega istoimenskega programskega jezika, je zavrnila 1,5 milijona dolarjev vredno finančno podporo Nacionalne znanstvene fundacije (NSF), ker jo je pogojevala z opustitvijo vseh programov raznolikosti, enakopravnosti in vključenosti (DEI). Namesto tega zato zbirajo donacije, kjer jim gre presenetljivo dobro.

    Objavljeno: 11.11.2025 07:00
  • Microsoft zakrpal hrošča: Windows 10 in 11 se končno znata ugasniti

    V najnovejši verziji popravkov za Windows 10 in 11 je Microsoft po več kot desetletju zakrpal hrošča, ki je marsikoga spravljal v dvome, ali njegov spomin še deluje. Če ste po uporabi Windows Update želeli računalnik ugasniti in ste izbrali Update and shut down, se je računalnik z Windows 10 ali 11 nemalokrat ponovno zagnal. Verjetno ste pomislili, da ste pomotoma kliknili Update and restart.

    Objavljeno: 4.11.2025 05:00
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji