Objavljeno: 3.7.2024 07:00

OpenAI izdal CriticGPT, ki išče napake v odzivih GPT-4

Aktualni veliki jezikovni modeli, kakršen je GPT-4, se učijo ob pomoči ljudi. Da bi v prihodnosti lahko to ozko grlo odpravili ali pa zgolj z manj strahu pred izmišljotinami uporabili končne izdelke, je OpenAI izdal model CriticGPT. Počne točno to, na kar namiguje ime. CriticGPT kritično motri izdelke GPT-4 in opozarja na napake.

Klasični način učenja GPT se imenuje RLHF (Reinforcement Learning from Human Feedback), ker v njem sodelujejo ljudje. V praksi to pomeni, da pri treningu namesto uporabe popolnih ali vsaj zelo natančno sistematično urejenih podatkov končne izdelke ocenjujejo ljudje. A rezultat nikoli ni popoln, saj je ena večjih težav teh modelov haluciniranje.

OpenAI je zato izdelal model CriticGPT, ki je namenjen analizi programske kode, ki jo piše GPT-4. CriticGPT prepoznava hrošče v kodi in jih odpravi ter pojasni, kaj je bilo narobe. CriticGPT so izdelali s pomočjo ljudi, saj so mu dali v pregled ogromno kode, ki je imela namerno vstavljene hrošče.

Analize delovanja CriticGPT kaže, da so njegovi rezultati dobri. V eni raziskavi je njegove komentarje v 63 odstotkih primerov človek laže bral in razumel kot komentarje človeških preglednikov kode. Nato so ugotovili, da zmore CriticGPT še več, saj je na primer prepoznal napake tudi v podatkih za trening, ki so jih za GPT pripravili ljudje in naj bi bili brezhibni.

CriticGPT bo na neki način ulovil svoj rep, saj bo OpenAI z njim opremil ljudi, ki pomagajo umetni inteligenci pri treningu.

OpenAI

Več novic

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Kaj se zgodi, če Samsungov Galaxy Z Fold prepognete 200.000-krat?

    Ustvarjalec vsebin tech-it je s prenosom v živo na YouTubu izvedel maratonski test, v katerem je ročno odprl in zaprl Samsung Galaxy Z Fold 7 kar 200.000-krat

    Objavljeno: 8.8.2025 10:00
  • Programerska naloga, ki je ni rešil nihče

    Vsako leto se najboljši dijaki v programiranju na svetu merijo na olimpijadi iz informatike, kjer nastopa tudi slovenska ekipa. Tekmovalci v dveh tekmovalnih dneh rešujejo šest nalog, kodo pa pišejo v jeziku C++. Ene izmed nalog letos ni rešil nihče izmed 330 tekmovalci.

    Objavljeno: 6.8.2025 07:00
  • Xiaomi predstavil pametni ventilator

    Xiaomi je v poletni vročini za evropske trge predstavil Smart Desktop Air Circulation Fan, kompakten pametni ventilator, zasnovan za močan pretok zraka v manjših prostorih. 

    Objavljeno: 6.8.2025 11:00
  • Microsoft bo ukinil enoto GitHub

    Ko je Microsoft leta 2018 prevzel GitHub, se ni nič bistvenega spremenilo, saj je ostal samostojna enota z istim direktorjem. A Thomas Dohmke, ki je od leta 2021čas vodil GitHub, je napovedal odhod iz podjetja, saj ima druge podjetniške cilje. Microsoft zamenjave ne bo iskal.

    Objavljeno: 13.8.2025 05:00
  • Linus Torvalds spet ponorel

    Linus Torvalds, izumitelj in še vedno glavni skrbnik Linuxa, je vedno slovel kot vzkipljiv človek, zato tudi njegov zadnji izbruh ni zelo presenetljiv. Ob pripravi nove verzije jedra 6.17 jih je pošteno napel Palmerju Dabbeltu, ki je predložil kopico popravkov za RISC-V. Torvalds je, milo rečeno, ponorel.

    Objavljeno: 14.8.2025 05:00
  • HBO Max bo še otežil deljenje gesel

    Warner Bros. Discovery bo od prihodnjega meseca začel strožje uveljavljati prepoved deljenja gesel na pretočni storitvi HBO Max. 

    Objavljeno: 8.8.2025 09:00
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji