Objavljeno: 15.8.2023 05:00

Tako lahko ChatGPT preprečite, da bi se učil z vaše spletne strani

Podobno kot lahko z datoteko robots.txt Googlovemu pajku povemo, naj ne obiskuje našega spletišča, je odslej možno tudi za OpenAI-jeve pajke, ki nabirajo podatke za trening modelov umetne inteligence GPT. Za ChatGPT in GPT-4 so se ti  brez dovoljenja po spletu sprehodili že predlani, v prihodnosti pa bomo imeli več besede pri omejitvah.

OpenAI je uradno predstavil svojega pajka, ki se imenuje GPTBot. Ta razume tudi datoteko robots.txt, zato ga lahko z njo odvrnemo od spletne strani. OpenAI obljublja, da bodo ukaze spoštovali in da vsebine v takem primeru ne bodo vključili med podatke za trening umetne inteligence.

Poleg tega OpenAI zagotavlja še, da med podatke za trening ne bodo uvrščali plačljivih vsebin (za plačljivimi zidovi), strani z osebnimi informacijami in strani, ki kršijo njihove smernice za vsebino. Na tak način želijo preprečiti, da bi se ChatGPT naučil stvari, ki jih ne sme znati, da bi razkrival osebne podatke, da bi delil avtorsko zaščitene vsebine ali da bi preprosto postal nesramen.

Tudi nastavitve v robots.txt niso nobeno zagotovilo, da stran ne bo nekoč pristala v kakšni bazi. Z interneta se dandanes intenzivno pobirajo vsebine (scraping), ki se potem znajdejo kdo ve kje.  A za začetek bo pomagalo, če v robots.txt dodamo User-agent: GPTBot in Disallow: /. Druga možnost je blokada IP-jev, s katerih bo pajek brskal, saj je OpenAI razkril tudi te.

Več novic

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Severna Koreja s kriptovalutami in lažnimi zaposlenimi nakradla milijarde

    Za razliko od praktično vseh ostalih držav se Severna Koreja v veliki meri zanaša na internetni kriminal in kriptoprevare za financiranje delovanja države in izogibanje sankcijam. Tudi eden večjih letošnjih vdorov, ko so neznanci z borze Bybit ukradli za poldrugo milijardo dolarjev kriptovalute ether, je bil plod Severne Koreje.

    Objavljeno: 27.10.2025 07:00
  • Popolnoma drugačno električno kolo

    Rivianovo hčerinsko podjetje Also, specializirano za mikromobilnost, je predstavilo inovativno električno kolo TM-B (Transcendent Mobility - Bike), ki obljublja povsem novo izkušnjo vožnje. 

    Objavljeno: 23.10.2025 16:00
  • V Londonu vam bodo verjetno ukradli telefon

    Samo v lanskem letu so v Londonu ukradli 80.000 pametnih telefonov, kar je v milijonski metropoli sicer malo, a vseeno precej več kot v drugih podobno velikih mestih v Evropi. In približno tretjino več kot leto pred tem. Trend je torej zaskrbljujoč.

    Objavljeno: 23.10.2025 05:00
  • V ZDA bodo retroaktivno prepovedali DJI-jeve letalnike

    Ameriška Zvezna komisija za telekomunikacija (FCC) je sprejela sila nenavadno odločitev in za nazaj prepovedala uporabo naprav, ki jih je že odobrila in sprostila njihov uvoz v ZDA. Odločitev, da to smejo storiti, so sprejeli s tremi glasovi za in nobenim proti. Uperjena je proti kitajskemu proizvajalcu letalnikov DJI.

    Objavljeno: 3.11.2025 07:00
  • Uvodnik: Vedno je kriv DNS!

    Konec oktobra se je zgodilo nekaj, kar bi lahko imenovali že klasika digitalne dobe – Amazonov oblak AWS je spet odpovedal poslušnost. Tokrat je šlo za podatkovni center US-EAST-1, tisti najbolj obremenjeni in najstarejši del Amazonove infrastrukture, ki poganja velik del svetovnega spleta.

    Objavljeno: 28.10.2025 | Avtor: Matjaž Klančar | Monitor November 2025
  • Microsoft izdal nove napredne igrače

    Microsoft je izdal novo različico PowerToys 0.95.0, ki prinaša vrsto izboljšav in eno pomembno novost, funkcijo Light Switch, namenjeno večjemu vizualnemu udobju. 

    Objavljeno: 23.10.2025 12:00
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji