Objavljeno: 15.8.2023 05:00

Tako lahko ChatGPT preprečite, da bi se učil z vaše spletne strani

Podobno kot lahko z datoteko robots.txt Googlovemu pajku povemo, naj ne obiskuje našega spletišča, je odslej možno tudi za OpenAI-jeve pajke, ki nabirajo podatke za trening modelov umetne inteligence GPT. Za ChatGPT in GPT-4 so se ti  brez dovoljenja po spletu sprehodili že predlani, v prihodnosti pa bomo imeli več besede pri omejitvah.

OpenAI je uradno predstavil svojega pajka, ki se imenuje GPTBot. Ta razume tudi datoteko robots.txt, zato ga lahko z njo odvrnemo od spletne strani. OpenAI obljublja, da bodo ukaze spoštovali in da vsebine v takem primeru ne bodo vključili med podatke za trening umetne inteligence.

Poleg tega OpenAI zagotavlja še, da med podatke za trening ne bodo uvrščali plačljivih vsebin (za plačljivimi zidovi), strani z osebnimi informacijami in strani, ki kršijo njihove smernice za vsebino. Na tak način želijo preprečiti, da bi se ChatGPT naučil stvari, ki jih ne sme znati, da bi razkrival osebne podatke, da bi delil avtorsko zaščitene vsebine ali da bi preprosto postal nesramen.

Tudi nastavitve v robots.txt niso nobeno zagotovilo, da stran ne bo nekoč pristala v kakšni bazi. Z interneta se dandanes intenzivno pobirajo vsebine (scraping), ki se potem znajdejo kdo ve kje.  A za začetek bo pomagalo, če v robots.txt dodamo User-agent: GPTBot in Disallow: /. Druga možnost je blokada IP-jev, s katerih bo pajek brskal, saj je OpenAI razkril tudi te.

Več novic

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Redka zmaga malega rudarja kriptovalut

    V času, ko rudarjenje bitcoina obvladujejo velika podjetja s specializirano opremo in ogromnimi viri, je neodvisnemu solo rudarju uspel izjemen podvig. 

    Objavljeno: 27.7.2025 13:00
  • Šibko geslo in hekerski vdor pogubila 158 let staro podjetje

    Britansko podjetje KNP iz Northamptonshira, ki se je ukvarjalo s prevozi, je po 158 letih obratovanja zaprlo vrata, zaradi česar je brez dela ostalo 700 ljudi. Razlog ni slabo poslovanje, težke tržne razmere, izgube ali celo poneverbe, temveč precej bolj banalen. Podjetje je opustošil hekerski napad, v katerem so napadalci odnesli podatke o vseh strankah.

    Objavljeno: 23.7.2025 05:00
  • Internet umira, krivi smo sami

    Spletne strani in celotni internet se zanašajo na nepisano pravilo, ki se je v zadnjem letu začelo krhati in grozi, da bo pokopalo internet, kot ga poznamo. Zaradi agentov in modelov umetne inteligence čedalje manj klikamo na spletne strani, zaradi česar imajo te čedalje več težav s financiranjem. Zdi sem, da jim škoduje tudi Google, ki je doslej benevolentno zagotavljal promet s svojim iskalnikom.

    Objavljeno: 31.7.2025 05:00
  • ChatGPT-5 bo na voljo avgusta

    Sam Altman, izvršni direktor OpenAI, je potrdil, da bo model GPT-5 izšel že v začetku avgusta. 

    Objavljeno: 25.7.2025 09:00
  • Kitajski test avtonomne vožnje - 36 vozil in 216 nesreč

    Kitajski medij Dongchedi je za testiranje naprednih asistenčnih sistemov vožnje (ADAS) zaprl pravi avtocestni odsek in v zapletenih, realističnih prometnih situacijah preizkusil 36 različnih vozil. 

    Objavljeno: 29.7.2025 06:00
  • Hitrejše brezžično polnjenje za telefone

    Nova generacija brezžičnega polnjenja Qi2 25W prihaja na telefone iPhone in naprave z operacijskim sistemom Android.

    Objavljeno: 24.7.2025 09:00
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji