AI modeli: Kje so podatki, ki jih zahteva EU?
Čeprav je Evropska unija z Aktom o umetni inteligenci (AI Act) jasno začrtala pot k večji transparentnosti tehnološkega sektorja, vodilna podjetja novih pravil očitno ne jemljejo dovolj resno. Čeprav so na trg poslali nove, zmogljivejše modele, podrobnosti o tem, s čim so se ti modeli učili, ostajajo nejasne. To neposredno spodkopava prizadevanja Bruslja, da bi v času generativne umetne inteligence zaščitil avtorske pravice ustvarjalcev.

Bistvo spora se vrti okoli temeljnih modelov. Evropska zakonodaja od razvijalcev zahteva, da javno razkrijejo informacije o podatkih, uporabljenih za urjenje. Navesti morajo, ali so uporabili javno dostopne nabore podatkov oziroma licenčne informacije, predvsem pa morajo našteti najpomembnejša spletna mesta, s katerih so pridobili vsebino. Ta transparentnost je ključna za pisatelje in umetnike, saj le tako lahko preverijo uporabo svojih del.
Komisija je pripravila standardizirano predlogo, vendar je odziv industrije mlačen. Modeli, izdani po 2. avgustu 2025, bi morali biti skladni takoj. Realnost pa kaže na kršitve teh določil. OpenAI je po tem datumu izdal GPT-5, Google Gemini 3, Mistral pa Mistral 3. Ob pisanju nobeden od teh velikanov ni objavil dokumentacije v obsegu, ki ga zahteva EU. Namesto konkretnih seznamov virov njihove tehnične specifikacije vsebujejo le splošne fraze o uporabi "raznolikih podatkov" s spleta in od partnerjev.
Da postopek ni tehnično neizvedljiv, dokazuje podjetje Hugging Face, ki je zahtevani obrazec izpolnilo v nekaj urah. Veliki igralci medtem odgovarjajo diplomatsko, da še preučujejo izvedbo pravil. Komisija bo uradni nadzor začela izvajati šele to poletje, kar podjetjem omogoča tiho "obdobje milosti". To pomanjkanje transparentnosti ima realne posledice, saj imetniki pravic ne vedo, ali se njihova dela uporabljajo nezakonito, v ozadju pa že tli nov pravno-politični spopad med Brusljem in Silicijevo dolino.

