Templejt za javni Rezime sadržaja obuke za general-purpose AI modele
Paralelno sa procesom Kodeksa prakse, Kancelarija za AI je takođe razvila obrazac dovoljno detaljnog Rezimea podataka o obuci koje provajderi general-purpose AI (GPAI) modela moraju da objave, u skladu sa članom 53(1)d) AI. Provajderi svih GPAI modela plasiranih na tržište Unije moraju da ispune ovu obavezu, uključujući provajdere GPAI modela objavljenih pod besplatnim i open-source licencama[1], ukoliko modeli spadaju u okvir AI Akta[2].
Templejt je priložen u Explanatory Notice[3], aktu objavljenom 24. jula 2025. godine, i ima za cilj da obezbedi zajedničku minimalnu osnovu za informacije koje će biti javno dostupne u Rezimeu sadržaja obuke za GPAI modele. Obrazac za Rezime podataka o obuci je usko povezan sa obavezama provajdera u vezi sa transparentnošću i autorskim pravima koje su detaljno odredjene u Kodeksu prakse.
Cilj Rezimea
Uvodna odredba 107 AI Akta objašnjava da je cilj Rezimea povećanje transparentnosti sadržaja koji se koristi za obuku GPAI modela, uključujući tekst i podatke zaštićene zakonom, i olakšavanje stranama sa legitimnim interesima, uključujući nosioce prava, da ostvare i sprovedu svoja prava u skladu sa pravom Unije.
Explanatory Notice detaljno elaborira ciljeve Rezimea:
Prvo, u vezi sa pravima intelektualne svojine, uključujući autorska i srodna prava, transparentnost podataka koji se koriste za obuku modela trebalo bi da pomogne nosiocima prava da dobiju relevantne informacije o sadržaju koji se koristi u obuci GPAI modela. Ove informacije su potrebne kako bi se olakšalo ostvarivanje njihovog osnovnog prava na intelektualnu svojinu[4] i osnovnog prava na delotvoran pravni lek u sprovođenju njihovih prava, kako je predviđeno pravom Unije u oblasti prava intelektualne svojine. U slučaju autorskih i srodnih prava, transparentnost podataka za obuku doprineće obezbedjenju da provajderi GPAI modela poštuju pravo Unije o autorskim i srodnim pravima[5].
Drugo, transparentnost podataka o obuci u Rezimeu može olakšati prava subjekata podataka i šire podržati sprovođenje pravila Unije o zaštiti podataka. Konkretno, to se može postići sumiranjem svih relevantnih informacija zajedno, kao što su informacije o podacima prikupljenim sa interneta ili koje je provajder prikupio putem interakcija sa modelom ili drugim uslugama i proizvodima. Informacije u Rezimeu nisu namenjene da zamene, niti utiču na odgovarajuće informacije koje provajderi GPAI modela treba da stave na raspolaganje subjektima podataka u skladu sa pravom Unije o zaštiti podataka. U kontekstu Rezimea, interesi potrošača i zaštita njihovih potrošačkih prava u skladu sa pravom Unije takođe mogu biti relevantni.
Treće, transparentnost opštih karakteristika sadržaja koji se koristi za obuku može takođe pomoći provajderima koji integrišu ove modele u nizvodne aplikacije da procene različite vrste podataka. Ovo će im, zauzvrat, omogućiti da, gde je to potrebno, primene mere ublažavanja kako bi se osiguralo poštovanje osnovnih prava na nediskriminaciju[6] i jezičku i kulturnu različitost[7].
Četvrto, veća transparentnost podataka za obuku može takođe olakšati osnovno pravo na primanje i prenošenje informacija[8] i omogućiti istraživačima da ostvare svoju naučnu slobodu[9] radi sprovođenja naučnih istraživanja. To može omogućiti akademskim institucijama i organizacijama da kritički procene implikacije i ograničenja određenog GPAI modela i potencijalne rizike i štete povezane sa korišćenim podacima.
Konačno, transparentnost podataka za obuku može takođe doprineti transparentnijim i konkurentnijim tržištima. Na primer, informacije o tome da li su javno dostupni GPAI modeli korišćeni za obuku drugih modela, posebno putem destilacije modela, ili da li je model obučen na podacima korisnika prikupljenim iz sopstvenih proizvoda i usluga provajdera, mogu pomoći korisnicima i kompanijama da bolje razumeju kako su njihovi podaci i modeli korišćeni i da izbegnu potencijalne lock-in efekte.
Sveobuhvatan obim podataka za obuku i dovoljno detalja
Informacije o GPAI modelu date u Rezimeu treba da obuhvate podatke korišćene u svim fazama obuke modela, od prethodne obuke do post-obuke, uključujući usklađivanje modela i fino podešavanje. Ovo obuhvata sve izvore i vrste podataka, bez obzira na to da li su podaci zaštićeni ili ne, uključujući i pravo intelektualne svojine.
Templejt se sastoji od tri glavna odeljka:
- Opšte informacije: ovaj odeljak zahteva informacije koje omogućavaju identifikaciju provajdera i modela, kao i informacije o modalitetima, veličini svakog modaliteta u širokim rasponima, kao i opšte karakteristike podataka za obuku.
- Lista izvora podataka: ovaj odeljak zahteva otkrivanje glavnih skupova podataka koji su korišćeni za obuku modela, kao što su velike privatne ili javne baze podataka, i sveobuhvatan narativni opis podataka prikupljenih onlajn od strane ili u ime provajdera (uključujući rezime najrelevantnijih naziva domena, koji su scraped) i narativni opis svih ostalih korišćenih izvora podataka (npr. korisnički podaci ili sintetički podaci) kako bi se osigurala potpunost rezimea u vezi sa sadržajem koji se koristi za obuku modela.
- Relevantni aspekti obrade podataka: ovaj odeljak zahteva otkrivanje određenih aspekata obrade podataka koji su relevantni za ostvarivanje prava stranaka sa legitimnim interesima prema pravu Unije. Ovo je posebno važno za usklađenost sa pravom Unije o autorskim i srodnim pravima i za uklanjanje nezakonitog sadržaja kako bi se ublažio rizik da se takav nezakoniti sadržaj može reprodukovati i širiti u velikim razmerama pomoću GPAI modela.
Balans sa poslovnim tajnama i poverljivim poslovnim informacijama
Kao što je objašnjeno u uvodnoj odredbi 107 AI Akta, Templejt treba da teži postizanju ravnoteže između služenja interesima strana sa legitimnim interesima i promovisanja povećane transparentnosti sadržaja obuke na smislen način, uz poštovanje prava svih uključenih strana, posebno vodeći računa o potrebi zaštite poslovnih tajni i poverljivih poslovnih informacija.
Ovo pažljivo balansiranje trebalo bi da se sprovede u odnosu na informacije čije otkrivanje Templejt zahteva, kako bi provajderi ispunili svoju obavezu prema članu 53(1)(d) AI Akta i pružili „dovoljno detaljan“ javni rezime sadržaja obuke. Pružanje informacija o specifičnijim detaljima o sadržaju koji se koristi za obuku GPAI modela potrebno je u Templejtu u samo tamo gde je to neophodno da bi se omogućilo ostvarivanje prava zaštićenih pravom Unije na smislen način.
Da bi se zaštitile poslovne tajne provajdera, u Templejtu se zahtevaju različiti nivoi detalja u zavisnosti od izvora podataka koji se razmatra. Explanatory Notice određuje obim tih podataka za određene izvore podataka: licencirani podaci, privatni skupovi podataka, podaci preuzeti iz onlajn izvora…
Jednostavno, jedinstveno i efikasno izveštavanje
Informacije koje zahteva Templejt treba da budu dostavljene u narativnom, jednostavnom i efikasnom obliku. Cilj Templejta je da osigura da su prijavljene informacije korisne i razumljive javnosti i zainteresovanim stranama, izbegavajući pritom nepotrebno opterećenje provajdera GPAI modela, uključujući mala i srednja preduzeća.
Svaki odeljak Templejta sadrži jasna i kratka uputstva koja omogućavaju provajderima da prijave potrebne informacije na jednostavan i jedinstven način. Komisija je obezbedila Templejt kao onlajn obrazac i objavila ga na svojoj veb stranici.[10]
Provajderi treba da obezbede da se informacije uključene u Rezime prijavljuju u dobroj veri i na tačan i sveobuhvatan način. U određenim odeljcima je predvidjena fleksibilnost, kao što je naznačeno u Templejtu, kako bi se otkrile samo informacije koje su relevantne, neophodne za svrhu Rezimea i koje je u praksi moguće dobiti (npr. u vezi sa kategorizacijom dela sadržaja ili karakteristikama podataka o obuci, ili periodom prikupljanja podataka).
Kancelarija za AI može da proveri da li je Templejt pravilno popunjen kako bi procenila da li se provajder uskladio sa članom 53(1)(d) AI Akta. U ovom kontekstu, Kancelarija za AI ima sva ovlašćenja za sprovođenje zakona u skladu sa AI Aktom i može zahtevati korektivne mere. Nepoštovanje propisa može biti sankcionisano novčanim kaznama do 3% ukupnog godišnjeg prometa provajder širom sveta u prethodnoj finansijskoj godini ili 15.000.000 evra, šta je od toga veće. Zakonito prikupljanje i obrada podataka ostaje odgovornost provajdera dobavljača u skladu sa drugim primenljivim pravom Unije (npr. autorska prava i zaštita podataka).