Templejt za javni Rezime sadržaja obuke za general-purpose AI modele

Paralelno sa procesom Kodeksa prakse, Kancelarija za AI je takođe razvila obrazac dovoljno detaljnog Rezimea podataka o obuci koje provajderi general-purpose AI (GPAI) modela moraju da objave, u skladu sa članom 53(1)d) AI. Provajderi svih GPAI modela plasiranih na tržište Unije moraju da ispune ovu obavezu, uključujući provajdere GPAI modela objavljenih pod besplatnim i open-source licencama[1], ukoliko modeli spadaju u okvir AI Akta[2].

Templejt je priložen u Explanatory Notice[3], aktu objavljenom 24. jula 2025. godine, i ima za cilj da obezbedi zajedničku minimalnu osnovu za informacije koje će biti javno dostupne u Rezimeu sadržaja obuke za GPAI modele. Obrazac za Rezime podataka o obuci je usko povezan sa obavezama provajdera u vezi sa transparentnošću i autorskim pravima koje su detaljno odredjene u Kodeksu prakse.

Cilj Rezimea

Uvodna odredba 107 AI Akta objašnjava da je cilj Rezimea povećanje transparentnosti sadržaja koji se koristi za obuku GPAI modela, uključujući tekst i podatke zaštićene zakonom, i olakšavanje stranama sa legitimnim interesima, uključujući nosioce prava, da ostvare i sprovedu svoja prava u skladu sa pravom Unije.

Explanatory Notice detaljno elaborira ciljeve Rezimea:

Prvo, u vezi sa pravima intelektualne svojine, uključujući autorska i srodna prava, transparentnost podataka koji se koriste za obuku modela trebalo bi da pomogne nosiocima prava da dobiju relevantne informacije o sadržaju koji se koristi u obuci GPAI modela. Ove informacije su potrebne kako bi se olakšalo ostvarivanje njihovog osnovnog prava na intelektualnu svojinu[4] i osnovnog prava na delotvoran pravni lek u sprovođenju njihovih prava, kako je predviđeno pravom Unije u oblasti prava intelektualne svojine. U slučaju autorskih i srodnih prava, transparentnost podataka za obuku doprineće obezbedjenju da provajderi GPAI modela poštuju pravo Unije o autorskim i srodnim pravima[5].

Drugo, transparentnost podataka o obuci u Rezimeu može olakšati prava subjekata podataka i šire podržati sprovođenje pravila Unije o zaštiti podataka. Konkretno, to se može postići sumiranjem svih relevantnih informacija zajedno, kao što su informacije o podacima prikupljenim sa interneta ili koje je provajder prikupio putem interakcija sa modelom ili drugim uslugama i proizvodima. Informacije u Rezimeu nisu namenjene da zamene, niti utiču na odgovarajuće informacije koje provajderi GPAI modela treba da stave na raspolaganje subjektima podataka u skladu sa pravom Unije o zaštiti podataka. U kontekstu Rezimea, interesi potrošača i zaštita njihovih potrošačkih prava u skladu sa pravom Unije takođe mogu biti relevantni.

Treće, transparentnost opštih karakteristika sadržaja koji se koristi za obuku može takođe pomoći provajderima koji integrišu ove modele u nizvodne aplikacije da procene različite vrste podataka. Ovo će im, zauzvrat, omogućiti da, gde je to potrebno, primene mere ublažavanja kako bi se osiguralo poštovanje osnovnih prava na nediskriminaciju[6] i jezičku i kulturnu različitost[7].

Četvrto, veća transparentnost podataka za obuku može takođe olakšati osnovno pravo na primanje i prenošenje informacija[8] i omogućiti istraživačima da ostvare svoju naučnu slobodu[9] radi sprovođenja naučnih istraživanja. To može omogućiti akademskim institucijama i organizacijama da kritički procene implikacije i ograničenja određenog GPAI modela i potencijalne rizike i štete povezane sa korišćenim podacima.

Konačno, transparentnost podataka za obuku može takođe doprineti transparentnijim i konkurentnijim tržištima. Na primer, informacije o tome da li su javno dostupni GPAI modeli korišćeni za obuku drugih modela, posebno putem destilacije modela, ili da li je model obučen na podacima korisnika prikupljenim iz sopstvenih proizvoda i usluga provajdera, mogu pomoći korisnicima i kompanijama da bolje razumeju kako su njihovi podaci i modeli korišćeni i da izbegnu potencijalne lock-in efekte.

Sveobuhvatan obim podataka za obuku i dovoljno detalja

Informacije o GPAI modelu date u Rezimeu treba da obuhvate podatke korišćene u svim fazama obuke modela, od prethodne obuke do post-obuke, uključujući usklađivanje modela i fino podešavanje. Ovo obuhvata sve izvore i vrste podataka, bez obzira na to da li su podaci zaštićeni ili ne, uključujući i pravo intelektualne svojine.

Templejt  se sastoji od tri glavna odeljka:

  1. Opšte informacije: ovaj odeljak zahteva informacije koje omogućavaju identifikaciju provajdera i modela, kao i informacije o modalitetima, veličini svakog modaliteta u širokim rasponima, kao i opšte karakteristike podataka za obuku.
  2. Lista izvora podataka: ovaj odeljak zahteva otkrivanje glavnih skupova podataka koji su korišćeni za obuku modela, kao što su velike privatne ili javne baze podataka, i sveobuhvatan narativni opis podataka prikupljenih onlajn od strane ili u ime provajdera (uključujući rezime najrelevantnijih naziva domena, koji su scraped) i narativni opis svih ostalih korišćenih izvora podataka (npr. korisnički podaci ili sintetički podaci) kako bi se osigurala potpunost rezimea u vezi sa sadržajem koji se koristi za obuku modela.
  3. Relevantni aspekti obrade podataka: ovaj odeljak zahteva otkrivanje određenih aspekata obrade podataka koji su relevantni za ostvarivanje prava stranaka sa legitimnim interesima prema pravu Unije. Ovo je posebno važno za usklađenost sa pravom Unije o autorskim i srodnim pravima i za uklanjanje nezakonitog sadržaja kako bi se ublažio rizik da se takav nezakoniti sadržaj može reprodukovati i širiti u velikim razmerama pomoću GPAI modela.

Balans sa poslovnim tajnama i poverljivim poslovnim informacijama

Kao što je objašnjeno u uvodnoj odredbi 107 AI Akta, Templejt treba da teži postizanju ravnoteže između služenja interesima strana sa legitimnim interesima i promovisanja povećane transparentnosti sadržaja obuke na smislen način, uz poštovanje prava svih uključenih strana, posebno vodeći računa o potrebi zaštite poslovnih tajni i poverljivih poslovnih informacija.

Ovo pažljivo balansiranje trebalo bi da se sprovede u odnosu na informacije čije otkrivanje Templejt zahteva, kako bi provajderi ispunili svoju obavezu prema članu 53(1)(d) AI Akta i pružili „dovoljno detaljan“ javni rezime sadržaja obuke. Pružanje informacija o specifičnijim detaljima o sadržaju koji se koristi za obuku GPAI modela potrebno je u Templejtu u samo tamo gde je to neophodno da bi se omogućilo ostvarivanje prava zaštićenih pravom Unije na smislen način.

Da bi se zaštitile poslovne tajne provajdera, u Templejtu se zahtevaju različiti nivoi detalja u zavisnosti od izvora podataka koji se razmatra. Explanatory Notice određuje obim tih podataka za određene izvore podataka: licencirani podaci, privatni skupovi podataka, podaci preuzeti iz onlajn izvora…

Jednostavno, jedinstveno i efikasno izveštavanje

Informacije koje zahteva Templejt treba da budu dostavljene u narativnom, jednostavnom i efikasnom obliku. Cilj Templejta je da osigura da su prijavljene informacije korisne i razumljive javnosti i zainteresovanim stranama, izbegavajući pritom nepotrebno opterećenje provajdera GPAI modela, uključujući mala i srednja preduzeća.

Svaki odeljak Templejta sadrži jasna i kratka uputstva koja omogućavaju provajderima da prijave potrebne informacije na jednostavan i jedinstven način. Komisija je obezbedila Templejt kao onlajn obrazac i objavila ga na svojoj veb stranici.[10]

Provajderi treba da obezbede da se informacije uključene u Rezime prijavljuju u dobroj veri i na tačan i sveobuhvatan način. U određenim odeljcima je predvidjena fleksibilnost, kao što je naznačeno u Templejtu, kako bi se otkrile samo informacije koje su relevantne, neophodne za svrhu Rezimea i koje je u praksi moguće dobiti (npr. u vezi sa kategorizacijom dela sadržaja ili karakteristikama podataka o obuci, ili periodom prikupljanja podataka).

Kancelarija za AI može da proveri da li je Templejt pravilno popunjen kako bi procenila da li se provajder uskladio sa članom 53(1)(d) AI Akta. U ovom kontekstu, Kancelarija za AI ima sva ovlašćenja za sprovođenje zakona u skladu sa AI Aktom i može zahtevati korektivne mere. Nepoštovanje propisa može biti sankcionisano novčanim kaznama do 3% ukupnog godišnjeg prometa provajder širom sveta u prethodnoj finansijskoj godini ili 15.000.000 evra, šta je od toga veće. Zakonito prikupljanje i obrada podataka ostaje odgovornost provajdera dobavljača u skladu sa drugim primenljivim pravom Unije (npr. autorska prava i zaštita podataka).

[1] Izuzetak za besplatne i open-source  GPAI modele iz člana 53(2) AI Akta se ne primenjuje na obavezu javnog objavljivanja Rezimea.
[2] Član 2 AI Akta i Smernice o obimu obaveza za provajder GPAI modela utvrđenih AI Aktom.
[3] https://digital-strategy.ec.europa.eu/en/library/explanatory-notice-and-template-public-summary-training-content-general-purpose-ai-models
[4] Article 17(2) of the EU Charter of Fundamental Rights of the European Union, OJ C 326, 26.10.2012, p. 391–407.
[5] Directive (EU) 2019/790 of the European Parliament and of the Council of 17 April 2019 on copyright and related rights in the Digital Single Market and amending Directives 96/9/EC and 2001/29/EC (Text with EEA relevance.), PE/51/2019/REV/1, OJ L 130, 17.5.2019, p. 92–125.
[6] Article 21 of the EU Charter of Fundamental Rights.
[7] Article 22 of the EU Charter of Fundamental Rights.
[8] Article 11(1) of the EU Charter of Fundamental Rights.
[9] Article 13 of the EU Charter of Fundamental Rights.
[10] https://digital-strategy.ec.europa.eu/en/library/explanatory-notice-and-template-public-summary-training-content-general-purpose-ai-models.