Generatywna sztuczna inteligencja a prawo autorskie w UE – kluczowe wnioski z raportu EUIPO

W maju 2025 r. Urząd Unii Europejskiej ds. Własności Intelektualnej (EUIPO) opublikował obszerny raport  „The development of generative artificial intelligence from copyright perspectivedotyczący generatywnej sztucznej inteligencji (GenAI) oraz praw autorskich. Raport ten miał na celu wyjaśnienie wątpliwości związanych z rozwojem GenAI z perspektywy unijnego prawa autorskiego, z uwzględnieniem aspektów technicznych, prawnych i ekonomicznych. Należy podkreślić, że opracowanie to nie ma charakteru wiążącego, ale zawiera dokładne podsumowanie wielu z obecnie dyskutowanych kwestii. 

W Unii Europejskiej (UE) dwa akty prawne mają szczególne znaczenie dla ujęcia skutków rozwoju GenAI z perspektywy prawa autorskiego. Pierwszym z nich jest Dyrektywa w sprawie prawa autorskiego i praw pokrewnych na jednolitym rynku cyfrowym (dyrektywa 2019/790), która w art. 3 i 4 wprowadziła dwa nowe, obowiązkowe dla państw członkowskich wyjątki, zezwalające na zwielokrotnianie utworów dla potrzeb text and data mining (TDM). W art. 4 wprowadzono mechanizm opt-out w przypadku stosowania TDM do celów innych niż badania naukowe. Oznacza to, że uprawnieni mogą zakazać wykorzystania swoich utworów do celów TDM.

W jednym z poprzednich artykułów przybliżyliśmy, czym dokładnie jest TDM i jak odnosi się do trenowania modeli sztucznej inteligencji (SI).

Drugim kluczowym aktem prawnym jest AI Act, który ustanawia ramy regulacyjne dla technologii SI w UE, nakładając określone obowiązki dla dostawców modeli SI ogólnego przeznaczenia.

AI Act

Zgodnie z AI Act, dostawcy modeli SI wprowadzają politykę służącą zapewnieniu zgodności z prawem UE dotyczącym prawa autorskiego i praw pokrewnych, w szczególności z myślą o identyfikacji i respektowania zastrzeżeń praw wyrażonych zgodnie z art. 4 ust. 3 dyrektywy 2019/790. Powinni oni stosować w tym celu najnowocześniejsze technologie.

Dostawcy modeli SI sporządzają również i podają do wiadomości publicznej wystarczająco szczegółowe streszczenie na temat treści wykorzystanych do trenowania danego modelu SI, zgodnie ze wzorem dostarczonym przez Urząd ds. SI. Jak wynika z motywu 107 AI Act, przy uwzględnieniu potrzeby ochrony tajemnic przedsiębiorstwa i poufnych informacji handlowych, streszczenie to nie powinno skupiać się na szczegółach technicznych, lecz mieć charakter całościowy.

Powinno ono np. wskazywać główne zbiory danych wykorzystane do trenowania modelu – takie jak duże prywatne lub publiczne bazy lub archiwa danych – oraz zawierać opisowe wyjaśnienie innych źródeł danych. Warto zauważyć, że obowiązek sporządzania dokumentacji wiąże się między innymi z koniecznością inwestowania w systemy śledzenia źródeł danych treningowych a także z ryzykiem wzrostu kosztów zgodności (compliance).

Dane treningowe

Aby wytrenować skuteczny i precyzyjny model SI, potrzeba ogromnej ilości danych treningowych. Zestawy danych mogą składać się różnorodnych informacji i danych pochodzących z wielu źródeł, a niektóre elementy zestawów danych mogą być objęte ochroną prawnoautorską. Należy zwrócić szczególną uwagę na fakt, że nawet jeśli zbiór danych jest publicznie udostępniony czy dostępny za darmo, nie oznacza to automatycznie, że jest wolny od ochrony prawnoautorskiej ani że istnieje zgoda na jego wykorzystanie do trenowania modeli SI.
Relacja między wyjątkiem TDM a trenowaniem modeli SI

Zgodnie z unijnym prawem autorskim trenowanie modeli SI jest zasadniczo dozwolone w ramach wyjątku TDM, chyba że korzystanie z utworów zostało wyraźnie zastrzeżone przez uprawnionych (tzw. opt-out). Kwestia ta pozostaje jednak niejednoznaczna. Jak zaznaczono w raporcie, zagadnienie to wciąż budzi wiele kontrowersji.

Zdaniem części naukowców, wyjątek TDM może obejmować proces trenowania modeli SI, ale już nie etap generowania wyników. Z kolei według innego poglądu trenowanie modeli SI w ogóle nie mieści się w wyjątkach TDM określonych w art. 3 i 4 dyrektywy 2019/790. Główny argument przemawiający za tym jest taki, że proces trenowania modeli SI wymaga zwielokrotnienia dzieł objętych ochroną prawnoautorską podczas gromadzenia danych oraz w pełni lub częściowo zwielokrotnienia tych dzieł do modeli SI. Zatem wyjątek TDM nie może uzasadniać masowego naruszenia praw autorskich podczas trenowania modeli SI.

Postępowania sądowe

Wykorzystanie utworów chronionych prawem autorskim jako materiałów treningowych w rozwoju modeli GenAI wywołało szeroką dyskusję i doprowadziło do wielu postępowań sądowych na całym świecie. Do tej pory pozwy zostały wniesione w Stanach Zjednoczonych, Chinach, Wielkiej Brytanii oraz krajach UE.

Spory te dotyczą głównie pytania, czy ograniczenia i wyjątki przewidziane w prawie autorskim mają zastosowanie do trenowania modeli SI. W krajach UE liczba takich postępowań jest stosunkowo niewielka w porównaniu ze Stanami Zjednoczonymi – do tej pory wniesiono zaledwie cztery pozwy: trzy w Niemczech (Kneschke v. LAION, GEMA v. OpenAI oraz GEMA v. Suno AI) oraz jeden we Francji (SNE v. Meta).

W opracowaniu wskazano, że możliwą przyczyną stosunkowo niskiego wskaźnika sporów sądowych w UE jest ostrożność i powściągliwość stron zainteresowanych, które jednocześnie uważnie obserwują proces wdrażania AI Act.

Nowy rynek licencyjny

Jak podkreślają autorzy opracowania, rynek licencjonowania treści do celów TDM szybko się rozwija. Rosnące zapotrzebowanie na wysokiej jakości dane treningowe stało się kluczowym czynnikiem napędzającym ten rynek.

Ewolucja technologii SI spowodowała wzrost zapotrzebowania na coraz większe zbiory danych treningowych, co przyczynia się do znaczenia zbiorów danych pochodzących z różnych źródeł. Podmioty posiadające prawa autorskie coraz częściej zawierają umowy z dostawcami modeli SI, a jeszcze częściej sygnalizują gotowość do podjęcia negocjacji.

Przykładowo, OpenAI zawarło umowy z dużymi wydawcami, takimi jak Associated Press czy Dotdash Meredith. Najlepszą pozycję negocjacyjną mają te podmioty, które kontrolują obszerne zbiory utworów, w szczególności organizacje zbiorowego zarządzania prawami autorskimi, wydawnictwa oraz konglomeraty medialne.

Rosnąca rola licencjonowania danych do trenowania SI otwiera nowe źródła przychodów dla wydawców, organizacji zbiorowego zarządzania i podmiotów kontrolujących obszerne archiwa cyfrowe. Skutkiem tego może być powstanie nowego segmentu rynku, w którym wartość utworów wpływa także na ich użyteczność w procesie uczenia maszynowego.

Centrum wiedzy o prawie autorskim

Własność intelektualna jest kamieniem węgielnym nowoczesnych gospodarek, napędzającym innowacje i wzrost. Wraz ze zmianami technologicznymi zachodzącymi na całym świecie, jasne i stabilne ramy prawne są niezbędne do utrzymania konkurencyjności i wspierania zrównoważonego rozwoju.

Dlatego jednym z celów zawartych w Planie strategicznym EUIPO 2030 jest utworzenie platformy internetowej – Centrum wiedzy o prawie autorskim. Ma ono stanowić centralne źródło informacji, wskazówek i zasobów dotyczących prawa autorskiego.

W odniesieniu do GenAI, Centrum wiedzy o prawie autorskim zapewni uprawnionym informacje o tym, w jaki sposób ich dzieła mogą być wykorzystane w procesie rozwoju modeli SI oraz jak skutecznie zarządzać i chronić swoje zasoby intelektualne.

Podsumowanie

W ciągu ostatnich 30 lat kolejne fale innowacji cyfrowych zmieniły sposób tworzenia, dystrybucji i dostępu do treści. W trakcie tych przemian dostosowano prawo autorskie tak, aby zapewnić twórcom uznanie i wynagrodzenie za ich pracę.

Pojawienie się GenAI stworzyło jednak bezprecedensowe wyzwania i możliwości, które wymagają ponownej oceny istniejących ram prawnych i mechanizmów wsparcia.

Omówiony raport nie udziela jednoznacznych odpowiedzi na powstałe pytania prawne, ale stanowi przegląd najważniejszych, aktualnie dyskutowanych kwestii – takich jak rozwijający się rynek licencjonowania danych treningowych, postępowania sądowe czy kwestie związane z dyrektywą 2019/790 oraz AI Act.

W raporcie zaakcentowano potrzebę wyważonego podejścia do omówionych zagadnień, które z jednej strony zagwarantuje ochronę praw autorskich, a z drugiej pozwoli wykorzystać potencjał innowacji technologicznych.

Pełna treść raportu dostępna jest tutaj.
Pełna treść planu strategicznego EUIPO 2030 dostępna jest tutaj.

Agnieszka Kaczmarczyk, praktykantka w kancelarii Barta & Partners.