Nowe przepisy wprowadzające zmiany w polskim prawie autorskim
20 września 2024 r. weszły w życie przepisy wprowadzające istotne zmiany w polskim prawie autorskim. Postanowiliśmy w najbliższym czasie poświęcić im trochę uwagi.
- Czym jest eksploracja tekstów i danych / TDM?
Nowelizacja ustawy autorskiej, w ślad za dyrektywą CDSM (2019/790), wprowadza jej definicję:
eksploracją tekstów i danych jest ich analiza wyłącznie przy zastosowaniu zautomatyzowanej techniki służącej do analizowania tekstów i danych w postaci cyfrowej w celu wygenerowania określonych informacji, obejmujących w szczególności wzorce, tendencje i korelacje (art. 6 ust 1 pkt 22 pr. aut.).
Ujmując nieco prościej: TDM to w pełni zautomatyzowana analiza zbioru treści cyfrowych (tekstów, danych) prowadzona w celu uzyskania informacji dotyczących takiego zbioru, w tym ustalenia zależności pomiędzy poszczególnymi jego elementami. I choć w czasie prac nad dyrektywą CDSM nie było to raczej kwestią pierwszoplanową, analiza taka najczęściej jest obecnie kojarzona z procesami uczenia maszynowego (ML) w celu trenowania systemów sztucznej inteligencji (AI).
- Co ma taka analiza – a w szczególności trenowanie systemów AI – do prawa autorskiego?
Otóż wiele, zwłaszcza w przypadku systemów GenAI nie da się wytrenować modelu bez dokonywania zwielokrotniania treści cyfrowych. Treści takie często mają twórczy charakter (są chronione prawem autorskim) a zwielokrotnianie utworów wchodzi w zakres monopolu autorskiego. Bez uczynienia wyjątku w prawie autorskim prowadzenia zautomatyzowanych analiz na takich danych, w szczególności trenowanie modeli wymagałoby zgody uprawnionych (licencji) bez uzyskania której byłoby niedopuszczalne.
- Co w tym zakresie zmienia nowelizacja z 2024 r.?
Sporo. Przede wszystkim wprowadza taki wyjątek, a w zasadzie nawet dwa (art. 262 i art. 263 pr. aut.).
Pierwszy z nich dotyczący TDM dla celów badań naukowych jest szerszy (przechowywanie danych możliwe jest także po zakończeniu TDM) i bezwarunkowy (uprawniony nie może się skutecznie sprzeciwić TDM). Jednocześnie wyjątek „naukowy” jest jednak ograniczony celem wykonywanego TDM (badania naukowe, niekomercyjny charakter), a także rodzajem podmiotów które mogą z niego skorzystać (instytucje dziedzictwa kulturowego, uczelnie, PAN, PAU, Centrum i Sieć Łukasiewicz, instytuty badawcze i naukowe, inne samodzielne jednostki naukowe).
Drugi z wyjątków TDM ma charakter znacznie bardziej uniwersalny. Może powołać się na niego dowolny podmiot, a cel takich działań może być (choć oczywiście nie musi) komercyjny. Istotną różnica jest możliwość dokonania przez uprawnionego zastrzeżenia, wyłączającego dany utwór z TDM, jak również brak możliwości przechowywania utworów po zakończeniu takich działań, tj. po osiągnięciu ich celu. Dokonywanie zastrzeżeń w praktyce może jednak wywoływać problemy.
Przepis wskazuje bowiem, że:
zastrzeżenia dokonuje się „wyraźnie i odpowiednio do sposobu, w jaki utwór został udostępniony”, a w przypadku utworów umieszczonych w internecie ponadto „w formacie przeznaczonym do odczytu maszynowego wraz z metadanymi”.
Tak ogólnie określony sposób dokonywania zastrzeżeń może więc wywoływać problemy interpretacyjne, co z uwagi na ryzyko dokonania potencjalnych naruszeń praw wyłącznych z jednej strony (korzystający) oraz ryzyko ewentualnej nieskuteczności zastrzeżenia z drugiej (uprawniony) trudno uznać za rozwiązanie optymalne.
Generalnie jednak wprowadzenie opisanych wyżej wyjątków TDM do polskiego prawa autorskiego należy ocenić pozytywnie, zwłaszcza w dobie olbrzymiej i wciąż rosnącej popularności rozwiązań AI, w tym GenAI oraz modeli opartych na uczeniu maszynowym, realizowanym w oparciu o olbrzymie zasoby danych (tekstów, obrazów, wideo, muzyki) często objętych ochroną prawną, w tym stanowiących przedmiot praw wyłącznych innych osób.