Big Data cz. I. Big Data a prawo autorskie i ochrona sui generis baz danych

Obecna rzeczywistość biznesowa, a także jej najbliższa przyszłość, jest oparta na Big Data wykorzystywanych przez sztuczną inteligencję (AI). Duże spółki prześcigają się w pozyskiwaniu danych, które następnie służą jako wkład do AI, a zarazem podstawa w procesie jej nauczania. Wszystko po to by ulepszyć jakość prowadzonej działalności lub rozwinąć nową, wzmocnić pozycję na rynku oraz zwiększyć zyski firmy. Powstaje pytanie, czy istnieje sposób ochrony pozyskanych danych przed ich wykorzystaniem przez konkurentów, a jeżeli tak to jaki i na ile skuteczny?

Czym są Big Data?
Big Data to dane – co do zasady nieosobowe – generowane i gromadzone automatycznie/maszynowo (machine-generated data), czyli bez bezpośredniej interwencji człowieka, w ilościach masowych. Sposobem na ich pozyskiwanie może być np. wykorzystywanie procesów komputerowych lub czujników przetwarzających dane dostarczane za pomocą dedykowanego sprzętu. Obecnie, z uwagi na rozwój sztucznej inteligencji, Big Data mają nieprzecenione znaczenie – stanowią wkład do AI i jednocześnie podstawę w procesie jej nauczania. Są zatem istotnym elementem biznesowym, a niekiedy nawet bazą dla działalności. Z tego względu należy zastanowić się w jaki sposób można je chronić przed swobodnym wykorzystaniem przez konkurentów.

W tej części artykułu (Big Data cz. I) analizie zostaną poddane, na podstawie prawa obowiązującego w Unii Europejskiej, zagadnienia: Big Data a prawo autorskie oraz Big Data a ochrona sui generis baz danych.

Big Data a prawo autorskie

Big Data wykorzystywane jako wkład do AI teoretycznie mogą być chronione prawami własności intelektualnej, w tym w szczególności prawem autorskim. Ustalenie czy podlegają one ochronie, a tym samym czy ograniczona jest możliwość ich dalszego swobodnego wykorzystania, ma istotne znaczenie z perspektywy praktycznej. Choć prawo autorskie nie jest w UE w pełni zharmonizowane, z uwagi na liczne dyrektywy, a także działalność TS UE, można w omawianym zakresie przedstawić spójne wnioski.

Na gruncie prawa autorskiego na ochronę zasługuje utwór, czyli każdy przejaw działalności twórczej o indywidualnym charakterze, ustalony w jakiejkolwiek postaci, niezależnie od wartości, przeznaczenia i sposobu wyrażenia[1]. Już wyłącznie na postawie ww. definicji można przyjąć, że pojedyncze dane (dane „jako takie”) nie mogą być objęte ochroną, ponieważ pozbawione są jakiejkolwiek twórczej ingerencji. Analizy wymaga jednak także sytuacja prawna danych zgromadzonych w zbiorze lub usytuowanych w bazie danych.

Ochronę zbiorów lub baz danych – lecz nie każdych, a tylko tych spełniających cechy utworu, przewiduje wprost art. 3 pr. aut. Jak wynika z orzeczenia TS UE w sprawie Infopaq I (C-5/08), stworzenie rezultatu stanowiącego twórczość intelektualną (utwór), tym samym wyrażenie przez autora w sposób twórczy jego oryginalnej inwencji, może się odbyć np.: „w drodze wyboru, układu i połączenia […][2]”. Proces automatycznego zbierania lub gromadzenia danych w praktyce pozbawiony jest tych czynności, gdyż są dla niego po prostu zbędne. Liczy się jego szybkość i skuteczność, jako że stanowi on swego rodzaju mechanizm biznesowy. Z tego względu, co do zasady, dane zbierane lub generowane automatycznie nie podlegają ochronie autorsko prawnej jako pozbawione indywidualnego charakteru[3]. Jeżeli jednak z okoliczności konkretnej sprawy wynika, że zbiór lub baza danych spełnia cechy utworu, przyznana ochrona nie rozciąga się na ich zawartość (dane), lecz dot. wyłącznie wkładu twórczego.

Big Data a ochrona sui generis baz danych

Jeżeli bazy danych nie są przedmiotem prawa autorskiego, można jeszcze rozważać ich ochronę w oparciu o reżim ochrony sui generis. Zgodnie z dyrektywą 96/9 o ochronie baz danych[4], producenci baz danych wymagających jakościowej i/lub ilościowej, istotnej inwestycji dla uzyskania, weryfikacji lub prezentacji ich zawartości powinni dysponować prawem do ochrony przed pobieraniem danych i/lub wtórnym ich wykorzystaniem w całości lub w istotnej części, co do jakości i/lub ilości[5]. Kluczowym jest więc ustalenie, jak na gruncie reżimu siu generis rozumiana jest baza danych. Jak wynika z art. 1(2) ww. dyrektywy, oznacza ona zbiór niezależnych utworów, danych lub innych materiałów uporządkowanych w sposób systematyczny lub metodyczny, indywidualnie dostępnych środkami elektronicznymi lub innymi sposobami. Można zatem stwierdzić, że podobnie jak na gruncie prawa autorskiego, obowiązek dokonania segregacji danych, która nie wymaga tu jednak aspektu twórczego, lecz pewnej metodyki, może skutecznie pozbawić ochrony wiele baz danych zawierających Big Data.

Nie jest mimo wszystko wykluczone, że np. w celu uzyskania ochrony, producenci baz danych zdecydują się na schematyczne lub metodyczne uporządkowanie ich zawartości. Wtedy pojawia się jednak kolejna kwestia problematyczna. Zgodnie z treścią ww. dyrektywy, prawo sui generis obejmuje swym zakresem bazy danych wymagające jakościowej i/lub ilościowej, istotnej inwestycji dla uzyskania, weryfikacji lub prezentacji ich zawartości. Jako, że bazy danych w kontekście Big Data nie są tworzone w celu weryfikacji lub prezentacji danych, należy zastanowić się, czy są tworzone w celu uzyskania danych. Jak się okazuje, w praktyce odpowiedź na to pytanie nie jest jednoznaczna. Niektóre bazy danych składają się bowiem z Big Data już istniejących, natomiast inne z Big Data tworzonych na potrzeby ich powstania. Zgodnie z wypowiedzą TS UE w sprawie Fixtures Marketing (C-444/02), na ochronę zasługują jedynie te pierwsze, ponieważ „[P]ojęcie inwestycji związanej z uzyskaniem zawartości bazy danych w rozumieniu art. 7 ust. 1 dyrektywy 96/9 należy rozumieć jako określające nakłady na poszukiwanie już istniejących elementów i ich gromadzenie w tej bazie danych. Pojęcie to nie obejmuje nakładów na stworzenie elementów składających się na zawartość bazy danych[6]”. Zatem przyznanie ochrony może być zależne od rodzaju danych (istniejących lub tworzonych) stanowiących zawartość bazy danych.

Próbując zobrazować ten problem, warto wyobrazić sobie następujące przykłady: stworzenie bazy a) przy wykorzystaniu danych wytworzonych uprzednio przez satelitę lub przez radar b) na podstawie wygenerowanych w tym celu danych przedstawiających rozkłady przylotów i odlotów lub terminy zawodów jeździeckich. O ile czynność opisana w przykładzie a) mogłaby zostać zakwalifikowana jako uzyskanie zawartości, tak czynność z przykładu b) byłaby zdefiniowana jako stworzenie danych na potrzeby utworzenia bazy danych. Są jednak przypadki graniczne, w których niezwykle trudno ocenić czy miało miejsce uzyskanie czy stworzenie danych – jednym z nich jest gromadzenie danych przez autonomiczne auta wyposażone w rozmaite czujniki. Z jednej strony, zebrane dane odzwierciedlają jedynie istniejące już informacje, czyli stanowią swego rodzaju obserwację świata zewnętrznego. Z drugiej strony, dane te są tworzone – w spójnej i czytelnej formie, zdolnej do praktycznego wykorzystania, w jakiej nie były dostępne przed ich zebraniem. Z uwagi na rosnące znaczenie branży pojazdów autonomicznych, zagadnienie to najprawdopodobniej stanie się w przyszłości przedmiotem rozważań TS UE.

Wyjątek text and data mining

Analizując tematykę Big Data w kontekście prawa autorskiego oraz ochrony sui generis baz danych warto ponadto zwrócić uwagę na wyjątek text and data mining (eksploracja tekstów i danych). Może on bowiem potencjalnie zostać wykorzystany przez konkurentów jako podstawa do korzystania z baz danych w przypadku, gdy są chronione w ramach któregoś z ww. reżimów.

Wyjątek text and data mining został ustanowiony w art. 4 dyrektywy w sprawie prawa autorskiego i praw pokrewnych na jednolitym rynku cyfrowym[7], a jego celem jest umożliwienie zwielokrotnień i pobrań utworów i innych przedmiotów objętych ochroną (w tym baz danych chronionych prawem sui generis) dostępnych zgodnie z prawem do celów eksploracji tekstów i danych. Przez eksplorację tekstów i danych rozumie się zautomatyzowaną technikę analityczną służącą do analizowania tekstów i danych w postaci cyfrowej w celu wygenerowania informacji, obejmujących między innymi wzorce, tendencje i korelacje. Definicja ta, jak można zauważyć, jest bardzo szeroka. Co więcej, zwielokrotnione lub pobrane materiały mogą być przechowywane tak długo, jak jest to konieczne do celów eksploracji tekstów i danych.

Istnieje zatem możliwość korzystania przez konkurentów, w powyższym zakresie, z chronionych baz danych zawierających Big Data, przed czym można się jednak skutecznie zabezpieczyć. Analizowany wyjątek ma zastosowanie pod warunkiem że korzystanie z utworów i innych przedmiotów objętych ochroną nie zostało wyraźnie zastrzeżone przez podmioty uprawnione. Jako jeden z praktycznych i skutecznych sposobów wyrażenia sprzeciwu dla opisanych czynności wskazuje się wykorzystanie środków nadających się do odczytu maszynowego.

Podsumowanie

Big Data mogą być potencjalnie chronione zarówno przez prawo autorskie, jak i w ramach reżimu sui generis, lecz jedynie pośrednio – jako zbiory lub bazy danych. Należy jednak pamiętać, że przyznana ochrona nigdy nie obejmuje zawartości baz danych, czyli danych „jako takich”, które mogą być zatem swobodnie wykorzystywane.
Warto jednocześnie zauważyć, że objęcie Big Data ochroną w ramach wskazanych reżimów nie jest zjawiskiem powszechnym, przede wszystkim z uwagi na specyfikę procesów związanych z ich pozyskiwaniem. Co do zasady, są to procesy pozbawione aspektów twórczych lub choćby metodycznych, nastawione na efektywność czasową oraz ilościową. Wydaje się więc, że ani prawo autorskie, ani ochrona sui generis nie stanowią mechanizmu dopasowanego do tej specyfiki, a w ujęciu generalnym, odpowiedniego dla problematyki ochrony Big Data.

[1] Zob. art. 1 ustawy o prawie autorskim i prawach pokrewnych (Dz. U. z 2018 r., poz. 1191), dalej jako „pr. aut.”.
[2] Zob. pkt 45 wyroku TS UE z dnia 16 lipca 2009 r., w sprawie Infopaq C-5/08.
[3] Innym problemem związanym z prawnoautorską ochroną Big Data jest zagadnienie podmiotu zdolnego do stworzenia chronionego utworu. Na gruncie polskiej ustawy pr. aut. przyjmuje się, iż może to być wyłącznie osoba fizyczna. Trwa jednak europejska debata, czy prawo autorskie nie powinno obejmować swym zakresem także wytworów stworzonych bez bezpośredniej ingerencji człowieka.
[4] Zob. dyrektywę Parlamentu Europejskiego i Rady 96/9 z dnia 11 marca 1996 r. w sprawie ochrony baz danych.
[5] Zob. art. 7(1) dyrektywy 96/9.
[6] Zob. orzeczenie TSUE z dnia 9 listopada 2004 r., w sprawie Fixtures Marketing Ltd v Organismos prognostikon agonon podosfairou AE (OPAP), C-444/02.
[7] Zob. dyrektywę Parlamentu Europejskiego i Rady 2019/790 z dnia 17 kwietnia 2019 r. w sprawie prawa autorskiego i praw pokrewnych na jednolitym rynku cyfrowym oraz zmiany dyrektyw 96/9/WE i 2001/29/WE.