Encyclopaedia Britannica v. Perplexity AI: kolejny pozew przeciwko dostawcy modelu sztucznej inteligencji

W ciągu ostatnich kilku lat wniesiono już ponad 50 pozwów o naruszenia praw autorskich przez przedsiębiorstwa zajmujące się sztuczną inteligencją (ang. artificial intelligence, AI). Wśród powodów są między innymi: dziennikarze, artyści czy pisarze, którzy zarzucają firmom wykorzystanie materiałów objętych ochroną prawnoautorską – książek, zdjęć, artykułów prasowych, tekstów – do trenowania modeli AI bez ich zgody. Następnym podmiotem, który postanowił podjąć działania jest wydawca Encyclopaedia Britannica. W dniu 10 września 2025 r. firma zajmująca się AI – Perplexity AI została pozwana o naruszenia praw autorskich.

Strony postępowania

Perplexity to firma odpowiedzialna m.in. za innowacyjne narzędzie oparte na AI, które dostarcza zwięzłe oraz wyczerpujące odpowiedzi na pytania użytkowników, wraz z cytatami oraz źródłami. Rozwiązanie to oparte jest na architekturze RAG (skrót od ang. Retrieval Augmented Generation), połączeniu wyszukiwania, kontekstu i generowania, powodującym, że model AI może korzystać nie tylko z efektów wcześniejszego „treningu”, ale także ze zbieranych w czasie rzeczywistym, aktualnych (na moment wpisania polecenia) danych pochodzących z wiarygodnych źródeł. Jak informuje sama firma: „gdy użytkownik zadaje pytanie, Perplexity wykorzystuje zaawansowaną AI do przeszukania Internetu w czasie rzeczywistym, gromadząc informacje z najlepszych źródeł. Następnie przetwarza te informacje w jasne i zwięzłe podsumowanie, dostarczając dokładnie to, czego potrzebuje użytkownik, w łatwym do zrozumienia brzmieniu”.

Z kolei Encyclopaedia Britannica jest najstarszym i najbardziej renomowanym wydawnictwem encyklopedycznym na świecie.

Zarzuty

Jak wynika z pozwu, model AI stworzony przez firmę Perplexity przejmuje ruch na stronach powodów poprzez generowanie streszczeń tekstów należących do wydawnictwa. W przypadku tradycyjnych wyszukiwarek przyjmują one zapytania użytkowników i zwracają wyniki wyszukiwania, które wymagają od użytkowników przejścia do innych stron internetowych w celu uzyskania informacji odpowiadających na dane zapytanie. Oznacza to, że wyszukiwarki są pośrednikiem między użytkownikami poszukującymi informacji a wydawcami internetowymi, którzy te informacje dostarczają. Wyszukiwarki generują zatem kliknięcia użytkowników, którzy odwiedzają strony internetowe wydawców. Wydawcy internetowi, tacy właśnie jak powód, polegają na tych kliknięciach, aby sprzedawać subskrypcje użytkownikom, a także sprzedawać reklamy stronom trzecim. Natomiast tak zwana „wyszukiwarka odpowiedzi” (ang. answer engine) strony pozwanej eliminuje kliknięcia użytkowników na stronach internetowych wydawców, a tym samym pozbawia ich przychodów, generując odpowiedzi na zapytania użytkowników, które zastępują treści z innych stron internetowych. Jak podkreślono w pozwie, aby stworzyć model AI, firma Perplexity bez zezwolenia oraz wynagrodzenia dokonała masowego zwielokrotniania treści chronionych prawem autorskim należących do powodów i innych wydawców internetowych.

Naruszenie praw autorskich

Strona powodowa zarzuca firmie Perplexity naruszenie praw autorskich przynajmniej na trzy sposoby. Po pierwsze, pozwany naruszył prawa autorskie powodów na etapie selekcji treści, wykorzystując oprogramowanie o nazwie „PerplexityBot” do indeksowania oraz zwielokrotniania treści ze stron internetowych powodów na potrzeby „wyszukiwarki odpowiedzi” Perplexity.

Przyjęcie perspektywy Encyclopaedia Britannica dla przedsiębiorców wdrażających rozwiązania AI oznaczałoby konieczność prowadzenia przez nich szczegółowej ewidencji źródeł danych treningowych oraz podstawy ich legalnego wykorzystania (licencja, wyjątek prawnoautorski np. TDM). W praktyce więc już na etapie projektowania systemu AI istniałaby potrzeba wdrożenia procedury zgodności (tzw. compliance) w obszarze praw autorskich oraz stosowania przez te podmioty odpowiednich kontraktowych zabezpieczeń mających ma celu minimalizacje ryzyka naruszeń lub ich skutków (m.in. oświadczenia, indemnifikacja, prawo do audytu).

Po drugie, firma Perplexity – zdaniem Encyclopaedia Britannica – naruszyła prawa powodów także na etapie wprowadzania danych, zwielokrotniając bez podstawy prawnej artykuły objęte prawami autorskimi powodów, które odpowiadają wyszukiwaniom użytkowników.

Po trzecie, Perplexity naruszyło prawa autorskie powodów również na etapie generowania wyników, które są zasadniczo podobne do danych wejściowych. Wygenerowane odpowiedzi stanowią całkowite lub częściowe kopie artykułów objętych prawami autorskimi powodów. W innych jeszcze przypadkach wygenerowane odpowiedzi są przeredagowane na tekst, który przypomina, parafrazuje lub streszcza utwory objęte prawami autorskimi powodów.

W pozwie zawarto porównania między wynikami wygenerowanymi przez model AI a utworami strony powodowej. Przykładowo, gdy użytkownik wpisał polecenie (prompt): „jak w słowniku Merriam Webster zdefiniowano słowo plagiat?”. Perplexity wygenerowało dokładną definicję tego terminu ze słownika Merriam Webster. Poniżej zdjęcia znajdujące się w pozwie:


Rys. 1. Odpowiedź wygenerowana przez model AI.


Rys. 2. Definicja znajdująca się w słowniku Merriam Webster

Naruszenie prawa do znaków towarowych

Zdaniem Encyclopaedia Britannica, Perplexity naruszyło również prawo do znaków towarowych powodów. Model AI generuje czasami zmyślone treści lub halucynacje, które wyświetla obok znanych znaków towarowych powodów.

Gdyby uznać ten zarzut za uzasadniony, w celu uniknięcia ryzyka firmy z sektora IT rozwijające generatywne modele AI powinny uwzględniać i starać się ograniczać ryzyko naruszenia praw do znaków towarowych już w samej architekturze ofertowanych produktów. Mogłyby to uczynić m.in. poprzez odpowiednie filtrowanie treści pojawiających się w kontekście cudzych znaków towarowych, wyraźne oznaczanie charakteru tekstów towarzyszących znakom, a także – w celu konsekwentnego zmniejszania ryzyka i częstotliwości potencjalnych naruszeń – wdrożenie odpowiednich procedur szybkiego reagowania na zgłoszenia takich przypadków dokonywane przez uprawnionych.

Odpowiedź Perplexity

Firma technologiczna starała się odwrócić uwagę od krytyki dotyczącej naruszenia praw autorskich poprzez stworzenie „Programu dla wydawców”. Perplexity pokreśliło, że jednym z kluczowych elementów tego programu jest „podział przychodów”. Firma obiecała, że częścią swoich przychodów podzieli się z twórcami treści. Zaznaczyli oni także, że inne firmy technologiczne nie angażują się w podział przychodów. Jednak nie podali do wiadomości publicznej konkretnej kwoty przychodów, którą planują podzielić się z twórcami treści.

Komentarz strony powodowej

Jak wskazano w pozwie, w maju 2025 r. firma technologiczna skontaktowała się z powodami w celu omówienia potencjalnej współpracy. Strony odbyły wstępną rozmowę telefoniczną w dniu 9 maja 2025 r., podczas której Perplexity nie przekazało żadnych istotnych informacji dotyczących potencjalnej współpracy. Po wspomnianej rozmowie, Perplexity wielokrotnie zwracało się do strony powodowej o wynegocjowanie umowy o zachowaniu poufności przed podjęciem dalszych merytorycznych rozmów. Strona powodowa ostatecznie nie podpisała umowy o zachowaniu poufności ani nie zdecydowała się na rozpoczęcie współpracy.

Jorge Cauz dyrektor generalny w następujących słowach skomentował całą sprawę: „Perplexity twierdzi, że stworzyła pierwszy na świecie „silnik odpowiedzi”, ale odpowiedzi, które są dostarczane konsumentom, często pochodzą z Britannica. Jak pokazuje dzisiejsze działanie, podejmujemy wszelkie niezbędne kroki, aby chronić nasze dane i kapitał intelektualny, tak abyśmy mogli nadal oferować innowacyjne rozwiązania edukacyjne i informacyjne, które poprawią wyniki nauczania uczniów, pomagają nauczycielom w ich pracy dydaktycznej oraz dostarczają informacji i radości uczniom w każdym wieku”.

Podsumowanie

Branża wydawnicza, która od zawsze była mocno związana z tradycją, stoi teraz przed wielką zmianą, spowodowaną szybkim rozwojem AI.

Konsekwencje tego typu sporów wykraczają jednak poza branżę wydawniczą i dotyczą w równym stopniu (a może nawet bardziej) szeroko rozumianego sektora IT. Dostawcy modeli, integratorzy oraz użytkownicy biznesowi powinni liczyć się z rosnącym oczekiwaniem po stronie właścicieli treści stosowania przejrzystych modeli wynagradzania i mechanizmów kontroli wykorzystania ich utworów.

Pozew Encyclopaedia Britannica v. Perplexity AI idealnie potwierdza wyzwania, z którymi muszą się mierzyć wydawcy. Jednym z najważniejszych zadań obecnie jest stworzenie sprawiedliwych modeli wynagrodzeń dla twórców i wydawców, których treści są wykorzystywane do trenowania modeli AI. Ich celem jest zapewnienie autorom i wydawcom sprawiedliwego wynagrodzenia za kluczową rolę, jaką ich własność intelektualna odgrywa w rozwoju technologii AI, zapobiegając tym samym dewaluacji twórczości artystycznej. W praktyce może to oznaczać konieczność wprowadzania klauzul dotyczących wynagrodzenia za trening modeli, raportowania sposobu użycia materiałów oraz dostosowywania produktów AI do przyszłych standardów branżowych i regulacyjnych w zakresie zapłaty „godziwego wynagrodzenia” dla twórców.

Pozew Encyclopaedia Britannica v. Perplexity AI dostępny jest tutaj: https://www.courtlistener.com/docket/71313411/encyclopaedia-britannica-inc-v-perplexity-ai-inc/

Lista wniesionych pozwów przeciwko przedsiębiorstwom zajmującym się AI dostępna jest tutaj: https://chatgptiseatingtheworld.com/2024/08/27/master-list-of-lawsuits-v-ai-chatgpt-openai-microsoft-meta-midjourney-other-ai-cos/