Wydawca The New York Times pozywa OpenAI i Microsoft

Wydawca amerykańskiego dziennika The New York Times (NYT) złożył pozew o naruszenie praw autorskich przeciwko OpenAI i Microsoft. Zdaniem NYT narzędzia sztucznej inteligencji należące do ww. firm, czyli odpowiednio ChatGPT i Bing Chat oparte na modelu GPT, były bezprawnie trenowane na materiałach przygotowywanych przez NYT.

NYT w pozwie wskazał, że przy trenowaniu GPT kopiowano miliony tekstów objętych ochroną prawnoautorską w tym m.in. artykuły, recenzje, poradniki, dziennikarskie śledztwa i inne. Pomimo korzystania z wielu innych źródeł do trenowania modeli, NYT wskazuje na szczególne zainteresowanie ich materiałami z uwagi na dużą wartość tych treści. Podjęto również próbę negocjacji z OpenAI i Microsoft w celu ustalenia takiego sposobu wykorzystania treści publikowanych przez NYT, który zagwarantowałby dziennikowi uczciwą cenę za nie. Pozwani stanęli jednak na stanowisku, że ich działanie mieści się w ochronie zapewnianej przez instytucję fair use.

NYT twierdzi też, że dochodzi do „zapamiętywania” treści przez GPT-4. W pozwie przedstawiono przykłady, które według NYT zestawiają oryginalną treść artykułów z wynikiem działania AI, niemal dosłownie powielającym pierwotny tekst. Wśród przykładów znalazły się także przypadki podania przez ChatGPT treści artykułu, który normalnie jest dostępny jedynie dla subskrybentów dziennika (za paywallem).

Ponadto, zdaniem NYT narzędzia AI przypisują dziennikowi treści, które w rzeczywistości nigdy nie zostały przez NYT opublikowane. Jak twierdzi NYT: „W żargonie AI nazywa się to halucynacją. Mówiąc wprost, jest to dezinformacja”. Bing Chat w odpowiedzi na zapytanie, w którym poproszono o wskazanie 15 najzdrowszych produktów żywnościowych dla serca, które pojawiły się w artykule NYT, wspomniał o kilkunastu produktach, o których w tekście nie było mowy. Z kolei ChatGPT, zapytany o wyszukanie artykułów NYT na temat pandemii COVID-19, podał zmyślone tytuły oraz linki, które sprawiały wrażenie, że zostały opublikowane przez NYT. Dziennik nigdy ich nie opublikował, a linki nie odsyłały do istniejącej strony internetowej.

Pełna treść pozwu: United States District Court Southern District of New York