Skarga Noyb przeciwko OpenAI – generowanie nieprawdziwych informacji przez ChatGPT

29 kwietnia 2024 r. Noyb poinformowała o złożeniu skargi przeciwko OpenAI do austriackiego organu ochrony danych (DSB). Skarga została złożona w imieniu skarżącego, który jest osobą publiczną, a której fałszywa data urodzenia została wygenerowana w odpowiedzi na input przez produkt OpenAI – duży model językowy (LLM) ChatGPT.

Skarżący jest osobą publiczną, a część informacji o nim jest dostępna online dla każdego – brak jest jednak daty urodzenia – w związku z czym, kiedy ChatGPT zostaje o nią zapytany, generuje nieprawdziwe informacje. Skarżący złożył do OpenAI wniosek o dostęp i usunięcie danych.

Odpowiedź OpenAI na wniosek o dostęp do danych – firma skupiła się na danych z konta użytkownika ChatGPT. Nie dostarczono żadnych informacji na temat przetwarzania danych przez LLM, np. takich, które zostały wykorzystane do szkolenia algorytmu.

Odpowiedź OpenAI na wniosek o usunięcie danych – stwierdzono, że nie ma sposobu, aby uniemożliwić swoim systemom wyświetlanie nieprawdziwej daty urodzenia skarżącego w output, jeżeli jakiś użytkownik poprosi o tę informację.

OpenAI wyjaśniła również, że posiada filtry umożliwiające zablokowanie wyświetlania danych osobowych osób, które o to poproszą, ale niemożliwe jest zablokowanie daty urodzenia osoby, bez wpływu na inne informacje, które ChatGPT wyświetlałby o niej. Innymi słowy, funkcja blokowania musiałaby obejmować wszystkie żądania tego typu lub podobne. Dalej wskazała, że skarżący jest osobą publiczna, a zatem ograniczenie w informacjach dostarczanych przez ChatGPT na jego temat naruszałoby wolność OpenAI do informowania oraz prawo ogółu do bycia informowanym.

Noyb w skardze argumentuje, że OpenAI wydaje się nie mieć możliwości faktycznej korekty fałszywych informacji. Może jedynie je ukryć na ostatnim etapie przetwarzania, w output. Ponadto, nawet jeśli wszystkie dane zostałyby zablokowane, fałszywe informacje wciąż byłyby obecne w systemie – nie byłyby natomiast wyświetlane użytkownikom.

W takim stanie faktycznym, zarzucono OpenAI naruszenie:

  • Prawa skarżącego do dostępu do danych – administrator danych nie udzielił pełnej odpowiedzi na wniosek osoby, której dane dotyczą, a tym samym naruszył art. 12 ust. 3 i art. 15 RODO.
    Skarżący nie otrzymał żadnych informacji na temat tego, jakie dane jego dot. przetwarza OpenAI w celu zasilania ChatGPT, skąd pochodzą te dane, jaka może być podstawa prawna, jak długo ChatGPT planuje je przechowywać ani komu udostępnił te (fałszywe) informacje.
  • Zobowiązanie administratora do przestrzegania zasady prawidłowości – art. 5 ust. 1 lit. d RODO.
    Brak technicznej możliwości usunięcia lub sprostowania daty urodzenia skarżącego bez zablokowania innych istotnych informacji, nie jest uzasadnieniem dla odstąpienia od zasady prawidłowości. Tak długo, jak ChatGPT pokazuje fałszywe informacje skarżącego, narusza art. 5 ust. 1 lit. d RODO.

Pełna treść skargi dostępna pod linkiem: noyb Case C-078