Pierwszy pozew o kradzież głosu polskiego lektora przy wykorzystaniu AI
W dniu 21 listopada 2025 r. do Sądu Okręgowego w Warszawie wpłynął pozew przeciwko przedsiębiorstwu z branży wodno-ściekowej. Jak wynika z dostępnych źródeł, wspomniana spółka wykorzystała w swoich reklamach głos znanego polskiego lektora – Jarosława Łukomskiego bez jego zgody, czy jakiekolwiek wynagrodzenia. Spoty reklamowe stworzono przy wykorzystaniu modeli AI. To pierwsza tego typu sprawa sądowa w Polsce.
Obecnie w świecie nowoczesnych technologii, klonowanie głosu (ang. voice cloning) przy użyciu AI staje się coraz bardziej popularne. Jest to zaawansowany proces technologiczny, w którym wykorzystuje się algorytmy AI i uczenia maszynowego do stworzenia cyfrowej kopii ludzkiego głosu. Najpopularniejsze modele AI do klonowania głosu to np.: ElevenLabs, Murf AI czy Speechify.
Kradzież głosu w Stanach Zjednoczonych
Zanim przyjrzymy się sprawie w Polsce, warto zauważyć, że podobne sytuacje miały już miejsce w Stanach Zjednoczonych. W maju 2024 r. głośno było o wykorzystaniu głosu amerykańskiej aktorki – Scarlett Johansson. OpenAI użyło „pobodnego” głosu do jej do chatbota GPT-4o. Jak tłumaczyła aktorka w oświadczeniu, otrzymała ofertę od Sama Altmana, aby udzieliła swojego głosu dla systemu AI. Jednak po długich namysłach aktorka postanowiła podziękować za propozycję. Kilka miesięcy później jej rodzina, znajomi oraz ogół społeczeństwa zauważyli, jak system AI o nazwie „Sky” brzmiał jak ona. OpenAI zaprzeczyło twierdzeniom, że głos „Sky” był imitacją głosu Scarlett Johansson. Firma poinformowała także, że do nagrań zatrudniła profesjonalnego aktora, lecz ze względów prywatności nie udostępni jego nazwiska. W wyniku tych działań Johansson zatrudniła prawnika, który skontaktował się Samem Altmanem oraz OpenAI, prosząc o szczegółowe wyjaśnienie procesu tworzenia głosu do modelu AI. W rezultacie OpenAI usunąło głos „Sky”.
Z kolei w lipcu 2025 r. aktorzy głosowi Paul Lehrman i Linnea Sage odnieśli zwycięstwo (sprawa Paul Lehrman et al. v. Lovo, Inc.), gdyż sąd orzekł, że powodowie mogą wystąpić przeciwko firmie Lovo za bezprawne klonowanie i czerpanie zysków ze sprzedaży głosów aktorów. W pozwie zawarto szczegółowy opis tego, w jaki sposób model AI umożliwił milionom klientów zwielokrotnianie głosów aktorów bez ich zgody i bez odpowiedniego wynagrodzenia, a następnie wykorzystywanie tych głosów w filmach, reklamach czy podcastach.
Pierwszy pozew w Polsce
Firma Mikrofonika, założyciel serwisu VO+AI, złożyła pierwszy w Polsce pozew o kradzież głosu przy użyciu technologii AI. Mikrofonika, zgodnie z umowami zawartymi z lektorami projektu VO+AI zobowiązała się reagować na wszelkie naruszenia praw lektorów, które powstaną za pomocą AI.
Firma z branży wodno-ściekowej wykorzystała w swoich reklamach jeden z najbardziej charakterystycznych głosów w Polsce. W całej sytuacji nie byłoby nic kontrowersyjnego, gdyby nie to, że zamiast zatrudnić Jarosława Łukomskiego do nagrań, zdecydowano się na wygenerowanie jego głosu za pomocą technologii AI. Jak wynika z dostępnych informacji pozwana spółka nie wyraziła zainteresowania zawarciem ugody.
Jarosław Łukomski jest znanym polskim lektorem. Udzielił swojego głosu do takich produkcji jak: „Skazani na Shawshank”, „Milczenie owiec” czy „Simpsonowie”. Sam lektor skomentował całą sprawę w następujący sposób: „Nie jestem zaskoczony… raczej rozczarowany. I zły. Rozmawialiśmy o tym wiele razy, wszyscy wiedzieliśmy, że to może spotkać każdego z nas. Ale i tak jest to pewnego rodzaju szok. Dziwne i nieprzyjemne uczucie. No i oczywiście złość, bo w końcu ktoś wykorzystał kawałek ciebie”.
Potencjalne naruszenie przepisów
Należy zaznaczyć, że ochrona głosu nie została w pełni uregulowana w polskich przepisach prawa. Problem ten można rozpatrywać na gruncie ustawy o prawie autorskim i prawach pokrewnych (pr. aut.) albo na podstawie kodeksu cywilnego (k.c.).
Głos osoby fizycznej stanowi element jej wizerunku. Zatem zgodnie z art. 81 ust. 1 pr. aut. rozpowszechnianie wizerunku wymaga zezwolenia osoby na nim przedstawionej. W braku wyraźnego zastrzeżenia zezwolenie nie jest wymagane, jeżeli osoba ta otrzymała umówioną zapłatę za pozowanie. Zgodnie z wyrokiem SN z 3.10.2007 r., II CSK 207/07:
„W doktrynie przyjmuje się też, że przez wizerunek rozumie się takie cechy twarzy i całej postaci danej osoby fizycznej, a także jej głos, które pozwalają zidentyfikować tę osobę jako określoną jednostkę fizyczną. Mimo wyrażanych w doktrynie wątpliwości co do kwalifikacji prawa do wizerunku jako prawa osobistego z uwagi na to, że naruszenie tego prawa krzyżuje się z naruszeniem innego dobra (czci, godności, prywatności), to nie ulega wątpliwości, że głosu nie należy traktować jako odrębnego dobra osobistego. Powinien on być chroniony w ramach prawa do wizerunku, stanowi bowiem jego element nie jako obraz fizyczny (wizualny) danej osoby, lecz jako jej obraz odbierany za pomocą słuchu. Prawo osobiste do ludzkiego głosu należy traktować jako dźwięczny wizerunek, jednak pod warunkiem, że jest rozpoznawalny dla osób trzecich. Oznacza to, że głos danej osoby musi być na tyle charakterystyczny i wyróżniający się, by można było wskazać konkretną osobę, od której pochodzi.”.
Głos może także stanowić odrębne od wizerunku dobro osobiste chronione na podstawie art. 23 i 24 k.c. Zgodnie z wyrokiem SA w Gdańsku z 21.06.1991 r. „Ochroną z art. 23 k.c. objęty jest nie tylko przykładowo wymieniony w tym przepisie wizerunek człowieka ale także emitowany np. w telewizji jego głos.”.
Należy pamiętać, że podstawowym kryterium uznania głosu za dobro osobiste, podobnie jak w przypadku wizerunku, jest jego rozpoznawalność. Nie oznacza to jednak konieczności identyfikacji głosu z konkretną osobą znaną z imienia i nazwiska, lecz wystarczające jest, aby można było odróżnić jej charakterystyczny głos od głosu innych osób.
Omawiana sprawa wiążę się także z potencjalnym ryzykiem prawnym na gruncie rozporządzenia Parlamentu Europejskiego i Rady (UE) 2016/679 z dnia 27 kwietnia 2016 r. (RODO). Zgodnie z art. 4 pkt 1 dane osobowe „oznaczają wszelkie informacje o zidentyfikowanej lub możliwej do zidentyfikowania osobie fizycznej („osobie, której dane dotyczą”); możliwa do zidentyfikowania osoba fizyczna to osoba, którą można bezpośrednio lub pośrednio zidentyfikować, w szczególności na podstawie identyfikatora takiego jak imię i nazwisko, numer identyfikacyjny, dane o lokalizacji, identyfikator internetowy lub jeden bądź kilka szczególnych czynników określających fizyczną, fizjologiczną, genetyczną, psychiczną, ekonomiczną, kulturową lub społeczną tożsamość osoby fizycznej;”.
Za daną osobową w rozumieniu rozporządzenia RODO należy również uznać głos człowieka.
Podsumowanie
Technologia klonowania głosu przez AI stwarza ekscytujące możliwości i rodzi poważne wątpliwości prawne i etyczne. Przykładem pozytywnego wdrożenia możliwości AI jest wykorzystanie technologii klonowania głosu w filmie „Top Gun: Maverick” z 2022 r., aby pomóc Valowi Kilmerowi, który borykał się z utratą głosu spowodowaną przez raka gardła.
Jednak opisana sytuacja kradzieży głosu Jarosława Łukomskiego potwierdza, że problem nielegalnego wykorzystania AI staje się coraz poważniejszy. Bez jakichkolwiek wątpliwości proces ten będzie miał ogromne znaczenie dla całego rynku branży kreatywnej w Polsce.
Oświadczenie dotyczące złożenia pozwu przez firmę Mikrofonika dostępne jest tutaj: https://voplusai.com/2025/11/21/jest-pierwszy-w-polsce-pozew-o-kradziez-glosu/
Więcej na temat wykorzystania głosu Scarlett Johansson dostępne jest tutaj: https://www.nbcnews.com/tech/tech-news/scarlett-johansson-shocked-angered-openai-voice-rcna153180
Pozew Paul Lehrman et al. v. Lovo, Inc. dostępny jest tutaj: https://chatgptiseatingtheworld.com/wp-content/uploads/2024/09/Lehrman-v-Lovo-FIRST-AM-COMPLAINT.pdf
Orzeczenie Paul Lehrman et al. v. Lovo, Inc. dostępne jest tutaj: https://static.pollockcohen.com/docs/Lovo%20Opinion%20July%2010%2C%202025.pdf