Wykorzystanie głosów do trenowania modelu text-to-speech – pozew przeciwko LOVO

16 maja 2024 r. do sądu federalnego USA (U. S. District Court – Southern District of New York) trafił pozew zbiorowy złożony w imieniu powodów, aktorów głosowych, których głos oraz tożsamość zostały zapożyczone przez firmę LOVO do stworzenia licznych produkcji lektorskich bez uprzedniej zgody lub odpowiedniego wynagrodzenia.

LOVO oferuje narzędzie AI text-to-speech (Genny) pozwalające na generowanie profesjonalnej jakości lektora w oparciu o określone kryteria. Subskrybenci mogą m. in. decydować o preferencji co do męskiego czy żeńskiego głosu, brzmiącego młodziej lub starzej, czy nawet uwzględnieniu akcentów regionalnych. Tak wygenerowany głos, według LOVO, ma w prosty sposób stanowić np. realistyczny głos lektora dla filmów jego klientów. Model trenowany jest na próbkach głosów aktorów głosowych.

Kilka lat temu, powód Paul Lehrman i powódka Linnea Sage poprzez stronę Fiverr (platforma online łącząca freelancerów z klientami poszukującymi usług cyfrowych i kreatywnych) otrzymali ofertę rejestracji ich głosów na cele tworzenia narracji głosowych.

  • Paul Lehrman otrzymał zapewnienie, że jego głos zostanie użyty wyłącznie na cele badawcze. Za pracę otrzymał 1200 USD. Dopiero po kilku latach powód dowiedział się, że osoba, która zaproponowała mu wykonanie narracji, była pracownikiem LOVO. Wygenerowany przez AI sklonowany głos aktora pojawił się jednak m. in. jako element filmiku na Youtube oraz w podkaście.
  • Linnea Sage została poinformowana, że jej nagranie zostanie użyte wyłączenie na cele testowe w procesie produkcji reklam radiowych. Nie zostanie jednak udostępnione publicznie i będzie wykorzystywane jedynie wewnętrznie. Za pracę otrzymała 400 USD. Powódka również nie wiedziała, że w sprawie nagrania skontaktował się z nią współzałożyciel LOVO. Jej głos został następnie m. in. wykorzystany i edytowany w materiałach promocyjnych LOVO.

Powodowie nie wyrazili zgody na wykorzystywanie ich głosów w ramach narzędzia zamieniającego tekst na mowę, ani za takie wykorzystanie nie otrzymali odpowiedniego wynagrodzenia.

Sprawa ta zwraca uwagę na kolejny aspekt wykorzystywania technologii AI i potencjalnych zagrożeń prawnych z niej wynikających, w tym przypadku w kontekście ochrony dóbr osobistych.

Treść pozwu dostępna jest pod linkiem: Lehrman v. LOVO class action complaint