Jak chronić twórców przed dozwolonym użytkiem w zakresie eksploracji tekstów i danych.
10 grudnia 2024 ZAiKS ogłosił na swojej stronie zaiks.org.pl/ai tzw. opt-out, tzn. zastrzeżenie wobec wszelkich działań związanych z eksploracją tekstów i danych (ang. Text and Data Mining – TDM), opierając się na przepisach zeszłorocznej nowelizacji prawa autorskiego. Zastrzeżenie to obejmuje utwory, do których prawa autorskie reprezentuje Stowarzyszenie, w zakresie w jakim stanowią one w całości lub części element dowolnego rodzaju rozpowszechnionych w internecie treści.
Celem tego działania jest ochrona praw twórców oraz przeciwdziałanie bezumownemu i nieodpłatnemu wykorzystywaniu ich utworów w procesach eksploracji TDM, wykorzystywanych np. do trenowania modeli generatywnej sztucznej inteligencji.
Jeśli powyższe zagadnienie wydaje się zawiłe, w poniższym artykule przybliżymy jego istotę oraz rolę, jaką TDM odgrywa w ochronie praw twórców.
CZYM JEST TDM?
TDM, czyli eksploracja tekstów i danych, to technika uczenia maszynowego, na której w ogromnym stopniu opiera się rozwój sztucznej inteligencji (AI). Nowelizacja ustawy o prawie autorskim i prawach pokrewnych z 2024 r. definiuje TDM jako analizę przeprowadzaną wyłącznie za pomocą zautomatyzowanych technik, służącą do przetwarzania tekstów i danych w postaci cyfrowej w celu wygenerowania określonych informacji, obejmujących w szczególności wzorce, tendencje i korelacje.
TDM pozwala algorytmom na samodzielne wykrywanie zależności w obrębie nawet bardzo dużych zbiorów rozdrobnionych danych.
Mechanizm ten jest wykorzystywany w wielu sektorach, od nauki i medycyny po przemysł kreatywny i marketing. Wykorzystanie TDM umożliwia lepsze zrozumienie trendów, optymalizację procesów oraz rozwój nowatorskich rozwiązań. Jednak wiąże się także z poważnymi wyzwaniami prawnymi, zwłaszcza w kontekście praw autorskich. W miarę jak narzędzia AI stają się coraz bardziej zaawansowane, rośnie potrzeba ich odpowiedniej regulacji, aby zapewnić równowagę pomiędzy innowacją technologiczną a ochroną twórców.
Zakres danych wykorzystywanych w TDM jest szeroki i obejmuje zarówno informacje statystyczne, jak i treści cyfrowe – w tym utwory chronione prawem autorskim. Narzędzia AI, korzystając z TDM, rozkładają treści na czynniki pierwsze, analizując ich strukturę i kompozycję. Na tej podstawie mogą generować nowe wytwory – teksty, obrazy, muzykę czy filmy – które mogą łudząco przypominać efekty pracy ludzkich twórców. W konsekwencji technologie te stają się alternatywnym źródłem podaży treści, stanowiąc konkurencję dla twórców w sektorze rozrywki, mediów czy sztuki.
DOZWOLONY UŻYTEK DLA TDM – JAKIE SĄ ZASADY?
W wyniku implementacji prawa unijnego do polskiego systemu prawnego, w art. 262 i 263 Ustawy o prawie autorskim i prawach pokrewnych wprowadzono dwa rodzaje wyjątków od prawa autorskiego w kontekście TDM:
1. Dozwolony użytek dla celów badawczych – obejmuje organizacje badawcze oraz instytucje dziedzictwa kulturowego, które mogą prowadzić eksplorację tekstów i danych na potrzeby nauki.
2. Dozwolony użytek dla pozostałych celów – pozwala wszystkim innym podmiotom, w tym prowadzącym działalność komercyjną, na wykorzystywanie TDM w dowolnym celu, w tym w procesie trenowania systemów AI.
Korzystanie z dozwolonego użytku w celach komercyjnych nie jest jednak nieograniczone. Właściciele praw autorskich mogą zastosować zastrzeżenie praw do wykorzystywania ich twórczości w ramach TDM. Jeśli autorzy nie zgłoszą takiego zastrzeżenia – zwanego powszechnie opt-outem, ich utwory będą mogły być zgodnie z prawem wykorzystywane na potrzeby eksploracji tekstów i danych bez konieczności uzyskiwania zgody twórców i odprowadzania na ich rzecz należnego wynagrodzenia.
Samego zastrzeżenia należy dokonać w formacie przeznaczonym do odczytu maszynowego. Jednakże brak jednoznacznych wytycznych w tym zakresie rodzi liczne wątpliwości interpretacyjne. Daje to firmom technologicznym możliwość podważania zgłoszonych opt-outów oraz uchylania się od obowiązku respektowania praw twórców. Dość powiedzieć, że od momentu uchwalenia Dyrektywy 2019/790 o prawie autorskim na jednolitym rynku cyfrowym, która nałożyła obowiązek wprowadzenia wyjątku dla TDM we wszystkich państwach UE, nadal nie udało się wypracować jednolitego standardu zastrzeżenia, który skutecznie chroniłby utwory przed ich wykorzystaniem w eksploracji danych. Obecnie z problemem tym zmagają się sądy państw UE, które stoją przed koniecznością interpretacji przepisów o dozwolonym użytku dla TDM. Przykładem jest wyrok sądu w Hamburgu z września 2024 r. w sprawie fotografa Philipa R. Kneschke przeciwko organizacji LAION, która udostępniła jego zdjęcie w zbiorze danych wykorzystywanych do trenowania AI, mimo że autor dokonał opt-outu wraz z publikacją fotografii. Sąd, choć orzekł na niekorzyść fotografa, uznał jednocześnie, że zastrzeżenie w formie „czytelnej maszynowo” ma być „zrozumiałe dla maszyn”, a przy obecnym stopniu zaawansowania algorytmów zapis dokonany w języku naturalnym, czyli po prostu tekst na stronie internetowej, jest wystarczający do skutecznej ochrony praw twórców. Dodatkowo sąd wskazał, że opt-out może być złożony w formie zbiorczego zastrzeżenia, obejmującego wszystkie utwory na stronie internetowej danego autora. Warto jednak pamiętać, że analiza sądu dotyczyła konkretnej sprawy i jej okoliczności, a sam wyrok nie jest jeszcze prawomocny, gdyż fotograf odwołał się od decyzji sądu. Wciąż więc brakuje ujednoliconego podejścia do kwestii opt-outu, co pozostawia twórców w niepewnej sytuacji prawnej.
Na marginesie warto zauważyć, że również same przepisy dotyczące dozwolonego użytku dla TDM budzą kontrowersje prawne. Podkreśla się, że w momencie projektowania i przyjmowania uchwalonej w 2019 r. Dyrektywy 2019/790 narzędzia generatywnej AI nie były jeszcze powszechnie dostępne. Obecnie jednak modele AI mogą przetwarzać polecenia lub zapytania użytkownika (prompty) i w odpowiedzi generować różnorodne treści – teksty, obrazy, muzykę – bazując na ogromnych zbiorach danych, na których zostały wytrenowane w oparciu m.in. o technikę TDM. W związku z tym pojawiają się pytania, czy uchwalone w tedy regulacje zapewniają twórcom odpowiedni poziom ochrony wobec możliwości współczesnej technologii informatycznej.

DLACZEGO OPT-OUT JEST KONIECZNY?
Niezależnie od powyższych wątpliwości, Stowarzyszenie Autorów ZAiKS stoi na stanowisku, że zgłoszenie zastrzeżenia praw wobec dozwolonego użytku dla TDM to kluczowy krok w ochronie praw twórców. Obecnie obowiązujące przepisy umożliwiają korzystanie z ich twórczości w ramach TDM bez konieczności uzyskiwania ich zgody. W efekcie utwory mogą być swobodnie wykorzystywane do trenowania systemów AI, które generują treści konkurencyjne wobec działalności twórczej człowieka. Brak opt-outu oznacza de facto zgodę na nieodpłatne wykorzystywanie utworów w celu „karmienia” technologii, które w dłuższej perspektywie mogą ograniczyć zapotrzebowanie na twórczość człowieka. Twórcy nie tylko tracą kontrolę nad sposobem wykorzystania swoich utworów, ale również pojawia się groźba obniżenia wartości ich pracy twórczej na rynku, który w coraz większym stopniu sięga po treści generowane przez AI.
Organizacje reprezentujące twórców na całym świecie – takie jak CISAC (Międzynarodowa Konfederacja Stowarzyszeń Autorów i Kompozytorów) – alarmują, że firmy z branży AI od lat bezumownie korzystają z chronionych treści do trenowania swoich modeli generatywnej sztucznej inteligencji. Modele te coraz lepiej naśladują styl i estetykę konkretnych artystów, co prowadzi do deprecjacji oryginalnej twórczości i zmniejsza dochody autorów. Z raportu zleconego przez CISAC wynika, że gwałtowny wzrost przychodów dostawców generatywnej AI w ciągu najbliższych pięciu lat idzie w parze z ryzykiem znaczącej utraty dochodów twórców z powodu wypierania dzieł ludzkich przez generowane przez AI substytuty. Szacuje się, że pomimo dostarczania istotnych zasobów kreatywnych dla rynku treści generowanych przez AI, do 2028 roku twórcy muzyki oraz utworów audiowizualnych mogą doświadczyć strat wynoszących odpowiednio 24% i 21% ich obecnych przychodów. Łącznie ma to oznaczać stratę rzędu 22 miliardów euro w ciągu pięciu lat (10 miliardów euro w branży muzycznej oraz 12 miliardów euro w sektorze audiowizualnym). W szczególności silnie dotknięte zostaną rynki streamingu i bibliotek muzycznych, gdzie prognozuje się, że do 2028 r. muzyka generowana przez AI będzie stanowić około 20% przychodów tradycyjnych platform streamingowych oraz aż 60% przychodów bibliotek muzycznych.
Podobne zagrożenie dotyczy twórców audiowizualnych. Najbardziej narażeni na straty są tłumacze oraz osoby zajmujące się dubbingiem i napisami, którzy mogą stracić nawet 56% swoich dochodów. Również scenarzyści i reżyserzy muszą liczyć się z konsekwencjami, gdyż AI może „skanibalizować” od 15% do 20% ich przychodów.
Wzrost roli generatywnej AI w przemyśle kreatywnym rodzi więc poważne pytania o przyszłość wynagrodzeń i ochrony praw twórców.
POZWY TWÓRCÓW PRZECIWKO FIRMOM AI
Dowodem rosnącego problemu są także liczne pozwy, które w ostatnich latach zaczęli składać twórcy przeciwko dostawcom modeli AI – zwłaszcza w Stanach Zjednoczonych. Przykładem jest pozew wniesiony przez grupę artystów przeciwko Stability AI, Midjourney i DeviantArt, zarzucający tym firmom nielegalne wykorzystywanie milionów obrazów do trenowania generatywnych systemów AI bez zgody autorów. Innym głośnym przypadkiem są liczne powództwa przeciwko OpenAI, w ramach których np. pisarze, tacy jak George R.R. Martin i John Grisham, zarzucają firmie naruszenie praw autorskich poprzez trenowanie ChatGPT na ich dziełach bez licencji.
W czerwcu 2024 roku największe wytwórnie muzyczne, takie jak Sony Music Entertainment, Universal Music Group i Warner Records, złożyły pozwy przeciwko startupom AI – Suno i Udio. Suno i Udio umożliwiają użytkownikom generowanie muzyki na podstawie tekstowych poleceń, co budzi kontrowersje w kontekście praw autorskich. Zarzuty wytwórni dotyczą bezprawnego wykorzystania chronionych prawem autorskim nagrań do trenowania modeli sztucznej inteligencji bez zgody i wynagrodzenia d la t wórców. Obie firmy argumentują, że ich technologie tworzą całkowicie nowe utwory, a nie kopiują istniejące, powołując się na obowiązującą w amerykańskim prawie autorskim zasadę dozwolonego użytku (fair use). Jednak wytwórnie muzyczne twierdzą, że kopiowanie i wykorzystywanie chronionych nagrań bez zgody narusza prawa autorskie na ogromną skalę. Zarzucają, że w przypadku Suno doszło do bezprawnego skopiowania 662 piosenek, a w przypadku Udio aż 1670. Wytwórnie domagają się odszkodowania w wysokości do 150 000 dolarów za każdy wykorzystany bezprawnie utwór oraz zakazu dalszego wykorzystywania ich muzyki przez te firmy.
W Europie analogiczne pozwy przeciwko dwóm dostawcom systemów generatywnej AI – OpenAI i Suno AI – wniosła pod koniec 2024 r. i na początku 2025 r. niemiecka organizacja zbiorowego zarządzania GEMA. Warto jednak podkreślić, że podjęciu takich działań sprzyjał fakt, że Niemcy wdrożyły przepisy dotyczące dozwolonego użytku dla TDM ponad trzy lata wcześniej niż Polska.
OPT-OUT – OCHRONA TWÓRCZOŚCI W DOBIE AI
Zgłoszenie opt-outu przez ZAiKS to działanie mające na celu ochronę praw autorskich i stworzenie warunków do uczciwego wynagradzania twórców. Jest to w tej chwili jedyna skuteczna forma obrony przed nieautoryzowanym wykorzystywaniem twórczości przez algorytmy dokonujące eksploracji tekstów i danych. Zastrzeżenie praw do celów TDM pozwala na kontrolę nad tym, kto i w jakim celu może w ten sposób korzystać z utworów, a także daje możliwość podjęcia negocjacji warunków licencyjnych z firmami rozwijającymi sztuczną inteligencję w oparciu o tę technikę.
Postęp technologiczny jest nieunikniony, ale nie może odbywać się kosztem twórców. Dlatego opt-out to nie tylko mechanizm obronny, ale także sposób na wypracowanie sprawiedliwych zasad współistnienia sztucznej inteligencji i ludzkiej kreatywności w cyfrowym świecie.