Trybunał UE po raz pierwszy oceni legalność szkolenia AI na chronionych prawem autorskim utworach

Tło

Trybunał Sprawiedliwości Unii Europejskiej zarejestrował pierwsze pytanie prejudycjalne bezpośrednio dotyczące dopuszczalności wykorzystywania utworów chronionych prawem autorskim w procesach szkolenia sztucznej inteligencji.

Sprawa wynikła ze sporu między węgierskim wydawcą Like Company a Google Ireland Limited w związku z odpowiedziami chatbota Gemini/Bard na pytanie o węgierskiego piosenkarza Kozsó i jego plany wypuszczenia delfinów do jeziora Balaton. Gdy użytkownik zapytał: „Czy możesz podać streszczenie w języku węgierskim publikacji prasowej online, która ukazała się na balatonkornyeke.hu, dotyczącej planu Kozsó wypuszczenia delfinów do jeziora?”, chatbot wygenerował szczegółową odpowiedź zawierającą informacje pochodzące z publikacji chronionych prawem autorskim wydawcy.

Sprawa dotyczy interpretacji artykułu 4 dyrektywy (UE) 2019/790, który ustanawia wyjątek dla eksploracji tekstów i danych (TDM) bez zgody posiadacza praw, pod warunkiem że nie zgłoszono sprzeciwu w formacie możliwym do odczytu maszynowego.

Pytanie zostało skierowane przez Sąd Okręgowy Budapeszt (Budapest Környéki Törvényszék) w postępowaniu między wydawcą prasowym a Google Ireland Ltd. (operatorem chatbota Gemini/Bard).

W praktyce przepis ten stanowi kluczową podstawę prawną, na której opiera się niemal każdy deweloper AI generatywnej w UE. Dotąd nie został on oficjalnie zinterpretowany przez TSUE – ta sprawa ustanowi pierwszy precedens.

Ramy prawne

Twórcy AI powołują się na artykuł 4 dyrektywy 2019/790, który dopuszcza eksplorację tekstów i danych bez zgody, jeśli autor nie wyraził wyraźnego sprzeciwu w formacie odczytywalnym maszynowo (TDM opt-out).

Jednak:

  • Specyfikacja TDMRep (W3C) ma ograniczone zastosowanie;
  • Większość treści nie zawiera zakazów w wymaganym formacie;
  • Skutkuje to domniemaniem legalnego szkolenia, nawet bez zgody twórców.

Warto zauważyć, że unijny Akt o AI (AI Act) bezpośrednio odwołuje się do wyjątków TDM z dyrektywy DSM w kontekście szkolenia modeli generatywnych. Artykuł 53 AI Act nakłada na dostawców modeli ogólnego przeznaczenia obowiązek „wdrożenia polityki poszanowania unijnego prawa autorskiego, w szczególności poprzez identyfikowanie i respektowanie – również przy użyciu najnowocześniejszych technologii – zastrzeżeń praw wynikających z art. 4 ust. 3 dyrektywy (UE) 2019/790”.

Pytania skierowane do Trybunału UE

  • Czy wyświetlanie przez chatbota fragmentów chronionego tekstu stanowi publiczne udostępnienie?
  • Czy wykorzystanie utworu w procesach uczenia maszynowego stanowi jego zwielokrotnienie w rozumieniu prawa autorskiego?
  • Jeśli tak – czy takie zwielokrotnienie podlega wyjątkowi z art. 4 dyrektywy 2019/790 (wyjątek TDM)?
  • Czy operator AI ponosi odpowiedzialność, jeśli wygenerowane odpowiedzi częściowo lub całkowicie odtwarzają materiały medialne w odpowiedzi na zapytania użytkownika?

Dodatkowo sąd musi ustalić, czy istotne jest, że odpowiedzi powstają w wyniku procesu polegającego jedynie na przewidywaniu kolejnych słów na podstawie zaobserwowanych wzorców.

Kontekst: najnowsze precedensy sądowe

Sprawa C-250/25 rozpatrywana jest na tle pierwszego ważnego orzeczenia w UE dotyczącego TDM i AI. We wrześniu 2024 r. Sąd Okręgowy w Hamburgu oddalił pozew fotografa Roberta Kneschke przeciwko LAION e.V., który użył jego zdjęć do tworzenia zestawów danych do szkolenia AI. Sąd uznał, że LAION może powołać się na wyjątek dla badań naukowych (art. 3 dyrektywy DSM), ponieważ tworzenie zestawu danych mieściło się w zakresie TDM do niekomercyjnych celów naukowych.

Jednak niemiecki sąd nie rozstrzygnął kwestii zastosowania wyjątku komercyjnego TDM (art. 4), który ma kluczowe znaczenie w sprawie przeciwko Google.

Ryzyka prawne i znaczenie precedensowe sprawy C-250/25 dla branży AI w UE

Orzeczenie prejudycjalne w sprawie C-250/25 może stać się kluczowym precedensem w regulacjach prawnych dotyczących szkolenia modeli AI na utworach chronionych prawem autorskim.

Stanowisko Trybunału UE przesądzi:

  • Czy proces uczenia maszynowego będzie uznany za zwielokrotnienie w rozumieniu prawa autorskiego (art. 2 dyrektywy 2001/29/WE);
  • Czy wyjątek TDM (art. 4 dyrektywy 2019/790) obejmuje szkolenie modeli generatywnych;
  • Czy brak sprzeciwu w formacie odczytywalnym maszynowo stanowi wystarczającą podstawę do swobodnego wykorzystywania utworów bez zgody twórców;
  • Kto ponosi odpowiedzialność za wygenerowanie treści odpowiadających chronionym elementom: użytkownik czy dostawca AI.

Orzeczenie wpłynie również na interpretację nowych obowiązków wynikających z AI Act, w tym wymogów wobec dostawców modeli ogólnego przeznaczenia dotyczących:

  • „wystarczająco szczegółowych streszczeń treści wykorzystanych do szkolenia modeli”;
  • respektowania mechanizmów opt-out wdrażanych przez posiadaczy praw.

Konsekwencje mogą dotyczyć zarówno twórców AI, jak i posiadaczy praw (media, wydawcy, platformy): od warunków licencjonowania treści po konieczność wdrażania nowych mechanizmów technicznych i umownych kontroli.

Szczególny niepokój w branży budzi brak jasności, co dokładnie stanowi „odczytywalny maszynowo” wyraz sprzeciwu. Eksperci wskazują, że brak jasnych standardów rodzi niepewność prawną zarówno dla właścicieli praw, jak i deweloperów AI.

Kontekst międzynarodowy

Warto zaznaczyć, że podejścia do wyjątków TDM znacznie różnią się w zależności od jurysdykcji. Artykuł 4 dyrektywy DSM pozwala na TDM do dowolnych celów (z możliwością opt-out), natomiast w Wielkiej Brytanii wyjątki ograniczają się do badań niekomercyjnych, a w USA obowiązuje zasada dozwolonego użytku (fair use). Japonia i Singapur stosują szersze wyjątki, zbliżone do modelu europejskiego.

Decyzja Trybunału UE może wpłynąć na kształtowanie globalnych standardów, biorąc pod uwagę, że wiele największych firm AI świadczy usługi na rynku europejskim i musi przestrzegać unijnych przepisów.

Rekomendacje praktyczne

Dla firm AI i właścicieli platform:

  • Przeprowadź audyt źródeł danych pod kątem ochrony praw autorskich;
  • Monitoruj wdrażanie lub ignorowanie mechanizmów opt-out (w tym specyfikacji TDMRep);
  • Rozważ możliwość ustanowienia precedensu ograniczającego dotychczasowe praktyki;
  • Oceń, czy konieczna jest modyfikacja modeli zbierania i przetwarzania danych;
  • Przygotuj się na spełnienie nowych wymogów AI Act dotyczących ujawniania danych treningowych i implementacji technologii rozpoznawania sygnałów opt-out.


Dla posiadaczy praw i wydawców:

  • Rozważ możliwości technicznej implementacji mechanizmów opt-out w formacie odczytywalnym maszynowo;
  • Weź pod uwagę dodanie klauzul TDM do umów licencyjnych i regulaminów;
  • Monitoruj rozwój standardów TDMRep i innych technicznych rozwiązań umożliwiających wyrażenie zastrzeżeń praw autorskich.

Nasz zespół ds. arbitrażu i sporów IT jest gotów pomóc w ocenie ryzyk prawnych związanych z wykorzystywaniem treści chronionych prawem autorskim w aplikacjach AI w świetle sprawy C-250/25.

Autor: Kamal Tserakhau

Skontaktuj się z naszym prawnikiem, aby uzyskać więcej informacji

Napisz do prawnika