Loading

ChatGPT i RODO. Ochrona danych osobowych w systemie OpenAI.

Spis treści

Potrzebujesz doradcy?
Skontaktuj się z naszym ekspertem.

Artykuł powstał na bazie wystąpienia adw. Tomasza Sowy, LL.M. na konferencji AIUPMEETING w Toruniu. 

W ostatnim wpisie na naszym blogu omawialiśmy ryzyka prawne związane z wykorzystaniem narzędzi AI (w tym przede wszystkim ChatGPT) wynikające z wprowadzania różnych informacji do systemów sztucznej inteligencji . Mówiliśmy o tajemnicy przedsiębiorstwa, danych chronionych NDA i tajemnicach zawodowych w kontekście zasad korzystania z produktów od OpenAI (Zobacz TUTAJ). Dzisiaj, na chwilę po świętowaniu 7 rocznicy wejścia w życie RODO, omówimy problemy związane z przetwarzaniem danych osobowych za pomocą różnych gotowych systemów, ze szczególnym uwzględnieniem ChatGPT.  Artykuł nie stanowi kompleksowej analizy – omawiamy na blogowo podstawowe zagadnienia, które warto mieć na uwadze.

Wprowadzanie danych osobowych do systemu sztucznej inteligencji

Ryzyka prawne zależą przede wszystkim od tego w jaki sposób użytkownik korzysta z gotowych narzędzi AI (tj. co użytkownik wprowadza do systemu – np. ChatGPT). Użytkownik może prosić system o wygenerowanie odpowiedzi wyłącznie na podstawie ogólnego polecenia (np. podaj 10 najlepszych pomysłów na kolację w stylu włoskim), a może też wprowadzić do systemu rożne dane, które należy uznać za chronione. Zobacz nasz poprzedni wpis o ochronie informacji poufnych.  W tym wpisie skupimy się na ryzykach prawnych związanych z wprowadzaniem danych osobowych, jako że realizacja tego ryzyka może być dla przedsiębiorców bardzo kosztowna.  

Polecane: System AI lub model AI na licencji open source – jakie obowiązki prawne ma startup (i nie tylko) zgodnie z aktem o sztucznej inteligencji (AI Act)?

Dane osobowe - wprowadzenie

Warto pamiętać, że dane osobowe to nie tylko imię i nazwisko, PESEL, miejsce zamieszkania i podobne informacje, które zwykle kojarzą się z danymi osobowymi. Dane osobowe to wszelkie informacje o zidentyfikowanej lub możliwej do zidentyfikowania osobie fizycznej.

“dane osobowe” oznaczają wszelkie informacje o zidentyfikowanej lub możliwej do zidentyfikowania osobie fizycznej (“osobie, której dane dotyczą”); możliwa do zidentyfikowania osoba fizyczna to osoba, którą można bezpośrednio lub pośrednio zidentyfikować, w szczególności na podstawie identyfikatora takiego jak imię i nazwisko, numer identyfikacyjny, dane o lokalizacji, identyfikator internetowy lub jeden bądź kilka szczególnych czynników określających fizyczną, fizjologiczną, genetyczną, psychiczną, ekonomiczną, kulturową lub społeczną tożsamość osoby fizycznej.

Za dane osobowe uznamy więc także historię wyszukiwania w przeglądarce internetowej, preferencje zakupowe, zainteresowania treściami w mediach społecznościowych i inne.  Możemy zatem powiedzieć, że definicja danych osobowych jest bardzo szeroka. Ma to bardzo doniosłe znaczenie w kontekście treści, które wrzucamy do gotowych systemów AI. Dane osobowe przetwarzane za pomocą gotowych narzędzi AI muszą być przetwarzane zgodnie z Art. 5 RODO tak jak w przypadku każdego innego sposobu przetwarzania. Mając jednak na względzie, że są to systemy nowe, gdzie nie ma jeszcze wypracowanych jasnych wytycznych i gotowych rozwiązań ocena prawna nie należy do łatwych i z pewnością doczekamy się jeszcze wielu ciekawych interpretacji.

Przypomnijmy zatem naczelne zasady przetwarzania danych osobowych:

Dodajmy, że administrator musi być w stanie wykazać przestrzeganie tych zasad (rozliczalność).  

Ochrona danych osobowych w usługach OpenAI

Możemy teraz przejść do tego jak dane osobowe zachowują się w zderzeniu z warunkami korzystania z gotowych systemów AI. Doskonałym materiałem szkoleniowym są tu warunki korzystania z usług OpenAI (np. ChatGPT). Niniejszy tekst nie ma charakteru porady prawnej, ani nie zmierza do reklamowania lub krytykowania usług OpenAI. Cel tekstu ma wyłącznie charakter edukacyjny, jako że podobne rozwiązania do rozwiązań przyjętych w regulaminach OpenAI można znaleźć także w innych gotowych systemach.

Obecnie OpenAI oferuje 5 planów subskrypcyjnych. 3 dla użytkowników indywidualnych i 2 dla użytkowników biznesowych. To co jest istotne, to wykupienie licencji „PRO” nie czyni z licencjobiorcy użytkownika biznesowego. Ma to bardzo doniosłe konsekwencje.

OpenAI stawia sprawę bardzo jasno w odniesieniu do informacji (w tym także danych osobowych) wprowadzanych do systemu.

To użytkownik jest odpowiedzialny za to, czy przysługują mu wszystkie niezbędne prawa do tego, aby przetwarzać dane w systemach OpenAI.

You are responsible for Content, including ensuring that it does not violate any applicable law or these Terms. You represent and warrant that you have all rights, licenses, and permissions needed to provide Input to our Usługi

Użytkownik nie może korzystać z usług OpenAI w sposób, który w jakikolwiek sposób naruszałby prawa osób trzecich. Oznacza to, że użytkownik – w razie braku zapewnienia zgodności z przepisami o ochronie danych osobowych – nie tylko naruszy przepisy powszechnie obowiązującego prawa, ale także naruszy umowę, która łączy go z OpenAI. Może to prowadzić do wypowiedzenia mu umowy przez OpenAI (tj. zablokowania możliwości korzystania z usług OpenAI), a w niektórych przypadkach także do odpowiedzialności odszkodowawczej, ocenianej zgodnie z prawem stanu California.  Takie rozwiązania umowne można znaleźć w większości gotowych systemów AI.

Dostawca usługi - administrator czy podmiot przetwarzający?

Przechodząc do szczególnych rozwiązań – największe różnice w planach indywidualnych i biznesowych wynikają z roli dostawcy gotowego systemu (np. OpenAI) w łańcuchu przetwarzania danych osobowych.

Zgodnie z dokumentami prawnymi dla planów indywidualnych OpenAI jest administratorem danych osobowych, podczas gdy w przypadku planów biznesowych OpenAI jest podmiotem przetwarzającym dane osobowe.  Jakie są główne różnice?

Administrator danych osobowych to podmiot, który samodzielnie lub wspólnie z innymi ustala cele i sposoby przetwarzania danych osobowych.

  • Decyduje o celach przetwarzania danych
  • Decyduje o sposobach przetwarzania danych
  • Ponosi główną odpowiedzialność za zgodność z RODO
  • Realizuje prawa osób, których dane dotyczą

Podmiot przetwarzający to podmiot, który przetwarza dane osobowe w imieniu administratora, na podstawie umowy powierzenia przetwarzania.

  • Działa na polecenie administratora
  • Nie decyduje o celach przetwarzania
  • Wspiera administratora w realizacji obowiązków
  • Musi działać na podstawie umowy powierzenia (DPA)

O ile zatem w przypadku planów biznesowych to użytkownik-administrator określa cele przetwarzania danych osobowych w systemie, tak w przypadku planów indywidualnych to OpenAI narzuca użytkownikowi co zrobi z danymi wprowadzanymi do systemu i będzie je przetwarzać do realizacji własnych celów (np. trenowanie modeli – zob. niżej).

Istotne konsekwencje prawne

W planach indywidualnych użytkownik wprowadzając dane do systemu w istocie udostępnia te dane innemu administratorowi danych, który może mieć zupełne inne cele i sposoby przetwarzania danych osobowych niż użytkownik. To z kolei stwarza szereg ryzyk prawnych po stronie użytkownika-administratora, który za te dane odpowiada. Możemy tutaj wskazać na kluczowe ryzyka prawne:

  • nieuprawniona zmiana celu przetwarzania danych osobowych;
  • brak podstawy prawnej na udostępnienie danych;
  • brak przejrzystości – brak informacji o udostępnieniu danych;
  • przechowywane danych w formie umożliwiającej identyfikację osoby, której dane dotyczą, przez okres dłuższy, niż jest to niezbędne do celów, w  których dane te są przetwarzane;
  • naruszenie bezpieczeństwa danych osobowych;
  • naruszenie warunków korzystania z usług OpenAI;

Ryzyka te są szczególne aktualne w kontekście domyślnej zgody na wykorzystywanie danych użytkowników do szkolenia modeli OpenAI.

Zmiana celu przetwarzania danych osobowych

W przypadku korzystania z planów indywidualnych jest tak, że użytkownik domyślnie godzi się na to, aby OpenAI szkoliło swoje modele na wprowadzanych danych. Jeżeli użytkownik sobie tego nie życzy może wyrazić sprzeciw poprzez odpowiednie przesunięcie suwaka w ustawieniach konta. Przesunięcie suwaka na lewą stronę będzie oznaczało, że OpenAI nie będzie mogła wykorzystać wprowadzonych danych (w tym osobowych) do trenowania swoich modeli.

Z drugiej strony – domyślnie włączone ustawienia są takie, że jeżeli w planie indywidualnym wprowadzi się dane osobowe do systemu, to OpenAI zacznie ich używać do trenowania modeli, a przez to zmieni się cel przetwarzania danych (tj. np. z celu w postaci „niezbędne do wykonania umowy” dane zostaną udostępnione i wykorzystane do trenowania i rozwijania usług podmiotu trzeciego, co nie jest niezbędne do wykonania umowy pomiędzy administratorem-użytkownikiem a jego kontrahentem).

Czy przesunięcie suwaka wystarczy, aby przetwarzanie danych osobowych było zgodne z RODO? Niestety nie. Wyrażenie sprzeciwu usuwa główny problem związany z przetwarzaniem danych osobowych w systemie, ale nie usuwa wszystkich ryzyk. Sprzeciw dotyczy bowiem wykorzystania danych do trenowania modeli podczas gdy OpenAI zachowa dalej prawa do przetwarzania m.in. w celu zapobiegania oszustwom, do poprawiania i rozwoju swoich usług, nowych funkcji czy do researchu, w sposób, który nie polega na trenowaniu modeli. Polityka prywatności Open AI wskazuje nawet wprost, że:

Even if you’ve opted out of training, you can still choose to provide feedback to us about your interactions with our products (for instance, by selecting thumbs up or thumbs down on a model response). If you choose to provide feedback, the entire conversation associated with that feedback may be used to train our models.

Wynika stąd, że w dalszym ciągu udostępnienie OpenAI danych osobowych na planie indywidualnym będzie najprawdopodobniej skutkować nieuprawnioną zmianą celu przetwarzania danych osobowych, a w sytuacji gdy użytkownik przekaże jakikolwiek feedback związany z otrzymanym outputem to „odsprzeciwi się”  wykorzystywaniu danych na potrzeby treningu, które wprowadza do systemu w danej konwersacji.

Mając na uwadze powyższe wątpliwe jest, czy zmiana celu przetwarzania w tym kontekście znajdzie swoje uzasadnienie w art. 6 ust. 4 RODO. Użytkownik-administrator na planie indywidualnym nie powinien zatem z zasady wprowadzać do systemu żadnych danych osobowych osób trzecich i powinien mocno zastanowić się, czy wprowadzać tam swoje dane osobowe, jako że dane te będą przetwarzane w rozmaity sposób.

Brak podstawy prawnej na udostępnienie danych osobowych  

Użytkownik-administrator na planie indywidualnym OpenAI powinien być świadomy tego, że wprowadzając dane do systemu w istocie udostępnia dane innemu administratorowi. Udostępnienie danych osobowych innemu administratorowi danych osobowych wymaga natomiast podstawy prawnej (może być to każda z podstaw, o których mowa w art. 6 RODO). Możemy zatem udostępniać dane osobowe, jeżeli (przykładowo) mamy zgodę osoby, której dane dotyczą, prawnie uzasadniony interes, lub jest to niezbędne do wykonania umowy. Każdy przypadek wymaga osobnej analizy. Brak podstawy prawnej na udostępnienie będzie natomiast kwalifikowany jako naruszenie podstawowych przepisów RODO.

Zupełnie inaczej wygląda sytuacja w przypadku planów biznesowych gdzie OpenAI występuje w roli podmiotu przetwarzającego. W tej relacji OpenAI nie określa celów i sposobów przetwarzania danych osobowych, gdyż działa wyłącznie w imieniu i na polecenie użytkownika-administratora. Przekazanie danych osobowych odbywa się na podstawie umowy powierzenia przetwarzania zawartej pomiędzy użytkownikiem-administratorem a dostawcą usługi-procesorem. W takim przypadku zasady przetwarzania danych przez OpenAI określa umowa powierzenia przetwarzania i administrator nie musi szukać osobnej podstawy prawnej dla samego faktu przekazania danych podmiotu przetwarzającemu.  Ważne natomiast jest, że taka umowa nie jest zawierana automatycznie. Użytkownik-administrator musi zadbać o zawarcie takiej umowy i przejść proces jej podpisania w dedykowanej do tego aplikacji.

Zadbaj o informacje

Jeżeli już wprowadzamy dane osobowe do systemu, to osoba, której dane dotyczą powinna być o tym poinformowana. Osoba ta musi wiedzieć co dzieje się z jej danymi, aby móc realizować swoje prawa.  I tak, należy przekazać osobie której dane dotyczą m.in. informacje o odbiorcach danych osobowych lub o kategoriach odbiorców, jeżeli istnieją. Administrator powinien więc poinformować osobę, której dane dotyczą, że jej dane trafią do OpenAI, lub innego dostawcy gotowego systemu AI (np. Google LLC), a także przekazać inne informacje związane z przetwarzaniem, jak choćby to że dane trafią poza obszar EOG (zob. niżej) czy wskazać okres retencji danych. I tutaj też pojawiają się różnice pomiędzy planami indywidualnymi a planami biznesowymi. W przypadku użytkowników indywidualnych dane są przechowywane tak długo jak to konieczne dla świadczenia usług, lub realizacji innych prawnie uzasadnionych interesów. Można jednak wyłączyć (opt-out) historię czata, co spowoduje że w historii czata nie będą zapisywać się konwersacje, a OpenAI usunie te dane ze swoich serwerów po 30 dniach. W przypadku użytkowników biznesowych to administratorzy obszaru roboczego kontrolują, jak długo dane są przechowywane. Usunięte rozmowy są usuwane z systemów w ciągu 30 dni, chyba że istnieje prawny obowiązek ich przechowywania. Warto o tym pamiętać, dostosować ustawienia do własnych potrzeb i odpowiednio przygotować klauzule informacyjne. Brak podania wszystkich wymaganych informacji może skutkować nałożeniem sankcji na administratora danych osobowych.

Transfer poza EOG

Znaczna ilość kluczowych dostawców systemów AI (w tym także OpenAI) transferuje dane do USA. Transfer danych osobowych poza Europejski Obszar Gospodarczy (EOG), wiąże się natomiast ze szczególnymi obowiązkami prawnymi, jak np. dokonanie oceny skutku transferu danych osobowych. Dzieje się tak, ponieważ USA nie zawsze zapewniały odpowiedni poziom ochrony danych, porównywalny z tym w UE. Na dziś możliwe są tutaj dwie podstawy prawne w kontekście transferu, a to decyzja Komisji Europejskiej stwierdzająca odpowiedni stopień ochrony danych osobowych w USA (decyzja KE z 10 lipca 2023 r.), lub standardowe klauzule umowne (Standard Contractual Clauses – SCC). Użytkownik-administrator – niezależnie od tego, czy korzysta z planu indywidualnego czy biznesowego – musi ocenić, czy przekazanie danych do USA znajduje oparcie w jednej z tych podstaw zanim zacznie korzystać z systemu i zanim dane zostaną wytransferowane poza EOG.

OpenAI w planach biznesowych przekazuje dane do USA na podstawie SCC.

OpenAI Ireland Ltd. will process Customer Data provided by Customer that originates in the EEA or Switzerland. To the extent that OpenAI Ireland Ltd transfers Customer Data to other OpenAI affiliates in jurisdictions that do not provide the same level of data protection, it will do so on the basis of intra-group agreements that incorporate appropriate transfer mechanism provisions to protect Customer Data. Such mechanisms may include the Standard Contractual Clauses adopted by the EU Commission on June 4, 2021 (as may be amended, updated or replaced from time to time) (“EU SCCs”) or an adequacy decision issued by the European Commission under Article 45 GDPR.

Wydaje się, że w przypadku planów indywidualnych dane osobowe zostają na terenie EOG. Polityka prywatności dotycząca użytkowników z terenu EOG nie wspomina nic o transferze danych do USA. Zgodnie z przedstawioną informacją OpenAI nie może wysyłać danych do USA, chyba że robi to w formie zanonimizowanej.

Bezpieczeństwo danych osobowych

Na koniec – bezpieczeństwo. W przypadku planów indywidualnych obowiązują ogólne środki bezpieczeństwa, podczas gdy w przypadku planów biznesowych środki te są potwierdzone uzyskaniem certyfikatu z audytu SOC 2.  Wersje biznesowe oferują lepsze środki bezpieczeństwa, takie jak m.in. szyfrowanie danych zarówno w spoczynku, jak i podczas przesyłania, czego (jak się wydaje) brakuje w planach indywidualnych.

Ryzyko, jakie tutaj występuje dotyczy przede wszystkim możliwego wycieku danych z sytemu, ale nie tylko. W określonych sytuacjach samo wprowadzenie danych do systemu będzie mogło być uznane za naruszenie ochrony danych osobowych:

“naruszenie ochrony danych osobowych” oznacza naruszenie bezpieczeństwa prowadzące do przypadkowego lub niezgodnego z prawem zniszczenia, utracenia, zmodyfikowania, nieuprawnionego ujawnienia lub nieuprawnionego dostępu do danych osobowych przesyłanych, przechowywanych lub w inny sposób przetwarzanych;

Jakie są sankcje i jak minimalizować ryzyka?

Naruszenie przepisów o ochronie danych osobowych wiąże się z szeregiem poważnych sankcji, zarówno finansowych, jak i niefinansowych. Możemy tutaj wskazać na:

  1. Administracyjne kary pieniężne
  2. Inne środki naprawcze (np. czasowe, lub stałe ograniczenie przetwarzania)
  3. Odpowiedzialność cywilna
  4. Odpowiedzialność karna

Nie można też zapominać o kwestiach wizerunkowych i biznesowych.

Wprowadzenie gotowych systemów AI do przedsiębiorstwa niesie ze sobą liczne korzyści, ale także poważne ryzyka prawne. Świadomość tych zagrożeń oraz odpowiednia ich minimalizacja są kluczem do efektywnego i bezpiecznego wykorzystywania sztucznej inteligencji w biznesie. Dzięki odpowiedniemu przygotowaniu firmy mogą uniknąć potencjalnych problemów prawnych, jednocześnie korzystając z zaawansowanych technologii do dynamicznego rozwoju swojej działalności. Świadome wdrożenie AI wymaga kompleksowego podejścia, obejmującego analizę warunków korzystania z systemów, wdrożenie wewnętrznych polityk, regularne szkolenia dla pracowników oraz współpracę z ekspertami prawnymi specjalizującymi się w ochronie danych.