OpenAI stavlja na raspolaganje model za brisanje osobnih podataka

OpenAI stavlja na raspolaganje model za brisanje osobnih podataka📷 © Tech&Space
- ★8 kategorija osjetljivih podataka
- ★1,5 milijardi parametara
- ★Apache 2.0 licenca na GitHubu
OpenAI je iznenada otvorio vrata novom području privatnosti u AI, ali ne onakvom koje zvuči kao neka nova tajna tehnologija. Privacy Filter, otvorenog koda pod Apache 2.0 licencom, dolazi s impresivnim brojevima: 1,5 milijardi parametara, 128.000 tokena konteksta i mogućnošću obrade dužih dokumenata bez predstavnika u oblaku.
Ono što privlači pozornost je osam kategorija podataka koje model detektira – od imena i adresa do lozinki i brojeva kreditnih kartica. Za tvrtke koje obrađuju velike količine tekstualnih podataka, poput onih koji treniraju vlastite modele ili dijele podatke s trećim stranama, ovo nije samo tehnički trik već temelj za bolju usklađenost s propisima kao što su GDPR ili CCPA.
Model se izvršava lokalno, što znači da podaci ne napuštaju okruženje tvrtke – ključna prednost za one koji se boje curenja podataka u javni cloud.

Model koji briše podatke umjesto da ih prikriva📷 © Tech&Space
Model koji briše podatke umjesto da ih prikriva
Međutim, tu se nalazi i mala ironija. Dok OpenAI hvali performanse modela, dokumentacija ne nudi nikakve konkretne brojke o stopama lažnih pozitivnih ili negativnih rezultata.
Sve što imamo su obećanja o brzoj obradi i komercijalnoj upotrebi. I dok se većina medija usredotočila na tehničke specifikacije, malo tko je primijetio da ovaj potez može biti prvi korak ka stvarno etičkoj AI – ili pak samo marketinški potez koji prati trendove regulatorne usklađenosti.
Community već reagira: dio korisnika očekuje visoku preciznost, dok drugi sumnjaju u skalabilnost za višejezične tekstove. Za hrvatske poduzeća koja obrađuju podatke o građanima, ovaj alat može biti korak ka jednostavnijoj usklađenosti s lokalnim zakonima.
Ali treba li vjerovati da će jedan model riješiti sve probleme privatnosti?
Iako je ovo veliki korak naprijed, postoje još uvijek neka pitanja bez odgovora. Kako će se ova tehnologija razvijati u budućnosti i kako će se koristiti u praksi? Vrijeme će pokazati koliko će ova tehnologija biti korisna i koliko će se moći oslanjati na nju.