A śledzi się was tak
Jeden z czołowych inżynierów Facebooka, Arturo Bejar, w rozmowie z Byronem Acohido przedstawił na łamach USA Today system śledzenia użytkowników fejsa. Tekst typowo wizerunkowy i mający za zadanie raczej rozładować napięcie oraz uspokoić sytuację po ostatnich sporach z Federalną Komisją Handlu, ale i tak warto przyjrzeć się najważniejszym wnioskom z niego płynącym (i traktować je jako wierzchołek góry lodowej – to moja prywatna rada).
Facebook nie śledzi wszystkich w taki sam sposób. Rzecznik Facebooka, Barry Schnitt, informuje, że serwis inaczej traktuje członków zalogowanych, niezalogowanych i użytkowników nie posiadających konta na Facebooku. Przed Open Graph niewiele jest już zatem możliwości ucieczki.
Po pojawieniu się na dowolnej stronie facebook.com witryna uruchamia mechanizm cookie w przeglądarce użytkownika. Jeśli zalogujesz się na swoje konto, „ciasteczka” są dwa; jeśli nie – tylko jedno (ale również z dwóch możliwych typów). Cookies działają jak swoista pluskwa i rejestrują w różnym poziomie szczegółowości wizytę na każdej stronie z dowolnym elementem Open Graphu (Facebook Connect, Like, itd.).
Bartek: Znacie ten materiał? W temacie tego wpisu...
Dopóki jest to zwykła statystyka, wszystko jest do przyjęcia – w ciastku ląduje czas i data odwiedzenia strony, tworzony jest harmonogram dobowy (i większych cykli) odwiedzin danej witryny. Źle jednak, że skrypt zapisuje także unikalne cechy klienta, w tym takie, które pozwalają na jednoznaczną identyfikację komputera użytkownika w sieci. I to jednak da się jeszcze przełknąć, wszak do jednoznacznej identyfikacji pojedynczego komputera wystarczą może dwie lub trzy zmienne.
Problem pojawia się w momencie, kiedy odwiedzamy te strony nie wylogowując się z Facebooka i pozostając aktywnym w jego systemie (a robi tak obecnie około 63% użytkowników i odsetek ten systematycznie rośnie) – w rekordach plików cookie lądują kolejno: nasze nazwisko, adres e-mail, dane znajomych oraz praktycznie większość danych, którymi dzielimy się w profilu. Mechanizm działa w ten sposób, że całość jest archiwizowana przez 90 dni na komputerze odbiorcy - wpisy starsze niż ten okres są lokalnie usuwane.
O ile sama technika trackowania użytkowników za pomocą cookie jest dość powszechna, o tyle skala i wrażliwość danych, które udostępniamy na fejsie plus skala całego serwisu rodzi poważne obawy już nie tyle o neutralność sieci, co o realne zagrożenie naszej prywatności. Schnitt odżegnuje się, że Facebook wykorzystuje te dane tylko w trzech celach: lepszym dostosowywaniu reklam (po obu stronach kanału komunikacyjnego w tym przypadku), zwiększanie użyteczności i UX po stronie frontendu oraz wzmacnianie prywatności poprzez wyszukiwanie luk. Już sama ta odpowiedź powinna nam nasunąć jeden konkretny wniosek: usunięcie plików cookie nie rozwiązuje problemu, gdyż mechanizm komunikuje się z serwisem-matką i zwraca jej dane – lokalnie są one zatem przechowywane „dla wygody użytkownika” oraz jako tzw. local storage i próba kontrolna.
Nie wierzę też w to, że z tych danych nie powstaje gdzieś w bebechach Facebooka mechanizm statystyk dużo głębszych niż te oficjalnie ujawniane. Dane o wyszukiwaniach, zapisy rozmów w czacie czy zapis nawyków przeglądania internetu można wykorzystać dla analiz wskazujących np. przynależność do konkretnej opcji politycznej (na bazie poglądów), przekonań religijnych, orientacji seksualnej (tak, branża porno też korzysta z OpenGraph), preferowanych zakupów, ulubionych produktów i usług czy… problemów zdrowownych. Nadmierna paranoja? Być może. Facebook co prawda (jeszcze) odżegnuje się od zmiany sposobu wykorzystywania tych danych, ale z drugiej strony złożył wniosek o patent na technologię, której elementem jest metoda korelująca reklamy i śledzenie danych po stronie użytkownika.
To już kolejna cegiełka w potrzebie standaryzacji zarządzania prywatnością w internecie. Świat powoli oswaja się z ideą Do not track, stąd np. częste wprowadzanie certyfikatów szyfrowania połączenia, jednak śledzenie użytkowników, nawet po SSL, to już zupełnie nowy temat. O tyle dobrze, że sprawą zajmuje się dość silnie i owocnie tak Krzemowa Dolina jak i administracja Stanów Zjednoczonych (w połączeniu z różnymi NGO-sami) oraz konsorcjum W3C – daje to jakąś szansę na poprawę sposobów ochrony prywatności w serwisach społecznościowych, a także szerzej w internecie, skręcających przecież w kierunku geolokalizacji, społecznościowego wartościowania treści czy elementów grywalizacji.
Smutne jest to, że w takim czy innym kształcie, ale będziemy musieli oswoić się z „odzieraniem” z prywatności przy korzystaniu z takich serwisów i ich mechanizmów – Facebook jest przecież tworem czystko komercyjnym i zarabia przede wszystkim na reklamach. Google zresztą podobnie – AdWords, AdSense, AdMob i wpływy z innych platform to teraz ile, 95% przychodów Google? Zatem sam proceder jest podobny – gdzie należy zatem szukać różnic i… realnych zagrożeń?
Facebook już kilka razy pokazał, że jest nieszczelny – tak sam w sobie jak i ad extra. Wczesne domyślne ustawienia prywatności pozwalały brać pełnymi garściami wszystkie dane użytkowników oprócz daty urodzenia, jeśli dobrze pamiętam – i to bez konieczności zakładania na FB konta! Skutkiem tego był słynny wyciek 1,7 GB danych użytkowników fejsa. Można uspokajać, że czasy takich wpadek minęły, że mamy zmianę polityki prywatności firmy, zmianę domyślnych ustawień, że mamy w końcu szyfrowane połączenie, możliwości dwustopniowej weryfikacji logowania itp. Na nic to jednak.
Fakt pierwszy: żaden mechanizm nie ochroni przez niebezpieczeństwem, może jedynie zminimalizować jego ryzyko – sam certyfikat SSL (czy przejście na OAuth 2.0) w kształcie, w którym obecnie korzysta z niego facebook, jest raczej kosmetyką wymuszoną m.in. przez Symantec niż realną ochroną. Fakt drugi: nawet Google (które, wierzcie mi, daleko wyżej ceni obecnie prywatność użytkownika i wartość jego danych) nie ma obecnie jakościowo takich wrażliwych i cennych danych jak Facebook (podawanych mu przez nas na tacy).