Kilka miesięcy temu Facebook poinformował, że w końcu faktycznie skasował zdjęcia, które w ciągu lat jego działania usunęli użytkownicy. Postanowiliśmy zatem sprawdzić, które polskie serwisy kasują Wasze zdjęcia, a które tylko udają, że to robią.
Problem teoretycznie skasowanych, a w rzeczywistości ciągle przechowywanych zdjęć na Facebooku został opisany przez serwis Ars Technica w roku 2009. Prawdopodobnie jego źródłem jest sposób działania tzw. CDN (content delivery network), czyli systemów przechowywania dużych ilości danych na rozproszonych serwerach. Ze względu na niskie koszty przechowywania plików oraz często występujące replikowanie tych samych danych między rożnymi serwerami prościej było danych raz wrzuconych już nigdy nie usuwać. Po skasowaniu zdjęcia Facebook po prostu usuwał je z widoku galerii udając, że zdjęcia nie ma. Jeśli użytkownik zapamiętał ścieżkę do pliku, mógł go bez żadnych problemów ponownie wczytać. Mimo wielu artykułów i presji użytkowników, Facebookowi zajęło 3 lata wprowadzenie procesu faktycznie usuwającego pliki. Postanowiliśmy zatem sprawdzić, jak to wygląda w Polsce.
Przebieg eksperymentu
W pierwszym tygodniu lutego założyliśmy testowe konta w 9 polskich serwisach, umożliwiających użytkownikom umieszczanie własnych zdjęć w sieci. Wybraliśmy do tego eksperymentu w kolejności alfabetycznej: blip.pl, fmix.pl, fotka.pl, fotoforum.gazeta.pl, galeria.interia.pl, gg.pl, goldenline.pl, nk.pl oraz sympatia.pl. Na każde założone konto wrzuciliśmy po 5 losowych zdjęć (neutralnych światopoglądowo i nie naruszających regulaminów tych serwisów).
W drugim etapie naszego eksperymentu najpierw spisaliśmy linki bezpośrednio prowadzące do zdjęć umieszczonych na serwerach (we wszystkich rozmiarach, jeśli serwis oferował taką funkcjonalność), a następnie skasowaliśmy zdjęcia korzystając z funkcjonalności udostępnianej w serwisie. Potwierdziliśmy też, że zdjęcia zniknęły z naszych kont i profili.
Trzeci, najciekawszy etap, polegał na sprawdzeniu zebranych wcześniej linków do zdjęć. Testy ich dostępności przeprowadzaliśmy kilkukrotnie – pierwszy 24h po usunięciu zdjęć, drugi po kolejnych 48h, trzeci po tygodniu, czwarty po dwóch miesiącach i piąty raz po 9 miesiącach od usunięcia zdjęć. Wyniki tego testu publikujemy poniżej – nie wszystkie serwisy go zdały na piątkę.
Mistrzowie usuwania
Tylko 3 z 9 serwisów potrafiły w ciągu 24 godzin usunąć całkowicie pliki z serwera. Były to Nasza Klasa, GoldenLine oraz GG.pl. Gratulacje dla tych firm za skuteczne i szybko działające procedury.
Skuteczni, choć niezbyt szybcy
Do tej kategorii trafiły serwisy, które zdjęcia usunęły w ciągu tygodnia, jednak nie stało się to od razu. Blip po 24h usunął mniejsze wersje zdjęć, pozostawiając wersje o większej rozdzielczości. Te drugie były niedostępne dopiero w teście wykonanym 48h później. Podobnie wyglądało usuwanie zdjęć w serwisie FotoForum portalu Gazeta.pl – po 24h zdjęcia były jeszcze dostępne, ale zniknęły przed upływem 72h od ich usunięcia. W serwisie Galeria w Interia.pl zdjęcia znikały stopniowo – po 24h zniknęło ich 7 z 15, pozostałe dołączyły przed upływem 72h.
Nierychliwi
W tej kategorii mamy tylko jednego zawodnika. W serwisie Fotka.pl „usunięte” zdjęcia były ciągle dostępne po tygodniu od wykonania operacji. Zniknęły gdzieś między tygodniem a dwoma miesiącami od ich skasowania. Na plus należy policzyć serwisowi to, że zdjęcia w końcu usunął, chociaż czas, który zajęła ta operacja, wydaje się być dość długi.
Mamy Twoje zdjęcia i nie będziemy ich kasować
Okazuje się, że są w Polsce serwisy idące chlubnym tropem Facebooka i wychodzące z założenia, że taniej i prościej jest zdjęcia chować przed użytkownikiem, ale ich nie usuwać z serwerów. Jeden z nich to Sympatia należąca do Grupy Onet.pl. Wszystkie zdjęcia usunięte na początku lutego do tej pory są dostępne na serwerach Onetu. Drugim opornym jest serwis fmix.pl należący do o2 – z 5 zdjęć, każdego przechowywanego w 4 różnych rozmiarach, po dziewięciu miesiącach od „skasowania” usunął jedynie największe pliki, przechowując nadal na serwerach wersje pomniejszone.
Komentarze
Chciałem zwrócić uwagę, że ścieżka do zdjęcia (czyli adres url) często jest nie do zgadnięcia – zawiera np. 20znakowy hash fotki. Jeśli więc ktoś posiada url do zdjęcia to najprawdopodobniej dlatego, że kiedyś widział to zdjęcie. Filozoficzną więc wydawała mi się zawsze kwestia potrzeby „bardziejszego usunięcia” fotki niż po prostu usunięcia linków do niej prowadzących. Przecież link znają tylko osoby które już widziały to zdjęcie, a więc mogły zrobić sobie jego kopie (i nieswiadomie pewnie nawet zrobiły, bo przeglądarki cacheują zdjęcia), fotografie swojego monitora, czy po prostu zapamiętać co na nim było. Jak dla mnie z matematycznego punktu widzenia nie ma większej różnicy między fotką której nie ma, a fotką która jest, ale żeby ją zobaczyć trzeba zgadnąć 20literowy ciąg znaków. To jest tak nieprawdopodobne, że prościej zgadnąć hasło danej osoby, włamać jej się na konto i ukraść wszystkie fotki.
Odpowiemy prostym, rzeczywistym scenariuszem, który natchnął do napisania artykułu. Publiczna strona użytkownika Sympatii znalazła się w cache’u Googla. Użytkownik ten usunął część zdjęć, na stronie nie były już widoczne. W cache’u Googla były tylko miniaturki. Dzięki temu, że Onet kasuje zdjęcia dopiero po roku, można było obejrzeć pełne wersje zdjęć usuniętych przez użytkownika. To przykład, że możliwe jest uzyskanie dostępu do zdjęć, których nie widziało się wcześniej.
Słusznie.
Inny scenariusz to taki, że mogę zwyczajnie nie chcieć by jakaś firma i jej administratorzy nadal dysponowała moimi zdjęciami (choćby z powodu urazu do tej firmy, braku zaufania do jej pracowników, czy mych praw autorskich do tych fotek).
Nie mniej pytaniami jakie mi się nasuwają w kontekście przedstawionego przez Was scenariuszu są:
– Czy samo udostępnianie publicznie (bez logowania) do zindeksowania profili jest pomysłem dobrym czy złym? NK długo się nad tym zastanawiało i nadal zastanawia. Grupy postanowiono w końcu zindeksować by nie przegrywać tak sromotnie z fanpageami FB. Konta użytkowników wydają się być bardziej drażliwą kwestią.
– Czy samo cacheowanie przez Google (inne wyszukiwarki, czy webarchive) stron, które już nie istnieją długo dłużej niż to niezbędne jest praktyką dobrą czy zła. Pamiętajmy że crawlery _są_ w stanie przeglądać _cały_ (no poza nieskończonymi pętlami i generowanymi na życzenie w nieskończonych ilościach stronami) sensowny internet znacznie częściej niż invalidowany jest cache. Ewidentnie więc scacheowane strony trzymane są np. w Google dłużej niż naprawdę trzeba.
– Czy jeśli umieściłem coś jako publiczne choćby na sekundę w internecie, to mam prawo oczekiwać, że kiedykolwiek stanie się to ponownie prywatne? Czy definicja publiczności/prywatności ma w ogóle sens w wymiarze temporalnym? Jak dla mnie nie da się wrócić ze stanu „publicznego” do „prywatnego”, co właściwie te i inne przykłady doskonale ilustrują. Można z tym próbować walczyć zmieniając „prawa fizyki”, czyli np. domagając się innych regulacji, innych regulaminów, innych zasad, innych algorytmów cacheowania, innych algorytmów dystrybucji i autoryzacji. Ale można też pogodzić się z tym, że to walka z wiatrakami i zastanowić się jak zmienić swoje własne nawyki, ewentualnie kształtować i promować pewne rozwiązania w których do takich przykrych niespodzianek nie dochodzi. Żeby zilustrować o co mi chodzi podam taki przykład : nowo stworzony dokument na google docs domyślnie jest prywatny. Zanim zmienię go na publiczny jestem informowany co to dokładnie oznacza i jak z tego skorzystać. Inny przykład : zakładając konto na FB nie koniecznie jestem w klarowny sposób informowany, że moje konto będzie indeksowane, a sam często mało się zastanawiam przed wrzucaniem treści na to konto, bo nikt nie ma w interesie mi przypominać bym się opamiętał (oprócz mnie).
Bardzo rzeczowa dyskusja w komentarzach. Gratuluję. Świetne argumenty obu stron.
Ok. To mam pytanie o ile ktos tu wchodzi. Moja zona mnje zdradzala sprawa w toku wiem ze wysylala swoje fotki komu innemu czy jest jakakolwiek mozliwosc odnalezienia? Freenet dark cokolwiek nie mowie o hakerce bo to na bank dobry haker ogarnje.