Jak UE przez pomyłkę ujawniła ocenzurowane fragmenty umowy na dostawę szczepionek

dodał 30 stycznia 2021 o 09:11 w kategorii Wpadki  z tagami:
Jak UE przez pomyłkę ujawniła ocenzurowane fragmenty umowy na dostawę szczepionek

Cenzurowanie dokumentów publikowanych w sieci pełne jest pułapek i nietrudno o pomyłkę. Gdy UE ujawniła treść umowy z AstraZeneca, sporo fragmentów treści było zaciemnionych. Okazuje się jednak, że da się część zaciemnionych treści odzyskać.

Na początek obniżymy trochę wasze oczekiwania – w ocenzurowanych fragmentach nie ma żadnych przełomowych sensacji. Jest trochę warunków handlowych i dużo nudnych fragmentów – ale metoda odzyskiwania jest ciekawa, a treści możecie porównać sami.

Umowa fachowo zaciemniona

Wczoraj Unia Europejska opublikowała treść umowy z firmą AstraZeneca na dostawę szczepionek na COVID-19 w związku z konfliktem odnośnie terminów i skali dostaw. Umowa została zanonimizowana w wielu miejscach. Wygląda to tak:

Tekst został zaciemniony. Niestety próba jego odzyskania przez zaznaczenie i skopiowanie nie powiedzie się – tekst to de facto zbiór obrazów, więc typowa sztuczka nie zadziała.

Dokument umowy, który możecie obecnie pobrać z unijnej strony, został już poprawiony i nie zawiera błędu, o którym piszemy. Udało nam się jednak namierzyć oryginalny dokument, który został już usunięty. Możecie go pobrać z naszej strony. Jeśli chcecie się nim pobawić – spróbujcie, zanim przeczytacie kolejne paragrafy.

Zaciemnienie to nie wszystko

Jeśli spojrzycie na oryginalny dokument, to chociaż zawiera tekst, nie obrazki, także nie da się podejrzeć zaciemnionych fragmentów. Ale nie trzeba ich podglądać, ponieważ… dokument zawiera spis treści. Problem odkrył Gareth Corfield. Tak wygląda to w większości programów obsługujących wyświetlanie plików PDF.

Nagle okazuje się, że większość treści np. pkt 1.15 i jego podpunktów możemy przeczytać, ponieważ dokument zawiera spis treści, a spis treści zawiera po dokładnie 251 pierwszych znaków każdego nagłówka (w sumie to 254, ale ostatnie 3 są zamieniane na wielokropek). W ten oto sposób możemy poznać sporą część zaciemnionych obszarów.

Oczywiście ta technika nie pozwoli nam odkryć treści zaciemnionych w dalszych fragmentach niż obejmujących pierwsze 251 znaków – ale i tak jest to ciekawy sposób okrywania tego, co zakryte.

Jak już wspominaliśmy, sensacji raczej nie znajdziecie – ale np. możecie się dowiedzieć, że UE zgodziła się zapłacić 1/3 ceny z góry lub poznać inne warunki handlowe, które chciano ukryć przed oczami publiczności.

Ale mój program nie wyświetla całego spisu treści

Faktycznie, wiele programów nie pokazuje wszystkich 251 znaków. Ten problem da się oczywiście rozwiązać. My w tym celu użyjemy świetnego narzędzia do analizy plików PDF, MuPDF, a konkretnie jego wersji do używania w wierszu poleceń, mutool.

Przebieg operacji na Macu wyglądać będzie tak:

brew install mupdf-tools
mutool show AstraZeneca-original.pdf outline

Efektem będzie wygenerowanie pełnego spisu treści, który możemy zapisać do pliku tekstowego. Poniżej przykładowy fragment punktu 1.15, w całości zaciemnionego w dokumencie.

Jeśli komuś nie chce się eksperymentować samodzielnie, a chce podejrzeć zaciemnione fragmenty, to pełny zrzut spisu treści także można pobrać z naszego serwera.

Fajne sztuczki, chcę więcej

Jak skutecznie cenzurować dokumenty? Jak sprawdzać, czy ktoś inny skutecznie ocenzurował swoje dokumenty? Jakie metadane można znaleźć w dokumencie i jak ich nie zostawiać? Czy można nimi manipulować?

To wszystko znajdziecie w dedykowanym odcinku naszego kursu OSINT, który, chociaż w bólach, to ciągle powstaje i kiedyś na pewno ruszy. A jak mówimy, że kiedyś ruszy, to nie trzeba nam co roku przypominać!

Jeśli chcecie brać udział w jego prapremierze, wystarczy zapisać się na listę powiadomień.