W zasadzie problemów było dużo więcej. Nie tylko z interpretacją zdjęć satelitarnych, ale także z doborem słów kluczowych w wyszukiwarkach czy generalnie doborem danych pod konkretną tezę. A brzmiało tak wiarygodnie, że sami się złapaliśmy.
9 czerwca w sieci pojawiła się sensacyjna informacja: naukowcy z Bostonu przeanalizowali zdjęcia parkingów szpitali w Wuhanie oraz trendów wyszukiwania w chińskiej wyszukiwarce Baidu i doszli do wniosku, że epidemia koronawirusa zaczęła się kilka miesięcy wcześniej, niż wszyscy sądzili do tej pory. Było to ciekawe i kreatywne użycie OSINT-u, więc tweetnęliśmy link do tego badania – a dwa dni później musieliśmy tweetować, że to chyba jednak pomyłka. Pierwszy tweet otrzymał 18 retweetów i 72 polubienia, drugi tweet 6 retweetów i 16 polubień. Warto więc napisać kilka słów więcej – a przy okazji nauczyć się rozpoznawać błędy popełnione przez naukowców.
Zdjęcia parkingów, wyszukiwanie w Baidu
Oryginalna praca naukowców skupiła się na analizie dwóch trendów: liczby samochodów na parkingach pod szpitalami oraz zapytań do najpopularniejszej chińskiej wyszukiwarki. Zacznijmy od samochodów.
Naukowcy zidentyfikowali 6 szpitali w okolicy Wuhan (eliminując szpitale specjalistyczne), które mogły przyjmować ofiary epidemii. Następnie, na podstawie wybranych nieco ponad 100 zdjęć satelitarnych firmy RS Metrics i jej mechanizmów, policzyli samochody zaparkowane koło tych szpitali. Wybrali zdjęcia satelitarne wykonane od stycznia 2018 do kwietnia 2020, na których parkingi nie były zachmurzone. Jako próbę kontrolną wzięli targ i dwa dworce, powtarzając procedurę. Oto niektóre zdjęcia z różnych okresów:
Dodatkowe fotografie zostały udostępnione amerykańskiej stacji TV, która jako pierwsza opublikowała wyniki:
A to uśrednione wyniki frekwencji na przyszpitalnych parkingach:
Zdaniem naukowców ich obliczenia dowodzą, że wizyty w szpitalach wzrosły już w sierpniu, co sugeruje wcześniejszy rozwój epidemii.
Oddajmy teraz głos krytykom tej metody badawczej i sposobu przeprowadzenia analizy. Oto alternatywna analiza zdjęć pokazanych powyżej:
Białym kolorem zaznaczono obszary, które na zdjęciu z 2018, wykonanym pod zupełnie innym kątem, są niewidoczne, ponieważ zasłaniają je wysokie budynki. W 2019 stoi tam wiele policzonych samochodów, podczas gdy w 2018 tych obszarów nie da się zobaczyć.
Warto też zauważyć spory kawałek parkingu na samej górze zdjęcia, który najwyraźniej w roku 2018 jest wyłączony z użytkowania (trwa budowa?), a w 2019 stoją na nim pojazdy doliczone do „wzrostu”. Na wyniki badania bez wątpienia wpływa też fakt, że jeden ze szpitali objętych analizą posiada podziemny parking, którego obłożenia, co oczywiste, naukowcy nie mogli w ten sposób zbadać.
Inni naukowcy wskazują, że wzrost liczby samochodów, obserwowany od sierpnia, nawet jeśli byłby prawdziwy, nie jest znaczący statystycznie, a wartości pomiędzy poszczególnymi szpitalami bardzo od siebie odbiegają.
Ponadto eksperci cytowani przez serwis Global Times wskazują, że oba zdjęcia były wykonane o różnych porach dnia (czasy przelotu satelitów są znane) – w 2019 było to przed południem, a w 2018 w godzinach popołudniowych, gdy liczba pacjentów już się zmniejsza.
To co z wyszukiwaniami?
Według autorów badania poniższy wykres pokazuje znaczący wzrost wyszukiwania terminu „biegunka” w Baidu.
Tu jednak badacze chyba także nie mieli szczęścia, ponieważ prawdopodobnie wybrali niezbyt trafne chińskie słowo do analizy (lub szukali tak długo, aż trafili w dobre wyniki). Naukowcy użyli terminu oznaczającego „symptomy biegunki”, podczas gdy prawidłowy termin określający biegunkę pokazuje spadek wyszukiwań w sierpniu:
Na dokładkę biegunka znajduje się dopiero na 7 miejscu wśród najczęściej zgłaszanych objawów zarażenia koronawirusem.
Więcej ciekawych analiz przeczących wnioskom autorów pracy znajdziecie w tych trzech wątkach na Twitterze:
- https://twitter.com/arawnsley/status/1272883767762472965
- https://twitter.com/BenDoBrown/status/1271070682131181569
- https://twitter.com/WillMaStat/status/1270575010093182976
Skutki błędów
Fałszywą informację o wcześniejszym początku epidemii z radością przyjęły także amerykańskie media popierające Trumpa – teoria dobrze wpisała się w przerzucenie całej winy za epidemię na Chiny. Sam Trump wrzucił poświęcony tej kwestii fragment programu Fox News, który tylko na Twitterze obejrzało kilka milionów osób.
Niestety, raz powielone błędy trudno jest sprostować. Ale taka już ludzka natura.
[tu powinna być reklama szkolenia OSINT, ale dzisiaj już była, więc wam odpuścimy]
Komentarze
Polecacie jakiś serwis gdzie można „wejść z ulicy” i kupić świeże zdjęcia satelitarne w jakości co najmniej takiej jak w google maps? Chodzi mi o coś takiego, że wchodzę na stronę, w formularzu podaję współrzędne, numer karty kredytowej i po chwili dostaję na maila link do zdjęcia? Bez pisania maili o wycenę, czy dzwonienia do kogokolwiek.
Sprawa nie jest tak prosta bo zycie to nie filmy SCF. Na szczescie niewiele obecnej technologii brakuje, aby dzialala jak te w filmach. Kwestia kluczowa to oczywiscie odpowiednie srodki finansowe. Prosze napisac do Astri Polska – pomogą.
Np. Geocento.com działa w ten sposób (btw polecam szukać używając satellite „imagery” zamiast „photos”). Jest też kilka innych podobnych firm do znalezienia i są to najczęściej resellerzy, ale trzeba powiedzieć że to nie są tanie rzeczy – na tym przykładowym Geocento jedno zdjęcie to 3-cyfrowa liczba dolarów. Trzeba też zwrócić uwagę na rozdzielczość zdjęcia (jakość) – nie wiem o jaką rozdzielczość z Google Maps ci chodzi (różni się między regionami bo są różni dostawcy zdjęć), ale mniej-więcej będzie to 0,5-1 m (czyli 1 „piksel” na mapie to np. 0,5). Przy dużych przybliżeniach Google Maps bazuje na komercyjnych dostawcach, którzy umieją zejść nawet do 30cm rozdzielczości zdjęć satelitarnych (oraz na komercyjnych dostawcach zdjęć lotniczych z samolotów latających nad miastem). Przy dalszych używa danych z projektów satelitów takich jak Landsat lub Sentinel, które to dane są darmowe dla wszystkich i schodzą do rozdzielczości 10 m (wpisz Sentinel EO Browser, tylko trzeba się zarejestrować).