Hasła ponad 10 milionów polskich kont email dostępne do pobrania w sieci

dodał 17 grudnia 2017 o 00:46 w kategorii Prywatność, Włamania  z tagami:
Hasła ponad 10 milionów polskich kont email dostępne do pobrania w sieci

W ujawnionej niedawno ogromnej bazie danych zawierającej ok. 1,4 miliarda adresów email i haseł można znaleźć ponad 10 milionów kont z polskimi adresami. Poniżej przyglądamy się bliżej tej bazie i poddajemy ją małej analizie.

Kilka dni temu świat bezpieczeństwa obiegła wiadomość o odkryciu bazy danych zawierającej 1,4 miliarda kont poczty elektronicznej z hasłami zapisanymi jawnym tekstem. Dzięki współpracy z badaczami pragnącymi zachować anonimowość ustaliliśmy, że w bazie tej znajduje się ponad 10 milionów kont w domenie .PL i otrzymaliśmy wyniki ich analizy.

Skąd te dane

Omawiana baza zawiera połączony zbiór kilkuset wycieków danych, zarówno wcześniej znanych jak i nieznanych. Różni się jednak od danych dostępnych do tej pory tym, że dane zamieszczono w jednym zbiorze oraz tym, że złamano hasła przypisane do poszczególnych adresów email. Oznacza to, że każdy z 1,4 mld adresów email w bazie połączony jest z jawnie zapisanym hasłem. Dane w większości mają już swoje lata – jednak w wielu przypadkach nadal mogą być aktualne.

W bazie prawdopodobnie znajduje się dużo więcej niż 10 milionów polskich kont – wielu rodaków korzysta ze skrzynek w innych domenach niż .PL, jednak nie da się w łatwy sposób ich w bazie znaleźć i policzyć. Z tego powodu wszystkie przedstawione poniżej statystyki będą dotyczyły wyłącznie adresów email w domenie .PL.

Rzut oka na statystyki

Wszystkich par email:hasło w domenie .PL w bazie znaleźć można 13 215 257. Unikatowych adresów email znaleźć można 10 496 798. Oznacza to, że dla ok. 2,7 miliona kont w bazie znajduje się więcej niż 1 hasło. Może się zatem zdarzyć, że w bazie znajdzie się kilka Waszych starych haseł w różnych wariantach, co może pomóc włamywaczom odgadnąć wg jakiego wzoru swoje hasła tworzycie.

Lista 50 najpopularniejszych domen w bazie:

3034561 wp.pl
 2917637 interia.pl
 1482686 o2.pl
 688295 op.pl
 336581 tlen.pl
 311673 vp.pl
 250536 poczta.onet.pl
 202273 onet.pl
 175936 buziaczek.pl
 82320 gazeta.pl
 71816 amorki.pl
 57315 autograf.pl
 46890 yahoo.pl
 44463 go2.pl
 38252 neostrada.pl
 32810 email.pl
 16750 pw.pl
 15462 spoko.pl
 14835 poczta.pl
 10537 prokonto.pl
 10307 orange.pl
 9518 gg.pl
 8403 o.pl
 8038 02.pl
 7938 poczta.onetpl
 5832 tenbit.pl
 5115 gmail.pl
 4976 onet.com.pl
 4731 plusnet.pl
 4528 vip.onet.pl
 4471 fotka.pl
 3810 post.pl
 3797 g.pl
 3433 chello.pl
 3421 10g.pl
 3296 inmail.pl
 2922 koszmail.pl
 2800 aster.pl
 2798 republika.pl
 2732 opoczta.pl
 2717 aol.pl
 2596 pino.pl
 2517 toya.net.pl
 2413 os.pl
 2408 epf.pl
 2333 poczta.wp.pl
 2180 znajomi.pl
 2051 konto.pl
 1583 hot.pl
 1483 telekomunikacja.pl

Nie ma tutaj żadnego zaskoczenia – w większości analogicznych zbiorów wyniki są podobne. Dużo ciekawsze są jednak hasła – wg naszej wiedzy do tej pory nie udostępniono tak obszernych statystyk prawdziwych polskich haseł.

Oto lista najpopularniejszych 100 haseł na podstawie wszystkich 13,2 milionów rekordów.

46818 123456
 16682 qwerty
 13093 123456789
 10138 12345
 10113 zaq12wsx
 6538 polska
 6220 111111
 5774 1234
 5182 misiek
 4776 monika
 4418 marcin
 4369 12345678
 4240 mateusz
 4108 123qwe
 4086 123
 4073 1234567
 3933 123123
 3874 1234567890
 3850 qwerty1
 3620 karolina
 3563 agnieszka
 3450 bartek
 3366 polska1
 3351 password
 3348 qwe123
 3343 damian
 3266 1qaz2wsx
 3227 michal
 3025 samsung
 3024 qwerty123
 3020 zxcvbnm
 3000 kacper
 2920 maciek
 2896 kasia
 2885 kochanie
 2841 qwertyuiop
 2816 lol123
 2772 myszka
 2696 kasia1
 2683 666666
 2621 qazwsx
 2615 natalia
 2589 000000
 2583 lukasz
 2519 piotrek
 2516 dupa
 2489 daniel
 2389 madzia
 2383 1q2w3e
 2366 1q2w3e4r
 2327 misiaczek
 2323 patryk
 2241 komputer
 2236 dragon
 2217 haslo1
 2213 adrian
 2208 abc123
 2177 matrix
 2173 mateusz1
 2147 kochamcie
 2128 niunia
 2103 1qazxsw2
 2091 123321
 2077 dupa123
 2027 aaaaaa
 1993 haslo
 1968 marcin1
 1958 weronika
 1953 robert
 1953 justyna
 1952 wojtek
 1945 dominika
 1938 kamil1
 1936 paulina
 1888 kamil
 1883 master
 1878 klaudia
 1864 dominik
 1847 monika1
 1829 123456a
 1780 sebastian
 1778 kocham
 1771 misiek1
 1763 654321
 1748 mariusz
 1741 1234qwer
 1736 komputer1
 1716 dupadupa
 1714 bartek1
 1704 magda
 1674 michal1
 1649 1111
 1648 barcelona
 1636 kamila
 1627 11111
 1626 patrycja
 1620 tomek1
 1619 ewelina
 1586 wiktoria
 1577 marta

Analiza listy haseł pokazuje, że mamy na niej:

  • 43 imiona: 18 damskich, 25 męskich (6 z „1” na końcu”),
  • 17 różnych „wzorków z klawiatury” takich jak np. zaq12wsx czy qwerty,
  • 16 haseł składających się z samych cyfr,
  • 8 słów „miłosnych” (misiek, kochanie, myszka, misiaczek, niunia, kochamcie, kocham, misiek1),
  • 3 razy występuje nieśmiertelna dupa (dupa, dupadupa, dupa123),
  • 3 razy samo hasło (haslo, haslo1, password),
  • 3 razy to co mamy przed nosem (komputer, komputer1, samsung),
  • 2 hasła patriotyczne (polska, polska1),
  • 1 klub sportowy (barcelona),
  • plus cztery hasła z kategorii „inne” (lol123, dragon, matrix, master).

Rozkład długości haseł:

1 = 4220 (0.03%)
2 = 4174 (0.03%)
3 = 70731 (0.54%)
4 = 112991 (0.86%)
5 = 285356 (2.16%)
6 = 1727340 (13.07%)
7 = 1469430 (11.12%)
8 = 5579276 (42.23%)
9 = 1302102 (9.85%)
10 = 1553950 (11.76%)
11 = 418313 (3.17%)
12 = 278325 (2.11%)
13 = 127874 (0.97%)
14 = 84292 (0.64%)
15 = 61454 (0.47%)
16 = 47145 (0.36%)
17 = 12810 (0.1%)
18 = 10265 (0.08%)
19 = 5233 (0.04%)
20 = 17909 (0.14%)

Inne cechy haseł:

  • tylko małe litery: 6 002 860 (45.43%),
  • tylko duże litery:  56 362 (0.43%),
  • tylko cyfry: 878 898 (6.65%),
  • pojedyncza cyfra na końcu: 1 359 345 (10.29%),
  • dwie cyfry na końcu: 1 461 088 (11.06%),
  • trzy cyfry na końcu: 736 211 (5.57%).

Ostatnia cyfra:

0 = 453767 (3.43%)
 1 = 1325827 (10.03%)
 2 = 620737 (4.7%)
 3 = 713602 (5.4%)
 4 = 394422 (2.99%)
 5 = 427753 (3.24%)
 6 = 443584 (3.36%)
 7 = 402658 (3.05%)
 8 = 338093 (2.56%)
 9 = 367149 (2.78%)

Z listy uzyskanej z bazy wyeliminowane zostały ewidentne przypadki, gdzie ktoś zakładał tysiące kont z tym samym hasłem. Nie wiemy, z jakiego serwisu te dane pochodziły, ale hasła wyglądały tak:

40656 iw14Fi9j
 10218 nks230kjs82
 7097 iw14Fi9jxL
 5209 3rJs1la7qE
 5134 pk3x7w9W
 5106 yOp7s55
 4000 golfcourse
 3921 Telechargement
 3709 bvp33W7epU
 3669 iw14Fi9jwQa
 3128 Doomsayer.2.7mords.V

Powiązane z nimi adresy email były ewidentnie tworzone na potrzeby jakiegoś większego botnetu (w podobnych lub identycznych tanich domenach, tworzone wg takiego samego schematu).

Co jeszcze można znaleźć w bazie

Kilka innych ciekawych wyszukiwań w bazie i ich statystyki:

3347 gov.pl
130 policja.gov.pl
37 mon.gov.pl
39 sejm.pl
7 prezydent.pl

867 uj.edu.pl
733 pwr.wroc.pl
430 uw.edu.pl


608 bzwbk.pl
462 pkobp.pl
390 pekao.com.pl
386 pzu.pl
270 ingbank.pl
243 orlen.pl

Pytania i odpowiedzi

Pytanie: Czy jestem w bazie?

Odpowiedź: Jeśli nurtuje Was takie pytanie, to niestety nie możemy pomóc. Możecie za to sprawdzić to na stronie HaveIBeenPwned. To bezpieczny serwis, nie ukradnie Waszego emaila i nie zacznie Was spamować. Baza, w której wyszukuje HaveIBeenPwned jest w dużej mierze zbieżna z tą analizowaną powyżej.

Pytanie: Skąd mogę pobrać bazę?

Odpowiedź: Niestety nie możemy udzielić takiej informacji.

Pytanie: Czy pracownicy mojej firmy są w bazie?

Odpowiedź: HaveIBeenPwned ma darmową usługę informowania o obecności konkretnej domeny w wyciekach danych.

PS. Zmieńcie stare hasła