29.11.2015 | 19:10

Adam Haertle

Historia spektakularnych wpadek filtrów eliminujących zakazane słowa

Niektórzy z Was mogą nie pamiętać czasów, kiedy to administratorzy wierzyli, że można z sieci wyeliminować bezeceństwa wprowadzając odpowiednie filtry brzydkich słów. Skutki działania takich filtrów bywały komiczne.

W czasach początków popularności internetu podejmowane były próby uchronienia sieci i jej użytkowników przed niepożądanymi treściami, najczęściej związanymi z erotyką. Jak pokazała historia próby te były skazane na niepowodzenie – warto jednak spojrzeć, jakie efekty uboczne generowały (i skąd wziął się sprinter Tyson Homosexual). Niech poniższe przykłady będą także lekcją dla wszystkich osób implementujących podobne mechanizmy – łatwo przy okazji przesadzić.

Miłe angielskie miasteczko Scunthorpe

Kategoria opisywanych poniżej wydarzeń zwana jest Problemem Scunthorpe. Nazwa ta pochodzi od angielskiego miasta Scunthorpe, którego mieszkańcy w roku 1996 nie mogli zarejestrować kont pocztowych w serwisie AOL. Nazwę ich miasta wyłapywał filtr, który doszukał się w niej słowa cunt, stanowiącego wulgarne określenie żeńskich narządów płciowych. Drugi raz miasto dostało kuksańca od Google, kiedy to w 2004 mechanizm Safe Search eliminował wyniki z domen zawierających nazwę miasta. Sprawa Scunthorpe była początkiem długiej fali problemów.

W 1998 odmówiono rejestracji domeny shitakemushrooms.com. W roku 2000 oprogramowanie filtrujące w Kanadzie wycięło dostęp do serwisu www.cum.qc.ca, obsługującego miasto Montreal. W 2004 niejaki Craig Cockburn dowiedział się, że nie może założyć konta na Hotmailu ze swoim nazwiskiem w nazwie. W 2010 podobny problem spotkał go w serwisie BBC. W 2006 Linda Callahan nie mogła założyć konta w serwisie Yahoo ponieważ jej nazwisko zawierało słowo allah. W 2008 Dr. Herman I. Libshitz nie mógł założyć konta pocztowego w firmie Verizon (tym razem dopatrzono się w nazwisku słowa shit). Dalej będzie jeszcze weselej.

Słowa używane w spamie (źródło: Bryan Kerr

Słowa używane w spamie (źródło: Bryan Kerr)

W roku 1996 użytkownicy mieli problemy z wyszukiwaniem informacji o Super Bowl XXX. Jeszcze w 2004 strony hrabstwa Sussex nie były dostępne w wielu bibliotekach. Z kolei w roku 2011 Chińczycy próbujący wyszukiwać informacji o rzekach, widzieli odpowiedź serwera informującą, że ich wyszukiwanie zostało zablokowane z powodu naruszenia przepisów – było to skutkiem blokowania informacji o rzekomej śmierci przywódcy Jiang Zemina, które imię – Jiang – oznacza również rzekę.

A może odfiltrujemy ataki?

Jeden z medali w tej kategorii bez wątpienia należy się Yahoo, które w roku 2001 wprowadziło w poczcie filtry mające za zadanie uniemożliwić wstrzyknięcie kodu JavaScript. Skutkiem tych filtrów było zmienianie w treści wiadomości JavaScript na Java-Script (podobnie z Jscript czy Vbscript) a także zamienianie eval na review, mocha na espresso i expression na statement. Powodowało to, ze np. słowo medieval nabierało formy medireview. Niektóre filtry pocztowe początkowo blokowały wiadomości zawierające słowa socialism czy specialist – zawierały słowo cialis, popularny temat spamerów. Na problemy narzekali także mieszkańcy takich angielskich miejscowości jak Penistone, Lightwater czy Clitheroe (odpowiednio penis, twat, clit). Systemy pocztowe nie lubiły także życiorysów zawierających informacje o dyplomie z wyróżnieniem – magna cum laude.

Bez wątpienia najzabawniejsze sytuacje miały miejsce w systemach, które aktywnie zamieniały podejrzane zwroty na bardziej akceptowalne. Strona Amerykańskiego Stowarzyszenia Rodzin w artykule pobranym z serwisu Associated Press stworzyła nowego sprintera – Tysona Homosexuala (oryginalnie nazywał się Tyson Gay). Z kolei serwisy korzystające z mechanizmów zamieniających słowo ass na butt wprowadzały takie pojęcia jak clbuttic (zamiast classic) czy buttbuttinate (zamiast assassinate).

Nie tylko zamierzchła przeszłość

Choć większość opisywanych powyżej wydarzeń miała miejsce 10-20 lat temu to problem od czasu do czasu powraca. W elektronicznym przewodniku telewizyjnym Virgin Media w roku 2011 zniknęła nazwa zespołu Arsenal (arse) oraz słowo canal (anal).  Z kolei filtry walczące z pornografią u brytyjskich operatorów internetu radośnie wycinały pliki gry  League of Legends takie jak np. VarusExpirationTimer.luaobj, zawierające słowo sex.

Podobne problemy miały równiez miejsce w Polsce – niektóre fora potrafiły wygwiazdkować słowo abstrahując (do formy absta***ąc), a sami pamiętamy, jak z niejednego kanału IRC można było wylecieć za stwierdzenie, że ktoś kogoś podsłuchuje. Może Wy także pamiętacie podobne perełki?

Aktualizacja: Czytelnicy podsyłają swoje przykłady:

  • korporacyjny system pocztowy wycinający emaile z sygnaturką ze słowem analityk (Mariusz)
  • domena z pluginami do Nagiosa nagiosexchange.org (s)
  • prokursor GaduGadu czyli SMS Express też notował problemy z domeną (troll)
  • pani Renata Cygan nie mogła założyć konta Microsoft (Aaa)
  • zablokowany w sieci korporacyjnej plik ProcessExplorer.exe (pracus)
  • wycinanie adresów ze słowem baby w rzeszowskiej darmowej sieci WiFi (dzek)
  • blokowanie witryn z opisem Brainfucka na uczelni (mpan)

Źródło artykułu: przypadkowo odnaleziony świetny wpis z Wikipedii (angielskiej oraz polskiej).

Powrót

Komentarze

  • 2015.11.29 19:26 Aaa

    Niedawno (w tym roku) po internetach krążyła historia o pani Renacie Cygan, która nie mogła stworzyć konta microsoft bo w pole nazwisko wpisywało słowo uznawane przez MS za obraźliwe :p

    Odpowiedz
  • 2015.11.29 19:56 troll

    Dawniej GG nazywało się smsexpress. Filtry rodzicielskie go nie lubiły…

    Odpowiedz
  • 2015.11.29 20:02 s

    Ja kojarzę jedną. Była kiedyś taka strona z pluginami do Nagiosa i nazywała się nagiosexchange.org. Często i gęsto wpadało to na filtry :)

    Odpowiedz
  • 2015.11.29 20:33 mpan

    Dawno temu na uczelni musiałem złożyć oficjalne podanie o dostęp do treści pornograficznych z uczelnianej sieci, żeby móc na kółku programistycznym pokazać Brainfucka bez obawy, że mi uczelniany filtr zablokuje strony zawierające w URL „fuck”.

    Odpowiedz
  • 2015.11.29 21:08 Monter

    Do dziś tak działa filtrowanie komentarzy w serwisie epoznan – niektóre soczyste przekleństwa pisane małymi literami są kropkowane, a pisane wielkimi – nie (to tylko jeden z przykładów, bo filtrują tylko niektóre rzeczy a wiele przechodzi, co skrzętnie jest tam wykorzystywane przez odwiedzających). Że też ktoś stworzył takiego potworka i się pod nim jeszcze podpisał…

    Odpowiedz
  • 2015.11.29 21:17 Gjvvh

    Padłem przy akapicie o panu Tysonie. Mistrzostwo.

    Odpowiedz
  • 2015.11.29 21:55 dzek

    W Rzeszowskiej darmowej sieci WIFI (nie kojarzę aktualnie nazwy) był kiedyś filtr na … „baby” w URL o.O Widocznie za dużo osób wpisywało w wyszukiwarkę „gołe baby” czy coś.

    W każdym razie nie dało się dzięki temu obejrzeć fotki małych zwierzątek ( pamiętam, gdy odkrywałem o co to chodzi, chciałem otworzyć adres w rodzaju http://domena.pl/obrazki/baby_squirrel.jpg ) – zapewne angielskich artykułów dot. dzieci też bym nie pooglądał.

    Co ciekawe – treść stron chyba nie była filtrowana (albo innymi obrazkami), skoro gdzieś był link do tego obrazka (chyba, że po https wyniki w Google leciały, nie wiem).

    Odpowiedz
    • 2015.12.01 22:22 maslan

      Albo z tej sieci rzeszowscy pedofile się logowali :D

      Odpowiedz
  • 2015.11.29 22:28 Kacper

    Mi w pewnym WANie przy instalacji Debiana netinstall stuckował się na paczkach libsexy https://packages.debian.org/source/wheezy/libs/libsexy

    Niezła paranoja była pamiętam… kończyło się ssaniem wersji na płytkach.

    Odpowiedz
  • 2015.11.29 23:01 Art

    Stare dzieje :-) Na filmwebie to w dalszym ciągu wszystkiego nie da się napisać.

    Ale tak BTW: jest jakis sposób na filtr cenzuralny? Taki co zablokuje np „doopa”, „prdl wszytko”, „c*pa”?

    Odpowiedz
    • 2015.11.30 10:05 phi

      Po prostu: A) kropka czy kreseczka w najmniej znaczącym elemencie wyrazu B) znaki specjalne C) podobne znaki… I bez żywego moderatora góvvniany skrypt ni #uj4 nie ocenzuruje bo jest do d_py :P

      Odpowiedz
      • 2015.12.01 00:08 Art

        Czyli mamy opcję filtru który daje niekiedy śmieszkowe wyniki, albo nie dajemy w ogóle.

        No to jakby nie było wybieram bramkę nr 1)

        Odpowiedz
  • 2015.11.29 23:54 pracuś

    U nas nie dało się kiedyś ściągnąć przez sieć korporacyjną programu Process Explorer (plik processexplorer.exe)… ;)

    Odpowiedz
  • 2015.11.30 01:35 Maciek

    Między innymi o tym opowiadał Bruce Lawson z Opery w trakcie prezentacji „How to destroy the Web” (prawie cztery lata temu w Krakowie na SFI). Polecam poszukać na YouTube, rewelacyjnie się go słucha!

    Odpowiedz
  • 2015.11.30 02:40 Brat

    W mojej byłej już pracy działa taki filtr. Kiedyś pewna strona pracownicza została zablokowana, ponieważ w dolepianym do jej adresu tokenie znalazło się słowo 'porn’.

    Odpowiedz
  • 2015.11.30 03:02 Gość

    Wiem o jakie forum chodzi z abstrachowaniem :)

    To samo forum miało też kiedyś problem w momencie gdy informatyk (znany z tego, że update’y były conajwyżej raz na tydzień) chciał wyciąć literkę k z wiadomo jakiego słowa i zastąpić ją gwiazdką. Niestety w niewłaściwym miejscu postawił nawias w kodzie i tak oto każde słowo z literką k, zawierało cudowną gwiazdkę :)

    Odpowiedz
  • 2015.11.30 08:33 yzq

    W pewnej firmie oprogramowanie DLP miało strzec nie tylko tajemnic korporacyjnych ale i „moralności”, w razie potrzeby ubijając podejrzane procesy. W tym czasie szef supportu ustalał z klientem format szablonu zgłoszenia supportowego dla pewnej aplikacji i zaproponował w mailu m.in. numerację zgłoszeń w typowym formacie APPNAME-XXX. Pożałował, bo nagle stracił możliwość używania Outlooka. Nie pamiętam, czy poradził sobie używając webmaila czy też musieli interweniować admini poczty…

    Odpowiedz
  • 2015.11.30 08:52 Iceberg

    Gdy kilka lat temu wyszedł Starcraft II i Battle.net 2.0, gracze nie mogli pisać na chacie o „jednostkach naziemnych”. Cenzura wycinała słowo „nazi”.

    Odpowiedz
  • 2015.11.30 12:30 pj

    to ja jeszcze dodam to :
    Może nie bezpośrednio zwiazane z cenzura, ale heh..

    Web Page Blocked

    URL: http://www.backupcentral.com/phpBB2/two-way-mirrors-of-external-mailing-lists-3/emc-networker-19/...(tu konkretne tematy z forum)…/

    Category: computer-and-internet-info

    Odpowiedz
  • 2015.11.30 13:31 Robur

    A ja nie miałem pojęcia dlaczego w korporacji mój przełożony dostał info z działu bezpieczeństwa o tym, co ja robię w pracy złego, bo szukałem info na temat firmy „Young & Rubicam” :-)

    Odpowiedz
  • 2015.11.30 13:49 lemgo

    Na jednej z uczelni nie odbyło się seminarium nt. przemocy w sieci. Filtry skutecznie zablokowały sporą część przykładów.

    Odpowiedz
  • 2015.11.30 15:25 komórkowiec

    Próbując wysłać z bramki Plusa SMS-a zawierającego „plus” lub „1,22” otrzymamy komunikat: „Treść wiadomości zawiera niedozwolone słowa”. Można mieć niezłą rozkminę, co się niby takiego wpisało, chcąc wysłać wiadomość o numerach linii tramwajowych lub o pluszowym misiu…

    Odpowiedz
  • 2015.11.30 15:42 Hepita

    Gram w grę Clash of Clans, należę do klanu Siekatory ninja. Kiedy chciałem na czacie globalnym napisać „zapraszam do klanu Siekatory ninja” otrzymałem „zapraszam do kl*****iekatory ninja”
    Mechanizm autocenzury widać jest niewrażliwy na spacje…

    Odpowiedz
  • 2015.11.30 16:22 Po_prostu_Janusz

    Ktos wie czy penisland.net sie kiedys skarzyl na te filtry?

    Swoja droga przyjdzie pora na cenzurowanie Janusza bo zawiera „anus”;-)

    Pozdrawiam

    Odpowiedz
  • 2015.11.30 16:45 vanitas

    Dawno temu, kiedy SSD było tylko w labach – chciałem kupić kieszeń wstrząsoodPORNą na dysk. Potem jeszcze kieszeń wodoodPORNą na dokmenty (to z domu, ale akurat po VPNie do fabryki).

    Odpowiedz
  • 2015.12.01 00:12 Art

    no i niezapomniane mypenisinyourcoffe.com

    Odpowiedz
  • 2015.12.01 00:31 M

    Również w Rzeszowskiej darmowej sieci: nie można była wejść na Wikipedię w temat oPORNik, oraz na forum SonyErissonXperia np (sexperia.pl).

    Odpowiedz
  • 2015.12.01 00:52 Mateusz

    Swojego czasu na pewnej stronie opisywano w j. angielskim pewną część aeroplanu, która nazywa się kokpitem. Niestety zamiast zmiany cock na penis, albo wee-wee – co by było najzabawniejsze `wee-weepit` wstawiało gwiazki. I weź tu czytaj artykuł o wyglądzie ****pitu, kiedy to w tym typie samolotów ****pit wyróżnia się na tle ****pitów modeli podobnej klasy.

    Odpowiedz
  • 2015.12.01 07:24 yy

    a pamięta jeszcze ktoś jaką domenę miał kiedyś Wydział Chemii na Uniwersytecie Jagiellońskim? ;D

    Odpowiedz
  • 2015.12.01 15:46 Sebastian

    Ach te straszne brzydkie słowa :-/ Tyle czasu i energii zmarnowano na bezsensowne „ukulturalnianie” wypowiedzi… Pfff…

    Odpowiedz
  • 2015.12.01 23:44 koleszka śniegowy

    W jeszcze dawniejszych czasach, CompuServe walczyło ze słowami „bitch” (co utrudniło życie posiadaczom psów płci żeńskiej), „breast” (później dodając wyjątek „chicken breast” po protestach gospodyń domowych) i paroma innymi.

    Pomysły na algorytmiczne oczyszczenie sieci są starsze od Internetu ;-)

    Odpowiedz
  • 2015.12.03 15:14 kod13

    W url-u szły dane potraktowane zipem i urlencode. W ten sposób znalazła się fraza 32sEx678. Zablokowany dostęp do strony.

    Odpowiedz
  • 2015.12.03 21:30 Zbychu

    W zamierzchłych czasach na zarządzenie prezesa wprowadziłem filtry, m.in. na słowo porn,proxy usera który wyszukiwał hasło po trzech próbach odcinało pd dostępu do internetu na 24h. Po pierwszym dniu miałem zablokowany cały dział konstrukcyjny, filtr zadziałał na hasło:’stal żaroodporna’.

    Odpowiedz
  • 2015.12.04 21:57 Shrek

    Nadgorliwy filtr miał (nie wiem, czy jeszcze ma, bo przestałem tam zaglądać) jeden z polskich serwisów torrent. Dawało to przekomiczne efekty przy streszczeniach filmów, można było przeczytać między innymi: „Młodzieniec zako się w dziewczynie…”

    Odpowiedz
  • 2015.12.06 15:53 SasQ

    Pewien serwis kiedyś zażądał ode mnie przy rejestracji podania imienia i nazwiska. Jakże się zdziwiłem, gdy próbując podać fałszywe nazwisko „Kot” otrzymałem odpowiedź, że moje nazwisko jest za krótkie :P

    Odpowiedz
  • 2015.12.08 15:02 darekry

    kilka lat temu autokorekta na elektrodzie zamieniała wszystkie Radki na Radeony, co uniemożliwiało bezpośredni zwrot do wielu Radosławów.

    Odpowiedz
  • 2015.12.09 10:15 Artur

    Może to nie filtr do zakazanych słów ale nieudolna autokorekta: MS Word w wersji 2000 zmieniał automatycznie i bez ostrzeżenia „z uwagi na” na jeden wyraz: „wagina”.

    Odpowiedz
  • 2016.02.14 10:07 qw

    o Homosexualu czytam już chyba czwarty raz, za każdym śmieję się tak samo xD

    Odpowiedz

Zostaw odpowiedź do Artur

Jeśli chcesz zwrócić uwagę na literówkę lub inny błąd techniczny, zapraszamy do formularza kontaktowego. Reagujemy równie szybko.

Historia spektakularnych wpadek filtrów eliminujących zakazane słowa

Komentarze