29.11.2015 | 19:10

avatar

Adam Haertle

Historia spektakularnych wpadek filtrów eliminujących zakazane słowa

Niektórzy z Was mogą nie pamiętać czasów, kiedy to administratorzy wierzyli, że można z sieci wyeliminować bezeceństwa wprowadzając odpowiednie filtry brzydkich słów. Skutki działania takich filtrów bywały komiczne.

W czasach początków popularności internetu podejmowane były próby uchronienia sieci i jej użytkowników przed niepożądanymi treściami, najczęściej związanymi z erotyką. Jak pokazała historia próby te były skazane na niepowodzenie – warto jednak spojrzeć, jakie efekty uboczne generowały (i skąd wziął się sprinter Tyson Homosexual). Niech poniższe przykłady będą także lekcją dla wszystkich osób implementujących podobne mechanizmy – łatwo przy okazji przesadzić.

Miłe angielskie miasteczko Scunthorpe

Kategoria opisywanych poniżej wydarzeń zwana jest Problemem Scunthorpe. Nazwa ta pochodzi od angielskiego miasta Scunthorpe, którego mieszkańcy w roku 1996 nie mogli zarejestrować kont pocztowych w serwisie AOL. Nazwę ich miasta wyłapywał filtr, który doszukał się w niej słowa cunt, stanowiącego wulgarne określenie żeńskich narządów płciowych. Drugi raz miasto dostało kuksańca od Google, kiedy to w 2004 mechanizm Safe Search eliminował wyniki z domen zawierających nazwę miasta. Sprawa Scunthorpe była początkiem długiej fali problemów.

W 1998 odmówiono rejestracji domeny shitakemushrooms.com. W roku 2000 oprogramowanie filtrujące w Kanadzie wycięło dostęp do serwisu www.cum.qc.ca, obsługującego miasto Montreal. W 2004 niejaki Craig Cockburn dowiedział się, że nie może założyć konta na Hotmailu ze swoim nazwiskiem w nazwie. W 2010 podobny problem spotkał go w serwisie BBC. W 2006 Linda Callahan nie mogła założyć konta w serwisie Yahoo ponieważ jej nazwisko zawierało słowo allah. W 2008 Dr. Herman I. Libshitz nie mógł założyć konta pocztowego w firmie Verizon (tym razem dopatrzono się w nazwisku słowa shit). Dalej będzie jeszcze weselej.

Słowa używane w spamie (źródło: Bryan Kerr

Słowa używane w spamie (źródło: Bryan Kerr)

W roku 1996 użytkownicy mieli problemy z wyszukiwaniem informacji o Super Bowl XXX. Jeszcze w 2004 strony hrabstwa Sussex nie były dostępne w wielu bibliotekach. Z kolei w roku 2011 Chińczycy próbujący wyszukiwać informacji o rzekach, widzieli odpowiedź serwera informującą, że ich wyszukiwanie zostało zablokowane z powodu naruszenia przepisów – było to skutkiem blokowania informacji o rzekomej śmierci przywódcy Jiang Zemina, które imię – Jiang – oznacza również rzekę.

A może odfiltrujemy ataki?

Jeden z medali w tej kategorii bez wątpienia należy się Yahoo, które w roku 2001 wprowadziło w poczcie filtry mające za zadanie uniemożliwić wstrzyknięcie kodu JavaScript. Skutkiem tych filtrów było zmienianie w treści wiadomości JavaScript na Java-Script (podobnie z Jscript czy Vbscript) a także zamienianie eval na review, mocha na espresso i expression na statement. Powodowało to, ze np. słowo medieval nabierało formy medireview. Niektóre filtry pocztowe początkowo blokowały wiadomości zawierające słowa socialism czy specialist – zawierały słowo cialis, popularny temat spamerów. Na problemy narzekali także mieszkańcy takich angielskich miejscowości jak Penistone, Lightwater czy Clitheroe (odpowiednio penis, twat, clit). Systemy pocztowe nie lubiły także życiorysów zawierających informacje o dyplomie z wyróżnieniem – magna cum laude.

Bez wątpienia najzabawniejsze sytuacje miały miejsce w systemach, które aktywnie zamieniały podejrzane zwroty na bardziej akceptowalne. Strona Amerykańskiego Stowarzyszenia Rodzin w artykule pobranym z serwisu Associated Press stworzyła nowego sprintera – Tysona Homosexuala (oryginalnie nazywał się Tyson Gay). Z kolei serwisy korzystające z mechanizmów zamieniających słowo ass na butt wprowadzały takie pojęcia jak clbuttic (zamiast classic) czy buttbuttinate (zamiast assassinate).

Nie tylko zamierzchła przeszłość

Choć większość opisywanych powyżej wydarzeń miała miejsce 10-20 lat temu to problem od czasu do czasu powraca. W elektronicznym przewodniku telewizyjnym Virgin Media w roku 2011 zniknęła nazwa zespołu Arsenal (arse) oraz słowo canal (anal).  Z kolei filtry walczące z pornografią u brytyjskich operatorów internetu radośnie wycinały pliki gry  League of Legends takie jak np. VarusExpirationTimer.luaobj, zawierające słowo sex.

Podobne problemy miały równiez miejsce w Polsce – niektóre fora potrafiły wygwiazdkować słowo abstrahując (do formy absta***ąc), a sami pamiętamy, jak z niejednego kanału IRC można było wylecieć za stwierdzenie, że ktoś kogoś podsłuchuje. Może Wy także pamiętacie podobne perełki?

Aktualizacja: Czytelnicy podsyłają swoje przykłady:

  • korporacyjny system pocztowy wycinający emaile z sygnaturką ze słowem analityk (Mariusz)
  • domena z pluginami do Nagiosa nagiosexchange.org (s)
  • prokursor GaduGadu czyli SMS Express też notował problemy z domeną (troll)
  • pani Renata Cygan nie mogła założyć konta Microsoft (Aaa)
  • zablokowany w sieci korporacyjnej plik ProcessExplorer.exe (pracus)
  • wycinanie adresów ze słowem baby w rzeszowskiej darmowej sieci WiFi (dzek)
  • blokowanie witryn z opisem Brainfucka na uczelni (mpan)

Źródło artykułu: przypadkowo odnaleziony świetny wpis z Wikipedii (angielskiej oraz polskiej).

Powrót

Komentarze

  • avatar
    2015.11.29 19:26 Aaa

    Niedawno (w tym roku) po internetach krążyła historia o pani Renacie Cygan, która nie mogła stworzyć konta microsoft bo w pole nazwisko wpisywało słowo uznawane przez MS za obraźliwe :p

    Odpowiedz
  • avatar
    2015.11.29 19:56 troll

    Dawniej GG nazywało się smsexpress. Filtry rodzicielskie go nie lubiły…

    Odpowiedz
  • avatar
    2015.11.29 20:02 s

    Ja kojarzę jedną. Była kiedyś taka strona z pluginami do Nagiosa i nazywała się nagiosexchange.org. Często i gęsto wpadało to na filtry :)

    Odpowiedz
  • avatar
    2015.11.29 20:33 mpan

    Dawno temu na uczelni musiałem złożyć oficjalne podanie o dostęp do treści pornograficznych z uczelnianej sieci, żeby móc na kółku programistycznym pokazać Brainfucka bez obawy, że mi uczelniany filtr zablokuje strony zawierające w URL „fuck”.

    Odpowiedz
  • avatar
    2015.11.29 21:08 Monter

    Do dziś tak działa filtrowanie komentarzy w serwisie epoznan – niektóre soczyste przekleństwa pisane małymi literami są kropkowane, a pisane wielkimi – nie (to tylko jeden z przykładów, bo filtrują tylko niektóre rzeczy a wiele przechodzi, co skrzętnie jest tam wykorzystywane przez odwiedzających). Że też ktoś stworzył takiego potworka i się pod nim jeszcze podpisał…

    Odpowiedz
  • avatar
    2015.11.29 21:17 Gjvvh

    Padłem przy akapicie o panu Tysonie. Mistrzostwo.

    Odpowiedz
  • avatar
    2015.11.29 21:55 dzek

    W Rzeszowskiej darmowej sieci WIFI (nie kojarzę aktualnie nazwy) był kiedyś filtr na … „baby” w URL o.O Widocznie za dużo osób wpisywało w wyszukiwarkę „gołe baby” czy coś.

    W każdym razie nie dało się dzięki temu obejrzeć fotki małych zwierzątek ( pamiętam, gdy odkrywałem o co to chodzi, chciałem otworzyć adres w rodzaju http://domena.pl/obrazki/baby_squirrel.jpg ) – zapewne angielskich artykułów dot. dzieci też bym nie pooglądał.

    Co ciekawe – treść stron chyba nie była filtrowana (albo innymi obrazkami), skoro gdzieś był link do tego obrazka (chyba, że po https wyniki w Google leciały, nie wiem).

    Odpowiedz
    • avatar
      2015.12.01 22:22 maslan

      Albo z tej sieci rzeszowscy pedofile się logowali :D

      Odpowiedz
  • avatar
    2015.11.29 22:28 Kacper

    Mi w pewnym WANie przy instalacji Debiana netinstall stuckował się na paczkach libsexy https://packages.debian.org/source/wheezy/libs/libsexy

    Niezła paranoja była pamiętam… kończyło się ssaniem wersji na płytkach.

    Odpowiedz
  • avatar
    2015.11.29 23:01 Art

    Stare dzieje :-) Na filmwebie to w dalszym ciągu wszystkiego nie da się napisać.

    Ale tak BTW: jest jakis sposób na filtr cenzuralny? Taki co zablokuje np „doopa”, „prdl wszytko”, „c*pa”?

    Odpowiedz
    • avatar
      2015.11.30 10:05 phi

      Po prostu: A) kropka czy kreseczka w najmniej znaczącym elemencie wyrazu B) znaki specjalne C) podobne znaki… I bez żywego moderatora góvvniany skrypt ni #uj4 nie ocenzuruje bo jest do d_py :P

      Odpowiedz
      • avatar
        2015.12.01 00:08 Art

        Czyli mamy opcję filtru który daje niekiedy śmieszkowe wyniki, albo nie dajemy w ogóle.

        No to jakby nie było wybieram bramkę nr 1)

        Odpowiedz
  • avatar
    2015.11.29 23:54 pracuś

    U nas nie dało się kiedyś ściągnąć przez sieć korporacyjną programu Process Explorer (plik processexplorer.exe)… ;)

    Odpowiedz
  • avatar
    2015.11.30 01:35 Maciek

    Między innymi o tym opowiadał Bruce Lawson z Opery w trakcie prezentacji „How to destroy the Web” (prawie cztery lata temu w Krakowie na SFI). Polecam poszukać na YouTube, rewelacyjnie się go słucha!

    Odpowiedz
  • avatar
    2015.11.30 02:40 Brat

    W mojej byłej już pracy działa taki filtr. Kiedyś pewna strona pracownicza została zablokowana, ponieważ w dolepianym do jej adresu tokenie znalazło się słowo 'porn’.

    Odpowiedz
  • avatar
    2015.11.30 03:02 Gość

    Wiem o jakie forum chodzi z abstrachowaniem :)

    To samo forum miało też kiedyś problem w momencie gdy informatyk (znany z tego, że update’y były conajwyżej raz na tydzień) chciał wyciąć literkę k z wiadomo jakiego słowa i zastąpić ją gwiazdką. Niestety w niewłaściwym miejscu postawił nawias w kodzie i tak oto każde słowo z literką k, zawierało cudowną gwiazdkę :)

    Odpowiedz
  • avatar
    2015.11.30 08:33 yzq

    W pewnej firmie oprogramowanie DLP miało strzec nie tylko tajemnic korporacyjnych ale i „moralności”, w razie potrzeby ubijając podejrzane procesy. W tym czasie szef supportu ustalał z klientem format szablonu zgłoszenia supportowego dla pewnej aplikacji i zaproponował w mailu m.in. numerację zgłoszeń w typowym formacie APPNAME-XXX. Pożałował, bo nagle stracił możliwość używania Outlooka. Nie pamiętam, czy poradził sobie używając webmaila czy też musieli interweniować admini poczty…

    Odpowiedz
  • avatar
    2015.11.30 08:52 Iceberg

    Gdy kilka lat temu wyszedł Starcraft II i Battle.net 2.0, gracze nie mogli pisać na chacie o „jednostkach naziemnych”. Cenzura wycinała słowo „nazi”.

    Odpowiedz
  • avatar
    2015.11.30 12:30 pj

    to ja jeszcze dodam to :
    Może nie bezpośrednio zwiazane z cenzura, ale heh..

    Web Page Blocked

    URL: http://www.backupcentral.com/phpBB2/two-way-mirrors-of-external-mailing-lists-3/emc-networker-19/...(tu konkretne tematy z forum)…/

    Category: computer-and-internet-info

    Odpowiedz
  • avatar
    2015.11.30 13:31 Robur

    A ja nie miałem pojęcia dlaczego w korporacji mój przełożony dostał info z działu bezpieczeństwa o tym, co ja robię w pracy złego, bo szukałem info na temat firmy „Young & Rubicam” :-)

    Odpowiedz
  • avatar
    2015.11.30 13:49 lemgo

    Na jednej z uczelni nie odbyło się seminarium nt. przemocy w sieci. Filtry skutecznie zablokowały sporą część przykładów.

    Odpowiedz
  • avatar
    2015.11.30 15:25 komórkowiec

    Próbując wysłać z bramki Plusa SMS-a zawierającego „plus” lub „1,22” otrzymamy komunikat: „Treść wiadomości zawiera niedozwolone słowa”. Można mieć niezłą rozkminę, co się niby takiego wpisało, chcąc wysłać wiadomość o numerach linii tramwajowych lub o pluszowym misiu…

    Odpowiedz
  • avatar
    2015.11.30 15:42 Hepita

    Gram w grę Clash of Clans, należę do klanu Siekatory ninja. Kiedy chciałem na czacie globalnym napisać „zapraszam do klanu Siekatory ninja” otrzymałem „zapraszam do kl*****iekatory ninja”
    Mechanizm autocenzury widać jest niewrażliwy na spacje…

    Odpowiedz
  • avatar
    2015.11.30 16:22 Po_prostu_Janusz

    Ktos wie czy penisland.net sie kiedys skarzyl na te filtry?

    Swoja droga przyjdzie pora na cenzurowanie Janusza bo zawiera „anus”;-)

    Pozdrawiam

    Odpowiedz
  • avatar
    2015.11.30 16:45 vanitas

    Dawno temu, kiedy SSD było tylko w labach – chciałem kupić kieszeń wstrząsoodPORNą na dysk. Potem jeszcze kieszeń wodoodPORNą na dokmenty (to z domu, ale akurat po VPNie do fabryki).

    Odpowiedz
  • avatar
    2015.12.01 00:12 Art

    no i niezapomniane mypenisinyourcoffe.com

    Odpowiedz
  • avatar
    2015.12.01 00:31 M

    Również w Rzeszowskiej darmowej sieci: nie można była wejść na Wikipedię w temat oPORNik, oraz na forum SonyErissonXperia np (sexperia.pl).

    Odpowiedz
  • avatar
    2015.12.01 00:52 Mateusz

    Swojego czasu na pewnej stronie opisywano w j. angielskim pewną część aeroplanu, która nazywa się kokpitem. Niestety zamiast zmiany cock na penis, albo wee-wee – co by było najzabawniejsze `wee-weepit` wstawiało gwiazki. I weź tu czytaj artykuł o wyglądzie ****pitu, kiedy to w tym typie samolotów ****pit wyróżnia się na tle ****pitów modeli podobnej klasy.

    Odpowiedz
  • avatar
    2015.12.01 07:24 yy

    a pamięta jeszcze ktoś jaką domenę miał kiedyś Wydział Chemii na Uniwersytecie Jagiellońskim? ;D

    Odpowiedz
  • avatar
    2015.12.01 15:46 Sebastian

    Ach te straszne brzydkie słowa :-/ Tyle czasu i energii zmarnowano na bezsensowne „ukulturalnianie” wypowiedzi… Pfff…

    Odpowiedz
  • avatar
    2015.12.01 23:44 koleszka śniegowy

    W jeszcze dawniejszych czasach, CompuServe walczyło ze słowami „bitch” (co utrudniło życie posiadaczom psów płci żeńskiej), „breast” (później dodając wyjątek „chicken breast” po protestach gospodyń domowych) i paroma innymi.

    Pomysły na algorytmiczne oczyszczenie sieci są starsze od Internetu ;-)

    Odpowiedz
  • avatar
    2015.12.03 15:14 kod13

    W url-u szły dane potraktowane zipem i urlencode. W ten sposób znalazła się fraza 32sEx678. Zablokowany dostęp do strony.

    Odpowiedz
  • avatar
    2015.12.03 21:30 Zbychu

    W zamierzchłych czasach na zarządzenie prezesa wprowadziłem filtry, m.in. na słowo porn,proxy usera który wyszukiwał hasło po trzech próbach odcinało pd dostępu do internetu na 24h. Po pierwszym dniu miałem zablokowany cały dział konstrukcyjny, filtr zadziałał na hasło:’stal żaroodporna’.

    Odpowiedz
  • avatar
    2015.12.04 21:57 Shrek

    Nadgorliwy filtr miał (nie wiem, czy jeszcze ma, bo przestałem tam zaglądać) jeden z polskich serwisów torrent. Dawało to przekomiczne efekty przy streszczeniach filmów, można było przeczytać między innymi: „Młodzieniec zako się w dziewczynie…”

    Odpowiedz
  • avatar
    2015.12.06 15:53 SasQ

    Pewien serwis kiedyś zażądał ode mnie przy rejestracji podania imienia i nazwiska. Jakże się zdziwiłem, gdy próbując podać fałszywe nazwisko „Kot” otrzymałem odpowiedź, że moje nazwisko jest za krótkie :P

    Odpowiedz
  • avatar
    2015.12.08 15:02 darekry

    kilka lat temu autokorekta na elektrodzie zamieniała wszystkie Radki na Radeony, co uniemożliwiało bezpośredni zwrot do wielu Radosławów.

    Odpowiedz
  • avatar
    2015.12.09 10:15 Artur

    Może to nie filtr do zakazanych słów ale nieudolna autokorekta: MS Word w wersji 2000 zmieniał automatycznie i bez ostrzeżenia „z uwagi na” na jeden wyraz: „wagina”.

    Odpowiedz
  • avatar
    2016.02.14 10:07 qw

    o Homosexualu czytam już chyba czwarty raz, za każdym śmieję się tak samo xD

    Odpowiedz

Zostaw odpowiedź

Jeśli chcesz zwrócić uwagę na literówkę lub inny błąd techniczny, zapraszamy do formularza kontaktowego. Reagujemy równie szybko.

Historia spektakularnych wpadek filtrów eliminujących zakazane słowa

Komentarze