Niektórzy z Was mogą nie pamiętać czasów, kiedy to administratorzy wierzyli, że można z sieci wyeliminować bezeceństwa wprowadzając odpowiednie filtry brzydkich słów. Skutki działania takich filtrów bywały komiczne.
W czasach początków popularności internetu podejmowane były próby uchronienia sieci i jej użytkowników przed niepożądanymi treściami, najczęściej związanymi z erotyką. Jak pokazała historia próby te były skazane na niepowodzenie – warto jednak spojrzeć, jakie efekty uboczne generowały (i skąd wziął się sprinter Tyson Homosexual). Niech poniższe przykłady będą także lekcją dla wszystkich osób implementujących podobne mechanizmy – łatwo przy okazji przesadzić.
Miłe angielskie miasteczko Scunthorpe
Kategoria opisywanych poniżej wydarzeń zwana jest Problemem Scunthorpe. Nazwa ta pochodzi od angielskiego miasta Scunthorpe, którego mieszkańcy w roku 1996 nie mogli zarejestrować kont pocztowych w serwisie AOL. Nazwę ich miasta wyłapywał filtr, który doszukał się w niej słowa cunt, stanowiącego wulgarne określenie żeńskich narządów płciowych. Drugi raz miasto dostało kuksańca od Google, kiedy to w 2004 mechanizm Safe Search eliminował wyniki z domen zawierających nazwę miasta. Sprawa Scunthorpe była początkiem długiej fali problemów.
W 1998 odmówiono rejestracji domeny shitakemushrooms.com. W roku 2000 oprogramowanie filtrujące w Kanadzie wycięło dostęp do serwisu www.cum.qc.ca, obsługującego miasto Montreal. W 2004 niejaki Craig Cockburn dowiedział się, że nie może założyć konta na Hotmailu ze swoim nazwiskiem w nazwie. W 2010 podobny problem spotkał go w serwisie BBC. W 2006 Linda Callahan nie mogła założyć konta w serwisie Yahoo ponieważ jej nazwisko zawierało słowo allah. W 2008 Dr. Herman I. Libshitz nie mógł założyć konta pocztowego w firmie Verizon (tym razem dopatrzono się w nazwisku słowa shit). Dalej będzie jeszcze weselej.
W roku 1996 użytkownicy mieli problemy z wyszukiwaniem informacji o Super Bowl XXX. Jeszcze w 2004 strony hrabstwa Sussex nie były dostępne w wielu bibliotekach. Z kolei w roku 2011 Chińczycy próbujący wyszukiwać informacji o rzekach, widzieli odpowiedź serwera informującą, że ich wyszukiwanie zostało zablokowane z powodu naruszenia przepisów – było to skutkiem blokowania informacji o rzekomej śmierci przywódcy Jiang Zemina, które imię – Jiang – oznacza również rzekę.
A może odfiltrujemy ataki?
Jeden z medali w tej kategorii bez wątpienia należy się Yahoo, które w roku 2001 wprowadziło w poczcie filtry mające za zadanie uniemożliwić wstrzyknięcie kodu JavaScript. Skutkiem tych filtrów było zmienianie w treści wiadomości JavaScript na Java-Script (podobnie z Jscript czy Vbscript) a także zamienianie eval na review, mocha na espresso i expression na statement. Powodowało to, ze np. słowo medieval nabierało formy medireview. Niektóre filtry pocztowe początkowo blokowały wiadomości zawierające słowa socialism czy specialist – zawierały słowo cialis, popularny temat spamerów. Na problemy narzekali także mieszkańcy takich angielskich miejscowości jak Penistone, Lightwater czy Clitheroe (odpowiednio penis, twat, clit). Systemy pocztowe nie lubiły także życiorysów zawierających informacje o dyplomie z wyróżnieniem – magna cum laude.
Bez wątpienia najzabawniejsze sytuacje miały miejsce w systemach, które aktywnie zamieniały podejrzane zwroty na bardziej akceptowalne. Strona Amerykańskiego Stowarzyszenia Rodzin w artykule pobranym z serwisu Associated Press stworzyła nowego sprintera – Tysona Homosexuala (oryginalnie nazywał się Tyson Gay). Z kolei serwisy korzystające z mechanizmów zamieniających słowo ass na butt wprowadzały takie pojęcia jak clbuttic (zamiast classic) czy buttbuttinate (zamiast assassinate).
Nie tylko zamierzchła przeszłość
Choć większość opisywanych powyżej wydarzeń miała miejsce 10-20 lat temu to problem od czasu do czasu powraca. W elektronicznym przewodniku telewizyjnym Virgin Media w roku 2011 zniknęła nazwa zespołu Arsenal (arse) oraz słowo canal (anal). Z kolei filtry walczące z pornografią u brytyjskich operatorów internetu radośnie wycinały pliki gry League of Legends takie jak np. VarusExpirationTimer.luaobj, zawierające słowo sex.
Podobne problemy miały równiez miejsce w Polsce – niektóre fora potrafiły wygwiazdkować słowo abstrahując (do formy absta***ąc), a sami pamiętamy, jak z niejednego kanału IRC można było wylecieć za stwierdzenie, że ktoś kogoś podsłuchuje. Może Wy także pamiętacie podobne perełki?
Aktualizacja: Czytelnicy podsyłają swoje przykłady:
- korporacyjny system pocztowy wycinający emaile z sygnaturką ze słowem analityk (Mariusz)
- domena z pluginami do Nagiosa nagiosexchange.org (s)
- prokursor GaduGadu czyli SMS Express też notował problemy z domeną (troll)
- pani Renata Cygan nie mogła założyć konta Microsoft (Aaa)
- zablokowany w sieci korporacyjnej plik ProcessExplorer.exe (pracus)
- wycinanie adresów ze słowem baby w rzeszowskiej darmowej sieci WiFi (dzek)
- blokowanie witryn z opisem Brainfucka na uczelni (mpan)
Źródło artykułu: przypadkowo odnaleziony świetny wpis z Wikipedii (angielskiej oraz polskiej).
Komentarze
Niedawno (w tym roku) po internetach krążyła historia o pani Renacie Cygan, która nie mogła stworzyć konta microsoft bo w pole nazwisko wpisywało słowo uznawane przez MS za obraźliwe :p
Dawniej GG nazywało się smsexpress. Filtry rodzicielskie go nie lubiły…
Ja kojarzę jedną. Była kiedyś taka strona z pluginami do Nagiosa i nazywała się nagiosexchange.org. Często i gęsto wpadało to na filtry :)
Dawno temu na uczelni musiałem złożyć oficjalne podanie o dostęp do treści pornograficznych z uczelnianej sieci, żeby móc na kółku programistycznym pokazać Brainfucka bez obawy, że mi uczelniany filtr zablokuje strony zawierające w URL „fuck”.
Do dziś tak działa filtrowanie komentarzy w serwisie epoznan – niektóre soczyste przekleństwa pisane małymi literami są kropkowane, a pisane wielkimi – nie (to tylko jeden z przykładów, bo filtrują tylko niektóre rzeczy a wiele przechodzi, co skrzętnie jest tam wykorzystywane przez odwiedzających). Że też ktoś stworzył takiego potworka i się pod nim jeszcze podpisał…
Padłem przy akapicie o panu Tysonie. Mistrzostwo.
W Rzeszowskiej darmowej sieci WIFI (nie kojarzę aktualnie nazwy) był kiedyś filtr na … „baby” w URL o.O Widocznie za dużo osób wpisywało w wyszukiwarkę „gołe baby” czy coś.
W każdym razie nie dało się dzięki temu obejrzeć fotki małych zwierzątek ( pamiętam, gdy odkrywałem o co to chodzi, chciałem otworzyć adres w rodzaju http://domena.pl/obrazki/baby_squirrel.jpg ) – zapewne angielskich artykułów dot. dzieci też bym nie pooglądał.
Co ciekawe – treść stron chyba nie była filtrowana (albo innymi obrazkami), skoro gdzieś był link do tego obrazka (chyba, że po https wyniki w Google leciały, nie wiem).
Albo z tej sieci rzeszowscy pedofile się logowali :D
Mi w pewnym WANie przy instalacji Debiana netinstall stuckował się na paczkach libsexy https://packages.debian.org/source/wheezy/libs/libsexy
Niezła paranoja była pamiętam… kończyło się ssaniem wersji na płytkach.
Stare dzieje :-) Na filmwebie to w dalszym ciągu wszystkiego nie da się napisać.
Ale tak BTW: jest jakis sposób na filtr cenzuralny? Taki co zablokuje np „doopa”, „prdl wszytko”, „c*pa”?
Po prostu: A) kropka czy kreseczka w najmniej znaczącym elemencie wyrazu B) znaki specjalne C) podobne znaki… I bez żywego moderatora góvvniany skrypt ni #uj4 nie ocenzuruje bo jest do d_py :P
Czyli mamy opcję filtru który daje niekiedy śmieszkowe wyniki, albo nie dajemy w ogóle.
No to jakby nie było wybieram bramkę nr 1)
U nas nie dało się kiedyś ściągnąć przez sieć korporacyjną programu Process Explorer (plik processexplorer.exe)… ;)
Między innymi o tym opowiadał Bruce Lawson z Opery w trakcie prezentacji „How to destroy the Web” (prawie cztery lata temu w Krakowie na SFI). Polecam poszukać na YouTube, rewelacyjnie się go słucha!
W mojej byłej już pracy działa taki filtr. Kiedyś pewna strona pracownicza została zablokowana, ponieważ w dolepianym do jej adresu tokenie znalazło się słowo 'porn’.
Wiem o jakie forum chodzi z abstrachowaniem :)
To samo forum miało też kiedyś problem w momencie gdy informatyk (znany z tego, że update’y były conajwyżej raz na tydzień) chciał wyciąć literkę k z wiadomo jakiego słowa i zastąpić ją gwiazdką. Niestety w niewłaściwym miejscu postawił nawias w kodzie i tak oto każde słowo z literką k, zawierało cudowną gwiazdkę :)
W pewnej firmie oprogramowanie DLP miało strzec nie tylko tajemnic korporacyjnych ale i „moralności”, w razie potrzeby ubijając podejrzane procesy. W tym czasie szef supportu ustalał z klientem format szablonu zgłoszenia supportowego dla pewnej aplikacji i zaproponował w mailu m.in. numerację zgłoszeń w typowym formacie APPNAME-XXX. Pożałował, bo nagle stracił możliwość używania Outlooka. Nie pamiętam, czy poradził sobie używając webmaila czy też musieli interweniować admini poczty…
Robiłem kiedyś snapshota repo Debiana w firmie. Filtr na proxy wyciął mi takie pliki:
http://ftp.pl.debian.org/debian/pool/main/n/nosexcover/python-nosexcover_1.0.7-1_all.deb
oraz:
http://ftp.pl.debian.org/debian/pool/main/c/cairo-dock-plug-ins/cairo-dock-alsamixer-plug-in_3.0.0-1_armel.deb
Gdy kilka lat temu wyszedł Starcraft II i Battle.net 2.0, gracze nie mogli pisać na chacie o „jednostkach naziemnych”. Cenzura wycinała słowo „nazi”.
to ja jeszcze dodam to :
Może nie bezpośrednio zwiazane z cenzura, ale heh..
Web Page Blocked
URL: http://www.backupcentral.com/phpBB2/two-way-mirrors-of-external-mailing-lists-3/emc-networker-19/...(tu konkretne tematy z forum)…/
Category: computer-and-internet-info
A ja nie miałem pojęcia dlaczego w korporacji mój przełożony dostał info z działu bezpieczeństwa o tym, co ja robię w pracy złego, bo szukałem info na temat firmy „Young & Rubicam” :-)
Na jednej z uczelni nie odbyło się seminarium nt. przemocy w sieci. Filtry skutecznie zablokowały sporą część przykładów.
Próbując wysłać z bramki Plusa SMS-a zawierającego „plus” lub „1,22” otrzymamy komunikat: „Treść wiadomości zawiera niedozwolone słowa”. Można mieć niezłą rozkminę, co się niby takiego wpisało, chcąc wysłać wiadomość o numerach linii tramwajowych lub o pluszowym misiu…
Z tą bramką plusa ciągle są problemy – nigdy nie wiadomo o jakie zakazane słowo może chodzić. Powstała nawet strona zbierająca listę tych słów metodą prób i błędów: https://niedozwoloneslowabramkaplus.wordpress.com/2012/11/01/lista-slow-niedozwolonych-w-darmowej-bramce-sms-plusa/
Gram w grę Clash of Clans, należę do klanu Siekatory ninja. Kiedy chciałem na czacie globalnym napisać „zapraszam do klanu Siekatory ninja” otrzymałem „zapraszam do kl*****iekatory ninja”
Mechanizm autocenzury widać jest niewrażliwy na spacje…
Ktos wie czy penisland.net sie kiedys skarzyl na te filtry?
Swoja droga przyjdzie pora na cenzurowanie Janusza bo zawiera „anus”;-)
Pozdrawiam
Dawno temu, kiedy SSD było tylko w labach – chciałem kupić kieszeń wstrząsoodPORNą na dysk. Potem jeszcze kieszeń wodoodPORNą na dokmenty (to z domu, ale akurat po VPNie do fabryki).
no i niezapomniane mypenisinyourcoffe.com
Również w Rzeszowskiej darmowej sieci: nie można była wejść na Wikipedię w temat oPORNik, oraz na forum SonyErissonXperia np (sexperia.pl).
Swojego czasu na pewnej stronie opisywano w j. angielskim pewną część aeroplanu, która nazywa się kokpitem. Niestety zamiast zmiany cock na penis, albo wee-wee – co by było najzabawniejsze `wee-weepit` wstawiało gwiazki. I weź tu czytaj artykuł o wyglądzie ****pitu, kiedy to w tym typie samolotów ****pit wyróżnia się na tle ****pitów modeli podobnej klasy.
a pamięta jeszcze ktoś jaką domenę miał kiedyś Wydział Chemii na Uniwersytecie Jagiellońskim? ;D
wchuj? :D
http://www.ch.uj.edu.pl/
Ach te straszne brzydkie słowa :-/ Tyle czasu i energii zmarnowano na bezsensowne „ukulturalnianie” wypowiedzi… Pfff…
W jeszcze dawniejszych czasach, CompuServe walczyło ze słowami „bitch” (co utrudniło życie posiadaczom psów płci żeńskiej), „breast” (później dodając wyjątek „chicken breast” po protestach gospodyń domowych) i paroma innymi.
Pomysły na algorytmiczne oczyszczenie sieci są starsze od Internetu ;-)
W url-u szły dane potraktowane zipem i urlencode. W ten sposób znalazła się fraza 32sEx678. Zablokowany dostęp do strony.
W zamierzchłych czasach na zarządzenie prezesa wprowadziłem filtry, m.in. na słowo porn,proxy usera który wyszukiwał hasło po trzech próbach odcinało pd dostępu do internetu na 24h. Po pierwszym dniu miałem zablokowany cały dział konstrukcyjny, filtr zadziałał na hasło:’stal żaroodporna’.
Nadgorliwy filtr miał (nie wiem, czy jeszcze ma, bo przestałem tam zaglądać) jeden z polskich serwisów torrent. Dawało to przekomiczne efekty przy streszczeniach filmów, można było przeczytać między innymi: „Młodzieniec zako się w dziewczynie…”
Pewien serwis kiedyś zażądał ode mnie przy rejestracji podania imienia i nazwiska. Jakże się zdziwiłem, gdy próbując podać fałszywe nazwisko „Kot” otrzymałem odpowiedź, że moje nazwisko jest za krótkie :P
kilka lat temu autokorekta na elektrodzie zamieniała wszystkie Radki na Radeony, co uniemożliwiało bezpośredni zwrot do wielu Radosławów.
Może to nie filtr do zakazanych słów ale nieudolna autokorekta: MS Word w wersji 2000 zmieniał automatycznie i bez ostrzeżenia „z uwagi na” na jeden wyraz: „wagina”.
o Homosexualu czytam już chyba czwarty raz, za każdym śmieję się tak samo xD