22.07.2015 | 10:19

Adam Haertle

Jak prosty błąd wdrożeniowca mógł wyłączyć rafinerię i spowodować milionowe straty

Gdy padły systemy elektrowni zasilającej rafinerię gazu ziemnego w USA, wszyscy wpadli w panikę. Brak prądu przez więcej niż kilka godzin oznaczał konieczność zatrzymania całej instalacji i straty przekraczające milion dolarów na godzinę.

Na Reddicie trafiają się czasem niezwykłe perełki – tym razem jest to relacja inżyniera sieci, który został wezwany do usunięcia poważnej awarii o nieznanych przyczynach. Rzadko trafiają się tak ciekawe historie z pierwszej ręki.

Sieć padła, dzwonimy po inżyniera

Problem zgłosiła ogromna rafineria gazu ziemnego w południowym Teksasie. Instalacja położona jest w regionie w którym brak wystarczających zasobów energii elektrycznej, więc by zapewnić sprawne jej działanie obok rafinerii powstała elektrownia o szczytowej mocy ponad 40 MW, również zasilana gazem ziemnym. Problem dotyczył właśnie elektrowni, a konkretnie jej sieci, która według zgłaszających padła.

Rafineria gazu ziemnego

Rafineria gazu ziemnego

Problem był poważny, ponieważ rafineria może działać bez wsparcia elektrowni jedynie przez kilka godzin – potem trzeba ją zatrzymać, co generuje ogromne straty. W momencie, gdy nasz bohater odebrał telefon, do zatrzymania rafinerii brakowało 6 godzin. Anonimowy bohater odebrał telefon, ponieważ to on konfigurował sieć w tej właśnie elektrowni.

Sieć nie była narażona na awarie. Odseparowana od świata, wyposażona jedynie w switche i okablowanie, łączyła wszystkie sterowniki przemysłowe, mierniki i inne elementy niezbędne do sterowania elektrownią. Gdy nasz bohater poinstruował pracownika na miejscu jak przeprowadzić proste testy typu ping, zorientował się, że sieć działa, a problem musi leżeć gdzie indziej. Poprosił zatem o zdalny dostęp przez specjalnie w tym celu wpiętego do sieci laptopa.

Baza jest, ale nie działa

Nasz bohater zalogował się na początku do konsoli systemu elektrowni i od razu znalazł znany wielu administratorom komunikat o treści Network Error: Cannot connect to database. Wiedział już też, że jego pierwsza część nie jest prawdziwa. Serwer bazodanowy z Windows Server 2012 i MSSQL działał, jednak proces SQL był wyłączony i próba jego uruchomienia kończyła się natychmiastowym zamknięciem. Powodowało to brak łączności z miernikami i sterownikami, a procedury bezpieczeństwa automatycznie wyłączały w takim wypadku turbiny.

Nasz bohater skontaktował się z dostawcą systemu sterowników przemysłowych jednak dowiedział się od niego, że konfiguracją serwera SQL zajmował się jeszcze inny podwykonawca, który jest akurat na urlopie. Do zamknięcia rafinerii pozostały 4 godziny, zatem zawzięty inżynier postanowił grzebać dalej samemu.

Niespodzianka

To, co znalazł w logach, jest godne utrwalenia w annałach klasyki wdrożeń. Był to komunikat o treści Invalid license data. Reinstall is required. Tak. Wdrożeniowcy bazy danych zapomnieli wgrać klucze licencyjne, przez co baza działała w trybie próbnym (trial) i po 180 dniach po prostu odmówiła dalszej współpracy.

Nasz bohater wspólnie z przypartym do muru dostawcą systemów sterowników wykonali następujące operacje:

  • podszycie się pod prezesa rafinerii, na którego wdrożeniowcy z nieznanych przyczyn zarejestrowali konto w systemie Microsoftu
  • zorientowanie się, że nie można otrzymać po prostu pliku licencji, tylko trzeba kupić dysk instalacyjny
  • zorientowanie się, że wdrożeniowcy kupili dysk instalacyjny, tylko zainstalowali bazę korzystając z kopii próbnej (trial)
  • pobranie dysku instalacyjnego
  • wyodrębnienie pliku licencji
  • wgranie pliku licencji bez potrzeby reinstalowania całego serwera (dzięki nieocenionym wskazówkom z Google)
  • zrestartowanie serwera i obserwowanie w rytm żarliwych modlitw jak sterowniki a po nich turbiny wracają do życia na pół godziny przed momentem w którym trzeba będzie zatrzymać rafinerię.

Inżynierowi gratulujemy wytrwałości, wdrożeniowcom gratulujemy kompetencji. Jak mówią na Reddicie, jedynym zaskoczeniem w tej historii jest fakt, że jednak kupili licencję.

Z podziękowaniami dla @szescstopni za wskazanie wpisu na Reddicie

Powrót

Komentarze

  • 2015.07.22 10:46 a

    I jak tu nie walczyc z piractwem

    Odpowiedz
  • 2015.07.22 11:16 Kp

    Wdrozeniowcow za jaja i do zamiatania podlog…

    Odpowiedz
  • 2015.07.22 11:24 Sopel

    Niebezpiecznik był szybszy ;)

    Odpowiedz
    • 2015.07.23 17:16 Adam

      Rzadki wyjątek od reguły…

      Odpowiedz
  • 2015.07.22 11:51 luk

    Ejj ten sam art jest na n…ku. W sumie i tak kopiujecie z redita, ale tak z ciekawosci. To czemu walkujecie takie same tematy?

    Odpowiedz
    • 2015.07.22 13:53 Adam

      Kiedyś nie pisaliśmy jak było na Niebezpieczniku, ale wielu czytelników mówiło, że nie zaglądają na Niebezpiecznika, więc staramy się w miarę możliwości pisać o wszystkim, co uznajemy za ciekawe.

      Odpowiedz
      • 2015.07.22 21:47 Huczas

        Dobre podejście, odkąd tam czytać przestałem tu znajduję dobre źródło ciekawych informacji.

        Odpowiedz
      • 2015.07.23 17:14 Adam

        Adamie. Piszcie, piszcie.
        Nie każdemu chce się włazić na trollecznika i inne tym bardziej, że u Was artykuły są dużo częściej i są ciekawsze już nie mówiąc o liście linków na weekend.
        Trollecznik ostatnio po słabym PRowaniu ostro spał, zamiast pisać, a u Was 4 dobre(!) arty w tym czasie poszły.
        No i przynajmniej u Was nie ma tego zrytego i wiecznie chełpiącego się stylu oraz tendencyjnych komentarzy.

        Odpowiedz
    • 2015.07.23 17:15 Adam

      To teraz wejdź jeszcze raz i popatrz, ile tematów trollecznik podebrał, i z iloma się spóźnił…

      Odpowiedz
  • 2015.07.22 13:04 ja

    a nie lepiej było postawić to na mysql zamiast na mssql :P

    Odpowiedz
    • 2015.07.22 19:35 Biały(J)stok

      Tylko NOSQL. Legia to stara …

      Odpowiedz
    • 2015.07.22 19:55 wer

      Jak widać jakiś (przy)głup postawił rozwiązanie na komercyjnym Windowsie. A trzeba było na Oracle :)

      Odpowiedz
      • 2015.07.23 13:16 adrb

        Ta… Oracle jest dobry tylko w jednym – dojeniu kasy.

        Odpowiedz
      • 2015.07.26 23:54 Hehacz

        Zastanawiam się dlaczego firmy są tak głupie i pchają się w komercyjne gó..a ? Kolego Wer lepiej sprawdź ceny produktów Orala… hehehe

        Odpowiedz
    • 2015.07.24 10:31 Andrzej

      Pisze się m$sql

      Odpowiedz
  • 2015.07.22 14:11 SzybkiLopez

    OFFTOPIC: nurtuje mnie ta kwestia od dłuższego czasu -> dlaczego niebezpiecznik wygląda jakby ktoś się na niego włamał i usunął szablon WP ? Białe tło, rozsypany CSS ? Czy to taki celowa „kreacja” ?

    Odpowiedz
    • 2015.07.22 15:58 Viper

      A nie na klikałeś czasem za wiele a adblocku kolego ? :D

      Odpowiedz
    • 2015.07.22 18:15 Łukasz

      Oni mają taki styl na stronę mobilną ustawiony.

      Odpowiedz
      • 2015.08.07 17:34 Francuz

        Fejsbukowa przeglądarka nie obsługuje //niebezpiecznik.pl/styles[…] etc. :)

        Odpowiedz
  • 2015.07.22 18:38 szteniek

    Lubię awarie z krótkim deadline-m

    Odpowiedz
  • 2015.07.22 18:46 q

    Znam ciekawy przypadek z akceleratora. Nie można było normalnie puści wiązki, bo ktos zostawił (albo specjalnie włożył) kawałek folii aluminiowej. Nie można tez rozłożyć tunelu przez dlugi czas (harmonogram nie pozwalał). Po kilku tygodniach prób udalo sie wytyczyć trajektorię wiązki ktoś nie kolidowała ze śmieciem.

    Odpowiedz
  • 2015.07.22 20:43 ww

    Lol. Widze ze koleś który wam podał temat rozkleił go wszedzie gdzie mógł a wy jak baranki powielacie, tak jak by inni nie umieli sami znaleść wątku, takich akcji są dziesiątki dziennie

    Odpowiedz
    • 2015.07.22 20:46 Adam

      Podeślij kilka z tych dziesiątków, chętnie napiszemy.

      Odpowiedz
    • 2015.07.22 21:38 Rafał

      Może ciężko Ci będzie w to uwierzyć, ale mam co robić ze swoim czasem ;) W ramach porannej/wieczornej wolnej chwili przeglądam blogi pokrywające się z moimi zainteresowaniami, ale nie mam czasu na wertowanie całego internetu.

      Odpowiedz
      • 2015.07.23 10:18 Chuck Norris

        Ja też nie mam czasu, ale dzisiaj już przewertowałem cały internet.

        Odpowiedz
  • 2015.07.23 15:21 Adam

    Kluczyk tu, kluczyk tam… i na wakacje bedzie komplet… :D
    Brakowało jedynie zapisu wdrożeniowca mówiącego „o pany, a kto wam to tu tak sp#####ł” :D.

    A hejterzy niech sobie hejty i trollecznika w turbinę wsadzą :D

    Odpowiedz
  • 2015.07.24 11:31 Artur

    Artykul ciekawy, ale najbardziej mnie powalily komentarze pod nim.
    Czy wszyscy juz tak bardzo przeszli do zaakceptowania stanu obecnego, ze nie zaskoczyly ich nastepujace fakty:
    a) podszycie sie pod prezesa rafinerii (przestepstwo kradziezy tozsamosci),
    b) kompletny brak procesu zarzadzania licencjami w tej elektrowni, brak zgodnosci z regulacjami NIST, nie stosowanie lub brak ITIL-a,
    c) brak testow BCP i realnych jego scenariuszy (lub testowanie najbardziej oczywistych),

    Na koniec pytanie: Kto z czytajacych tutaj administratorow nie weryfikuje konfiguracji i wdrozenia outsourcowanego?

    ps
    wiem ze life is brutal and full of zasadzkas ale nie ma sie co obrazac na zarzad, ze biora outsourcera do wdrozenia w ramach „decyzji biznesowej”

    Odpowiedz
    • 2015.07.25 18:39 Przemko

      > Czy wszyscy juz tak bardzo przeszli do zaakceptowania stanu obecnego, ze nie zaskoczyly ich nastepujace fakty:

      To się nie mieści w głowie, że gdzieś poza Polska może tak być, i takie informacje po prostu nie są przyjmowane do wiadomości.

      Odpowiedz
  • 2015.07.25 08:55 Michał

    Czyta się jak jakiś horror. ;-)

    Odpowiedz

Zostaw odpowiedź do Kp

Jeśli chcesz zwrócić uwagę na literówkę lub inny błąd techniczny, zapraszamy do formularza kontaktowego. Reagujemy równie szybko.

Jak prosty błąd wdrożeniowca mógł wyłączyć rafinerię i spowodować milionowe straty

Komentarze