5 lutego 2014

Incydenty w centrach danych, reakcja banku danych

Pytanie, które regularnie pojawia się w naszych dyskusjach, dotyczy ryzyka związanego z nieprzeprowadzeniem testów centrum danych podczas odbioru. Co właściwie osiąga przepis poprzez loadbanks?

Pierwszy element odpowiedzi leży na rysunku:
90 min.

Jest to średni czas w roku, w którym dochodzi do przerwania głównego zasilania centrum danych (20 000 V przychodzące). Jest to co najmniej 90 minut pracy na zasilaczu UPS i generatorach. Bank obciążeń zapewnia, że ten sprzęt będzie w tym czasie pracował. Co więcej, kilka incydentów & wypadków miało niefortunne konsekwencje dla użytkowników, a testowanie banku obciążenia jest jednym ze sposobów na zabezpieczenie się przed tymi wadami:

  • Poważny incydent w centrum danych DC2 Iliad/Online w Vitry sur Seine: 4 lipca 2013 r., po przerwie w dostawie energii elektrycznej w ErdF (20 000 V), generatory nie były w stanie przejąć obciążenia elektrycznego serwerów w centrum danych Iliad (spółka zależna Free). O godzinie 12.37 firma Online poinformowała swoich użytkowników, że 3 z jednostek zasilających w centrum danych DC2 w Vitry nie udało się uruchomić z powodu problemu mechanicznego. Przerwa ta związana jest z awarią trzech z sześciu generatorów w centrum danych w okresie krótszym niż godzina. Incydent ten spowodował przerwę w dostawie prądu w jednym z oddziałów centrum danych, przez co klienci nie mieli dostępu do swoich danych. Zlokalizowane w Vitry-sur-Seine centrum danych Iliad DC2 zajmuje 4,500m2 powierzchni pomieszczeń komputerowych. Dziś jest to jedno z referencyjnych centrów danych dla wielu specjalistów z branży internetowej, z ponad 500 klientami hostowanymi na 1600 szafach produkcyjnych. W porze obiadowej wiele usług i stron internetowych było niedostępnych przez długie minuty. Tak było w przypadku LaPoste.net, Pecheur.com, DoYouBuzz, Deezer, SensCritique, CleverCloud, ale także m.in. JDN. (Raport o incydencie: http: //forum.online.net/index.php?/topic/3332-incident-coupure-salle-103-rapport-dincident/ )
  • 29 i 30 października 2012: Sztorm Sandy spowodował przerwę w dostawie prądu w kilku centrach danych w New Jersey, USA, w wyniku powodzi, wysiłek związany z uruchomieniem centrum danych na generatorach przez 2 dni był doświadczony jako „bardzo trudny” przez CEO Datagram Alexa Reppena. Testy banku obciążenia zostały przeprowadzone krótko wcześniej i pozwoliły uniknąć awarii zasilania centrum danych. (Źródło: http: //www.datacenterknowledge.com/archives/2012/12/17/the-year-in-downtime-top-10-outages-of-2012/ )

Istnieje wiele innych przykładów zdarzeń, w których banki obciążeń okazały się przydatne w konserwacji zapobiegawczej.

Podziel się tą historią, wybierz swoją platformę!