5 Febbraio 2014
Incidenti nei centri dati, la risposta dei banchi di carico
Una domanda che emerge regolarmente nelle nostre discussioni è quella relativa ai rischi di non testare un data center in fase di accettazione. Cosa si ottiene effettivamente con una ricetta tramite loadbank?
Il primo elemento della risposta sta in una cifra:
90 minuti
È il tempo medio all’anno in cui l’alimentazione principale di un data center (20.000 V in entrata) viene interrotta. Si tratta di almeno 90 minuti di funzionamento dell’UPS e dei generatori. Il banco di carico garantisce il funzionamento dell’apparecchiatura durante questo periodo. Inoltre, diversi incidenti e inconvenienti hanno avuto conseguenze spiacevoli per gli utenti e i test sui banchi di carico sono un modo per prevenire questi difetti:
- Grave incidente al centro dati DC2 di Iliad/Online a Vitry sur Seine: il 4 luglio 2013, a seguito di un’interruzione di corrente all’ErdF (la 20.000V), i generatori non sono stati in grado di assumere il carico elettrico dei server del centro dati di Iliad (una filiale di Free). Alle 12.37 Online ha informato i suoi utenti che 3 delle unità di alimentazione del centro dati DC2 di Vitry non si erano avviate a causa di un problema meccanico. L’interruzione è legata al guasto di tre dei sei generatori del centro dati in un periodo inferiore a un’ora. Questo incidente ha provocato un’interruzione di corrente in una delle filiali del datacenter, impedendo ai clienti di accedere ai propri dati. Situato a Vitry-sur-Seine, il datacenter Iliad DC2 si estende su 4.500 m2 di sale computer. Oggi è uno dei data center di riferimento per molti professionisti di Internet, con oltre 500 clienti ospitati su 1600 rack in produzione. Molti servizi e siti web sono stati inaccessibili per lunghi minuti all’ora di pranzo. È il caso di LaPoste.net, Pecheur.com, DoYouBuzz, Deezer, SensCritique, CleverCloud, ma anche di JDN, tra gli altri. (Rapporto sull’incidente: http: //forum.online.net/index.php?/topic/3332-incident-coupure-salle-103-rapport-dincident/ )
- 29 e 30 ottobre 2012: la tempesta Sandy ha causato un’interruzione di corrente in diversi data center nel New Jersey, USA, a causa delle inondazioni; lo sforzo di far funzionare il data center con i generatori per 2 giorni è stato giudicato “molto difficile” da Alex Reppen, CEO di Datagram. I test del banco di carico sono stati effettuati poco prima e hanno evitato un’interruzione dell’alimentazione del centro dati. (Fonte: http: //www.datacenterknowledge.com/archives/2012/12/17/the-year-in-downtime-top-10-outages-of-2012/ )
Esistono molti altri esempi di incidenti in cui i banchi di carico si sono rivelati utili per la manutenzione preventiva.