5 février 2014

Incidents dans data center, la réponse du banc de charge

Une question revient régulièrement dans nos échanges sur les risques d’une absence de test lors de la recette d’un data center. Qu’apporte concrètement une recette via des bancs de charge  ?

Un premier élément de réponse réside dans un chiffre : 90 minutes

C’est le temps moyen annuel de rupture d’alimentation électrique du réseau principal (arrivée 20 000V) d’un data center. C’est 90 minutes au moins de fonctionnement sur l’UPS et les groupes électrogène. Le banc de charge permet justement de s’assurer que ces équipements fonctionneront pendant ce labs de temps. Par ailleurs, plusieurs incidents & accidents ont eu des conséquences fâcheuses pour les utilisateurs, les tests avec bancs de charge sont un des moyens de se prémunir contre ces défauts :

  • Incident majeur sur le datacenter DC2 d’Iliad/Online à Vitry sur seine : le 4 juillet 2013, suite à une coupure de courant chez ErdF (le 20 000V), les groupes électrogènes n’ont pas réussi à reprendre la charge électrique des serveurs du data center d’Iliad (filiale de Free). À 12h37, Online a informé ses utilisateurs que 3 des groupes électriques du datacenter DC2 de Vitry n’avaient pu démarrer suite à un incident mécanique. Cette interruption est liée à la défaillance sur une période de moins d’une heure de 3 groupes électrogènes sur les 6 du datacenter. Cet incident s’est traduit par une coupure d’alimentation sur l’une des branches du datacenter et entraînent l’incapacité des clients à accéder à leurs données. Situé à Vitry-sur-Seine, le datacenter Iliad DC2 s’étale sur 4500m2 de salles informatiques. Il est aujourd’hui l’un des datacenters de référence pour de nombreux professionnels de l’Internet, avec plus de 500 clients hébergés sur 1600 baies en production. De nombreux services et sites Web ont été inaccessibles durant de longues minutes ce midi. Ce fut notamment le cas de LaPoste.net, Pecheur.com, DoYouBuzz, Deezer, SensCritique, CleverCloud, mais aussi le JDN, entre autres. (Rapport d’incident : http://forum.online.net/index.php?/topic/3332-incident-coupure-salle-103-rapport-dincident/ )
  • 29 et 30 octobre 2012 : Tempête Sandy provoque une coupure de courant de plusieurs data center à New Jersey aux Etats-Unis, suite aux inondations, les efforts pour faire tourner le data center sur les groupes électrogènes pendant 2 jours ont été vécu « comme très difficile » par le PDG Datagram Alex Reppen. Les tests avec banc de charge avaient été effectués peu de temps auparavant et ont permis d’éviter une rupture d’alimentation data center. (Source : http://www.datacenterknowledge.com/archives/2012/12/17/the-year-in-downtime-top-10-outages-of-2012/ )

Il existe de nombreux autres exemples d’incidents pour lesquels les bancs de charge avaient montré leur utilité en maintenance préventive.

Share This Story, Choose Your Platform!