Quand le cloud Amazon tousse c’est tout internet qui est malade, et comme qui dirait « c’est le ciel qui nous tombe sur la tête » …
Trêve de plaisanterie, vous avez sûrement remarqué que le 28 Janvier au soir certaines pages web incluant 54 des 10
Au final la vrai raison est tout autre et bien connu dans notre domaine, une erreur humaine et plus particulièrement une erreur de typo sur une commande. Celle-ci aurait du supprimer une petite quantité de serveurs en rapport avec un soucis de lenteur du système de facturation, mais au final une grande quantité de serveurs fut supprimée dont deux sous systèmes de gestion d’S3, d’où les problèmes de corruptions et de perte d’accès.
©thousandeyes.com
Le redémarrage ne s’est évidemment pas passé comme prévu avec quelque serveurs avec de gros uptimes rencontrant des problèmes de lenteur du aux safety checks d’intégrité au démarrage. Pour couronner le tout les services gérant les tableaux de bord (SHD) clients ont aussi été impactés, impossible donc de se rendre compte des problèmes, les checks étant tous au vert …