211service.com
Der 150-Millionen-Dollar-Tippfehler von Amazon ist ein Blitzableiter für ein großes Cloud-Problem
Wenn Sie alle Ihre Daten in die Cloud stellen, möchten Sie, dass es eine gut gebaute Cloud ist. Diese Woche hat Amazon – der weltweit größte Anbieter solcher Infrastruktur – gezeigt, dass es noch an Baukompetenz mangelt.
Am Dienstag funktionierten große Teile des Internets einfach nicht mehr. Slack ließ die Leute nicht mit Kollegen kommunizieren, Trello ließ Sie kein Projekt verwalten und leider auch das MIT Technology Review Die Website ließ Sie nicht über neue Technologien lesen. Es gab auch Beschwerden über nicht ordnungsgemäß funktionierende Smart-Home-Hardware.
Der Grund: Das Cloud-Speichersystem S3 von Amazon ist ausgefallen . Amazon ist der weltweit größte Cloud-Computing-Anbieter, so dass viele Dienste, die darauf angewiesen sind, ebenfalls nicht richtig funktionieren konnten. Und das war nicht nur ein Ausrutscher: Die Behebung des Problems dauerte mindestens vier Stunden.
Es ist schwierig, die wahren Kosten eines solchen Ausfalls genau zu beziffern. Aber, laut der Wallstreet Journal , hat das Analyseunternehmen Cyence geschätzt, dass es S&P-500-Unternehmen mindestens 150 Millionen US-Dollar gekostet hat. Und das Verkehrsüberwachungsunternehmen Apica behauptet, dass 54 der Top-100-Online-Händler einen Einbruch der Website-Performance um mindestens 20 Prozent verzeichneten. Es führt also kein Weg daran vorbei, dass es teuer war.
Umso peinlicher ist der Grund, warum es passiert ist. In einem Aussage, was schief gelaufen ist , Amazon hat zugegeben, dass die Hauptursache des Ausfalls ein falscher Befehl war, der von einem Mitarbeiter in seiner Einrichtung in Nord-Virginia während der routinemäßigen Wartung ausgeführt wurde. Leider führte dies zu einer katastrophalen Kaskade von Ereignissen.
Der Mitarbeiter sollte eine kleine Anzahl von Servern offline nehmen, machte aber einen Fehler und nahm mehr Server als beabsichtigt heraus – einschließlich zweier, die für grundlegende Prozesse im gesamten System verwendet wurden. Der Fehler löschte im Wesentlichen die Fähigkeit der Einrichtung aus, Benutzeranfragen zu bearbeiten.
Amazon betreibt mehrere Cloud-„Bereiche“, die auf der ganzen Welt verstreut sind, und Kunden seiner Dienste können Dateien speichern und Code auf mehr als einem davon ausführen. Aber es ist teurer und wie das Register feststellt , selbst Unternehmen, die ihre Dienste in verschiedenen Regionen anbieten, stellten fest, dass ihre Systeme ausfielen, wahrscheinlich aufgrund von Kapazitätsproblemen.
Nur vier Tage vor dem Ausfall haben wir die inhärenten Risiken zentralisierter Webdienste beschrieben und über die Auswirkungen spekuliert, die zu spüren wären, wenn der Cloud-Dienst von Amazon ausfallen würde. Damals warnten wir davor, dass viel auf dem Spiel steht, und argumentierten, dass Sicherheit, Zuverlässigkeit und Kompetenz für Unternehmen, die zentralisierte Webdienste anbieten, von entscheidender Bedeutung – und vielleicht unterrepräsentiert – sind.
Amazon scheint zuzustimmen. Es hat bereits Sicherheitsvorkehrungen getroffen, damit Vorfälle wie der durch den ungeschickten Mitarbeiter in Zukunft nicht so viele Server so schnell herunterfahren können.
Das ist ein Anfang. An dieser Stelle ist jedoch klar, dass Cloud-Dienste zusätzliche Versicherungspolicen benötigen, wenn sie robust sein sollen. Amazon zum Beispiel hätte nicht einmal in der Lage sein dürfen, in eine Situation zu geraten, in der sein gesamtes Werk in Nord-Virginia auf einmal ausfallen könnte – stattdessen sollte es in separate Teilsysteme aufgeteilt werden, die unabhängig voneinander arbeiten.
Selbst dann können zentralisierte Webdienste immer noch anfällig sein. Wenn ein Hacker einen massiven Angriff auf einen einzelnen Anbieter richtet – zum Beispiel über ein Botnetz –, kann er immer noch große Teile des Webs wieder offline schalten. Aber zumindest wäre es nicht das Ergebnis eines Tippfehlers.
(Weiterlesen: Wallstreet Journal , T er registriert sich , AP , Amazon Web-Services , Zentralisierte Webdienste sind wunderbar – bis sie schiefgehen , 10 bahnbrechende Technologien: Botnets of Things )