Standort: fm4.ORF.at / Meldung: " Dunkle Wolken über Cloud-Computing "

Musik, Film, Heiteres

Erich Moechel

Erich Moechel

Netzpolitik, Datenschutz - und Spaß am Gerät.

1. 7. 2012 - 19:05

Dunkle Wolken über Cloud-Computing

Beunruhigend am neuesten Ausfall von Teilen der Cloud-Dienste Amazons ist, dass der Streamingservice Netflix trotz voller Sicherung in zwei weiteren Datenzentren für 25 Millionen Kunden zwölf Stunden nicht erreichbar war.

Von Freitagabend an über das gesamte Wochenende hatten die Techniker des Cloud-Anbieters Amazon Hochbetrieb, ebenso wie das technische Personal großer Web-2.0-Anbieter wie Netflix, Pinterest oder Instagram Extraschichten fahren musste. Diese und eine nicht bekannte, aber bedeutende Zahl kleinerer Webservices war ab Freitagabend mehr als zwölf Stunden ebenso nicht erreichbar, weitere Dienste fielen am Samstagmorgen aus.

Allein beim Streamingdienst Netflix waren 25 Millionen Kunden betroffen, denn auch die an sich umfassenden Sicherheitsmaßnahmen von Netflix konnten den Ausfall nicht verhindern. Obwohl die Daten in drei verschiedenen Amazon-Centers redundant gehostet waren, war Netflix zwölf Stunden nicht erreichbar. Es war der zweite Ausfall eines Netzwerkcenters von Amazon innerhalb von zwei Wochen, in beiden Fällen waren Unterbrechungen in der Stromversorgung die Auslöser.

Unwetter in der Cloud

Nach schweren Unwettern war das Datencenter US-East-1 in Ashburn, Virginia gerade einmal 30 Minuten ohne Strom. Von der Papierform her müsste ein Datencenter eine solch kurze Ausfallsperiode mit seinen UPS-Speicherbatterien ("Uninterruptable Power Supply") in Kombination mit den üblichen Dieselaggregaten eigentlich locker überstehen.

Dem war nicht so. Die halbe Stunde Stromausfall löste nämlich eine Reihe weiterer Vorfälle aus, die zusammen dafür sorgten, dass die Probleme eskalierten. Einzelheiten gibt es seitens Amazons zwar kaum bis wenig, dennoch ist dieser Großausfall in seinen Strukturen relativ gut nachzuvollziehen.

Dave Farber, emeritierter Professor für Highspeed Networking und Koryphäe auf diesem Gebiet hatte anläßlich des Amazon-Ausfalls 2011 vor den "gefährlichen Vereinfachungen" gewrant, die komplexe, wechselseitige Vorgänge so simplifizierten, dass falsche Vorstellungen von Sicherheit entstünden. Die derzeitige Praxis des "Cloud-Computing ist zwar ein Musterbeispiel eines verteilten Rechensystems - aber eines, das alle Lehren aus den Experimenten der Vergangenheit großzügig ignoriert", so Farber vor etwa einem Jahr zu ORF.at.

Der Hergang des Ausfalls

Der Ausfall eines bedeutenden Elements im Datencenter führte dazu, dass ganze Serverbatterien plötzlich keine Verbindung mehr zu ihren Back-Ups hatten. Immer mehr virtuelle Maschinen versuchten deshalb, Ad-Hoc-Sicherheitskopien anzulegen, Datenverkehr und Speicherauslastung stiegen in den noch funktionierenden Sektoren von US-East-1 sprunghaft an.

Das Ausmaß des Absturzes lässt sich anhand des mit 25 Millionen Kunden weltweit zweitgrößten Streaming-Anbieters Netflix in etwa erahnen. Wenn nur ein Teil der ungeheuren Detnvolumina, die da rund um die Uhr bewegt werden, spontan in andere Routen umgeleitet werden muss, steigt die Gefahr, dass die dort laufenden Dienste so in Mitleidenschaft gezogen werden, dass sie ihrerseits Daten puffern müssen.

Böses Novum zur Redundanz

Der letzte große Ausfall eines Teils der Amazon-Cloud im April 2011 war genau so verlaufen, denn irgendwann war die Speicherkapazität des Rechenzentrums erschöpft. Das hatte einen dreitägigen Ausfall für jene Dienste zur Folge gehabt, die nur eine "Zone", also ein Amazon-Datenzentren gebucht haben.

Das Novum diesmal aber ist insofern beunruhigend, weil passiert ist, was im Cloud-Computing angeblich ausgeschlossen ist: Obwohl Netflix in drei verschiedenen Amazon-Centers redundant gehostet wird, verschwand der Service aus dem Netz.

Das sagt Netflix

"Wir haben nur in einer Zone Hardware verloren, die Backups sind auf drei Zonen verteilt. Das Proplem war, dass die Verbindungen zwischen den Zonen unterbrochen waren", schrieb der Netflix-Technikchef am Samstag via Twitter.

Entweder der Stromausfall selbst, oder seine kaskadierenden Folgen hatten auch die Anbindungen von US-East-1 an die Glasfasernetze so in Mitleidenschaft gezogen, dass die Datenmengen nicht mehr abtransportiert werden konnten. Damit funktionierte auch der Lastenausgleich ("Load Balancing") mit anderen Amazon-Datenzentren nicht mehr.

Wen der Ausfall kalt ließ

Wieviele Services insgesamt betroffen waren, weiß wohl nur Amazon selbst. Am Samstagmorgen fiel zum Beispiel auch der bei Amazon gehostete Web-2.0-Dienst QRZ.com für etwa zwölf Stunden aus. Als wohl einzige Betroffene ließ der Ausfall die etwa 600.000 regelmäßigen Benutzer dieses 1993(!) gegründeten sozialen Netzwerks ziemlich kalt. Diese User sind auf Netzwerke angewiesen, weil sie in erster Linie direkt kommunizieren.

QRZ.com listet nämlich die Basisdaten von 1,25 Millionen Funkamateuren rund um die Welt, benutzt wird der Dienst in erster Linie, um zusätzliche Informationen über die Funkstation und ihren Betreiber nachzuschlagen, mit man gerade Funksprüche wechselt.

Haftungsausschluss

Die ORF.at-Foren sind allgemein zugängliche, offene und demokratische Diskursplattformen. Die Redaktion übernimmt keinerlei Verantwortung für den Inhalt der Beiträge. Wir behalten uns aber vor, Werbung, krass unsachliche, rechtswidrige oder beleidigende Beiträge zu löschen und nötigenfalls User aus der Debatte auszuschließen. Es gelten die Registrierungsbedingungen.

Forum

Zum Eingabeformular Kommentieren

  • arnonymous | vor 323 Tagen, 19 Stunden, 38 Minuten

    hmm

    dunkle wolken über amazon schon eher. die anderen blieben ja online, von sfdc über ms und goog.

    die amazon cloud ist ein abfallprodukt ihrer überschüssigen rechenleistung - nicht gerade von grund auf für sicheres 3rd party hosting gedacht. schön billig halt, you get what you pay for. die ganzen startups könnten sich was vergleichbares mit mehr uptime eh nicht leisten...

    Auf dieses Posting antworten
    • tantejutta | vor 323 Tagen, 17 Stunden, 7 Minuten

      amazon idt schon lang nimmer der

      günstigste Service, aber der dickste---

    • arnonymous | vor 323 Tagen, 12 Stunden, 3 Minuten

      naja, vergleichbares (auch in performance, etc) ist eigentlich überall teurer.

      netflix ist eh bald von amazon runter, die schrauben schon länger an ihrem eigenen hosting.

      heroku war betroffen, gehört ja mittlerweile zu sfdc, da kanns auch nicht mehr lang dauern.

      google hat grad compute gelauncht, ms azure wirbt wie dumm - amazon bekommt endlich gscheite konkurrenz.

    • tantejutta | vor 323 Tagen, 7 Stunden, 12 Minuten

      Roger alles, seh ich ebenso

      Da wurde offenbar bei der Infrastruktur gespart. An der Peripherie mein ich: Routen nach draußen ohne echte Redundanz usw. Die Preise im großen B2B Bereich verfallen ja bereits. Es gibt in den USA ja haufenweis kleinere Anbieter und Cloud-Startups. Paar haben schon ins Gras gebissen.
      Kilo tnx 4 Details! War Neues für unsereins dabei;)

    • arnonymous | vor 323 Tagen, 5 Stunden, 44 Minuten

      http://www.macobserver.com/tmo/article/apple_os_x_veteran_bertrand_serlet_shows_up_there/

      :)

    • arnonymous | vor 323 Tagen, 5 Stunden, 42 Minuten

      in kurz, working link: http://bit.ly/LKGhR0