greyicon blueicon

Fallstudie: Ausfall von Azure aktiviert parametrische Ausfallversicherung

Am 1. April 2021 kam es bei Microsoft Azure zu einem größeren Ausfall, der die Regionen East US und Central betraf. Unternehmen, die ihre Produktionssysteme über einen dieser Dienste betreiben, hatten fast zwei Stunden lang keine Serviceverfügbarkeit.

Dieser umfangreiche Ausfall betraf auch einen Parametrix-Kunden mit geschäftskritischen Systemen auf Azure in der Region East US direkt. Das Technologieunternehmen, das einen finanziellen Schaden, Imageschaden und Produktivitätseinbußen erlitt, erhielt die durch den Ausfall ausgelöste Entschädigung innerhalb von nur sechs (6) Tagen!

[ Ausfallzeiten können jederzeit auftreten | Sind Sie gegen finanzielle Schäden abgesichert? | Erfahren Sie mehr ]

Wie kam es zu der Azure-Ausfallzeit?

Am 1. April zeigte das Parametrix Monitoring System (PMS) an, dass Microsoft Azure aufgrund von DNS-Serverfehlern von etwa 23:00 Uhr für etwa 2 Stunden ausgefallen war. Dieser Ausfall wirkte sich auf die Azure VM (Virtual Machines) und die Azure SQL-Dienste aus.

Die DNS-Server von Azure ermöglichen die Auflösung von Domänennamen über die Microsoft Azure-Infrastruktur. Dieser Dienst wird nativ als Teil der Cloud in Form eines Netzwerkprotokolls bereitgestellt, wobei mehrere Azure-Dienste auf diese DNS-Server angewiesen sind.

Sowohl der VM-Computing-Service als auch der SQL-Datenbank-Service waren von diesen Fehlern betroffen. Azure-Kunden, die ihre Produktionssysteme auf einem dieser Dienste in den Regionen East US oder Central US betreiben, hatten für die Dauer des Ausfalls keine Service-Verfügbarkeit.

Was hat unser Monitoring-System erkannt?

Das Parametrix Monitoring-System erkannte den Ausfall unmittelbar nach Beginn und registrierte die Azure VM- und Azure SQL-Dienste, die in den Regionen East US und Central US betroffen waren. Die hohe Genauigkeit des Systems ermöglicht es, exakt zu erfassen, welche Dienste während eines Ausfalls betroffen waren, und detailliert zu erfassen, was bei den einzelnen Diensten nicht funktionierte.

Das System erkannte den Status “Nicht verfügbarer Dienst” bei Azure VM-Instanzen in der Region East US, wo die Fehlerquote 100 % betrug, und in der Region Central US, wo die Fehlerquote 50 % betrug. Der Ausfall des Azure SQL-Dienstes wirkte sich nur auf die Managementoperationen aus, nicht aber auf Instanzoperationen oder laufende Vorgänge.

Welche Erfahrungen hat unser Kunde gemacht?

Unser Kunde bestätigte die schwerwiegenden Auswirkungen des Ausfalls auf seinen Betrieb und seine Finanzen. Die geschäftskritischen Systeme des Unternehmens, die in den East US-Regionen von Azure betrieben werden, fielen für fast zwei Stunden aus. Beinahe sofort gingen Support-Tickets von Kunden ein, so dass viele Mitarbeiter des Support- und Technikteams mobilisiert werden mussten, um die Anfragen zu bearbeiten.

Der Ausfall beeinträchtigte nicht nur die Mitarbeiterproduktivität, sondern schadete auch dem Image des Unternehmens bei den Kunden, deren Geschäftsabläufe direkt betroffen waren. Bereits sechs (6!) Tage nach dem Ausfall hat der Versicherungsnehmer seine vereinbarte Entschädigungszahlung von Parametrix erhalten.

Ausfallzeiten können jederzeit auftreten
Sind Sie gegen finanzielle Schäden abgesichert?
Nehmen Sie Kontakt mit uns auf um mehr zu erfahren

Könnte Ihnen ebenfalls gefallen

IT-Ausfallzeiten können
jederzeit auftreten. Wir
sichern Sie finanziell ab.

Rectangle 573
Rectangle 775
Rectangle 659