Categories: CloudCloud-Management

Router-Update legt Microsofts Online-Dienste lahm

Microsoft hat sich zu den Hintergründen der mehrstündigen Ausfälle von Teams, Exchange Online, Outlook und weiteren Diensten in der vergangenen Woche geäußert. Demnach führte ein Router-Update dazu, dass Azure, Microsoft 365 und die Power-Plattform für viele Kunden vorübergehend nicht zugänglich waren.

Vor Beginn der Störungen hatte Microsoft seine Kunden darauf hingewiesen, dass ein geplantes Update zu höheren Latenzen bei Zugriffen auf Azure, Microsoft 365 und Power BI führen können. Mit Beginn des Arbeitstages in Europa zeigte sich dann jedoch, dass das Update das Microsoft Wide Area Network (WAN) störte und es zu Verbindungsabbrüchen zwischen einzelnen Diensten in Microsofts Rechenzentren kam.

Alles beginnt mit einer neuen IP-Adresse

“Wir haben festgestellt, dass eine Änderung am Microsoft Wide Area Network (WAN) die Konnektivität zwischen Clients im Internet und Azure, die Konnektivität zwischen Regionen sowie die standortübergreifende Konnektivität über ExpressRoute beeinträchtigt hat”, teilte Microsoft nun mit. “Im Rahmen einer geplanten Änderung zur Aktualisierung der IP-Adresse auf einem WAN-Router veranlasste ein an den Router gegebener Befehl diesen, Nachrichten an alle anderen Router im WAN zu senden, was dazu führte, dass alle Router ihre Weiterleitungstabellen neu berechneten. Während dieser Neuberechnung waren die Router nicht in der Lage, die sie durchquerenden Pakete korrekt weiterzuleiten. Der Befehl, der das Problem verursachte, verhält sich auf verschiedenen Netzwerkgeräten unterschiedlich, und der Befehl war auf dem Router, auf dem er ausgeführt wurde, nicht mit unserem vollständigen Qualifizierungsprozess überprüft worden.”

Laut Microsoft hatte die Änderung auch Auswirkungen auch die Systeme, die automatisch die Funktion des WAN steuern und nicht regulär arbeitende Geräte im WAN identifiziert und entfernt. Auch das System zur Optimierung von Datenflüssen im Netzwerk sei betroffen gewesen. Das habe zu weiteren Paketverlusten geführt und einen manuellen Neustart der Systeme erforderlich gemacht.

Um ähnliche Vorfälle zu verhindern, blockiert Microsoft nun “die Ausführung von Befehlen mit großen Auswirkungen auf Geräte”. Außerdem müssten nun bei der Ausführung von Befehlen auf Netzwerkgeräten die Richtlinien für sichere Änderungen befolgt werden.

Stefan Beiersmann

Stefan unterstützt seit 2006 als Freier Mitarbeiter die Redaktionen von Silicon.de und ZDNet.de. Wenn andere noch schlafen, sichtet er bereits die Nachrichtenlage, sodass die ersten News des Tages meistens von ihm stammen.

Recent Posts

Europas RZ-Kapazität wächst bis 2027 um ein Fünftel

Laut Immobilienmarktbeobachter Savills entspricht dieser Ausbau dem jährlichen Energiebedarf von mehr als einer halben Million…

17 Stunden ago

Gartner: 2024 steigen die IT-Ausgaben weltweit um 7,5 Prozent

Den stärksten Anstieg im Vergleich zu 2023 zeigen Systeme für Rechenzentren und Software.

1 Tag ago

LLM-Benchmark für CRM

Laut Salesforce soll der LLM-Benchmark Unternehmen die Bewertung von generativen KI-Modellen für Geschäftsanwendungen ermöglichen.

1 Tag ago

Sicher in die KI-Ära

"Wir härten kontinuierlich unsere eigene Infrastruktur, um Sicherheitsvorfälle zu verhindern", sagt Sven Kniest von Okta.

2 Tagen ago

KI für IT-Security: Feuer mit Feuer bekämpfen

"Moderne IT-Infrastruktur kann gute Fachkräfte nicht ersetzen, aber sie kann die Symptome lindern", sagt Stephan…

3 Tagen ago

Metaversum: Arbeitsplatz der Zukunft mit dem Mensch im Mittelpunkt

Vom 17. bis 19. Juli findet das größte Event für Tech-Recruiting und Employer Branding auf…

4 Tagen ago