Ausfall des Root-Server

Am Samstag den 05.07.2014 um 06:48 Uhr ist der Root-Server und damit alle verbundenen Dienste ausgefallen. Das System wurde durch einen manuellen Reset eines RZ-Mitarbeiters wieder gestartet. Danach wurden alle Dateisysteme und Datenbanken auf Konsistenz geprüft. Ab 12:08 Uhr standen wieder alle Dienste wie gewohnt zur Verfügung.

Der gesamte Ausfall hat 5 Stunde und 22 Minuten gedauert. Die Verfügbarkeit für das Jahr 2014 sinkt damit auf 99,58%. Damit werden die SLA’s noch knapp erreicht.

Die Dauer der Ausfalls wurde durch einen Memtest leider erhöht. Dafür ist nun sicher, dass fehlerhafte Bereiche im Arbeitsspeicher für den Ausfall gesorgt haben. In den nächsten Wochen ist ein Umzug auf neue Hardware geplant, um die Verfügbarkeit wieder zu erhöhen.