Datenverlust von virtuellen Servern

Aus Thomas-Krenn-Wiki
Zur Navigation springen Zur Suche springen

Bei Datenverlust von virtuellen Servern ist besondere Vorsicht geboten, denn kleine Fehler haben gerade in diesem Umfeld meist große Auswirkungen. Dies gilt umso mehr, wenn gleichzeitig Beschädigungen am Host-System aufgetreten sind, sei es hardware- oder softwareseitig. Die Ursachen für Datenverlust virtueller Server können vielfältig sein. Umso wichtiger ist es daher, die Ursache für den Datenverlust zu identifizieren, damit im nächsten Schritt die korrekten Maßnahmen eingeleitet werden können.

Partnerbeitrag von Attingo Datenrettung

Ursachen

  • Ausfall des Servers / Storages / RAIDs
    Häufig befinden sich mehrere virtuelle Systeme auf einem leistungsstarken RAID-Storage (oder wenigen Storage-Servern). Bei Ausfall des Hardware-Storages sind zeitgleich alle sich darauf befindlichen virtuellen Server nicht mehr verfügbar. Ein defekter RAID-Controller sowie mehrere ausgefallene Festplatten aus dem RAID-Verbund sind hierbei die häufigsten Ursachen (näheres finden Sie auch unter RAID Datenrettung).
  • Beschädigung des HOST – Dateisystems
    Beschädigungen im Host-Dateisystem können zu Datenverlust von virtuellen Servern führen. Die Ursachen hierfür können vielfältig sein, die häufigsten Gründe sind defekte Sektoren, eine fehlerhafte Dateisystemprüfung sowie Viren oder Trojaner. Als Folge können fehlerhafte bzw. unvollständige Verzeichnisstrukturen auftreten. In sehr schweren Fällen lässt sich das Host-System nicht mehr starten.
  • Beschädigung des Guest – Dateisystems
    Beschädigungen des Guest-Systems treten meist als Folge eines defekten Host-Dateisystems oder aufgrund defekter Sektoren auf. Mitunter lassen sich andere Dateien problemlos öffnen, während sich das Guest-Image nicht mehr initialisieren lässt. Oftmals liegt die Ursache im ungeplanten Ausschalten der Systeme, beispielsweise durch einen Stromausfall ohne USV.
  • Löschen virtueller Maschinen oder Snapshots
    Ein versehentliches Löschen virtueller Server ist eine nicht zu unterschätzende häufige Fehlerursache. Teilweise reicht nur ein Mausklick, um einen ganzen virtuellen Server zu löschen. Dies passiert meist, wenn mehrere Testumgebungen angelegt werden und diese falsch oder unzureichend benannt werden und versehentlich das operative System gelöscht wird. Ebenso können irrtümlich und aus Unwissen der technischen Details Snapshots bzw. inkrementelle Dateien gelöscht werden, wodurch gar nichts mehr geht oder nur noch ein alter Datenstand vorhanden ist.

Verhalten im Ernstfall

Techniker im Reinraumlabor bei Attingo untersucht eine offene Festplatte
  • Bei versehentlichem Löschen virtueller Server ist es wichtig, den Host-Server sofort auszuschalten und nicht mehr zu verwenden, auch wenn das einen kurzzeitigen Stillstand möglicher weiterer aktiver virtueller Server bedeuten kann. Dies verhindert beispielsweise, dass Run-Listen überschrieben werden. Gleiches sollte auch bei Beschädigungen des Host- bzw. Guest-Dateisystems erfolgen. Ein fehlerhaftes chkdsk/fsck kann schwere logische Schäden nach sich ziehen.
  • Bei Ausfall des Servers / Storages / RAIDs sollte man sich vor allem der Risiken eines fehlerhaften oder fatalen Rebuilds bewusst sein. Nicht selten ist vor Ausfall des Systems schon eine Festplatte unbemerkt ausgefallen und das System lief über einen bestimmten Zeitraum im Degraded-Mode. Ein Fatales Rebuild kann vollständigen Datenverlust der virtuellen Maschinen zur Folge haben.

Präventive Maßnahmen

  • Cluster-Systeme
    Clusterverbunde erhöhen nicht nur die Performance, sondern dienen vor allem auch der Verfügbarkeit. So werden Hochverfügbarkeitscluster für eine bessere Ausfallsicherheit eingesetzt.
  • Vollständige Dokumentation
    Eine vollständige Dokumentation der virtuellen Server, RAID-Level, LUNs, Betriebs- und Dateisysteme können vor falschen Handlungen schützen. Je vollständiger die Dokumentation, desto besser können administrative Fehler vermieden werden oder im Notfall eine eventuelle Datenrettung erleichtert werden. Neben unvollständigen Backups ist eine unvollständige Dokumentation eine der häufigsten Ursachen für Datenverlust.
  • Vollständige Backups
    Je besser das System gesichert ist, desto geringer sind die Folgen eines Datenverlusts. Des Weiteren sollte auch in regelmäßigen Abständen das erstellte Backup auf logische Verfügbarkeit, Konsistenz und Inhalt überprüft werden.


Foto Attingo Datenrettung.jpg

Autor: Attingo Datenrettung

Attingo Datenrettung ist führender europäischer Anbieter von Datenrettungen. Eine Datenrettung umfasst die Rekonstruktion von Daten, die durch Löschung, Formatierung, technischen Defekt, Manipulation, Sabotage oder mechanische Einflüsse wie Wasser oder Feuer beeinträchtigt wurden. Das Unternehmen betreibt dazu modernste Reinraumlabors in Wien, Hamburg und Amsterdam und verfügt über Experten mit jahrelanger Erfahrung. Die Prozessabläufe der Attingo Datenrettung sind nach ISO 9001:2015 zertifiziert und werden regelmäßig durch Bureau Veritas überwacht. Attingo ist in Notfällen für seine Kunden 24 Stunden an 7 Tagen die Woche zu erreichen: +49 40 54 88 75 60 oder +43 1 236 01 01


Das könnte Sie auch interessieren

File System Alignment in virtualisierten Umgebungen
VM Migration von Intel Xeon zu AMD EPYC und umgekehrt
Vorraussetzungen für High Availability HA in virtuellen Umgebungen