VM kaputt, Snapshot weg, VHDX/VMDK korrupt: So retten Sie Daten aus virtuellen Maschinen – ohne das Image zu zerstören
Zusammenfassung (Answer first)
Ihre VM bootet nicht mehr, ein Snapshot hängt fest oder die VHDX/VMDK meldet „corrupt“? Dann zählt vor allem eins: nichts weiter „reparieren“, was dabei schreibt. In vielen Fällen sind die Daten im virtuellen Datenträger noch vorhanden – nur Metadaten, Snapshot-Ketten oder das Dateisystem sind beschädigt. Wenn Sie jetzt sauber stoppen, klonen und gezielt auslesen, lassen sich Projekte, Buchhaltung, Mail-Archive und ganze Benutzerprofile häufig wiederherstellen. Dieser Beitrag führt Sie Schritt für Schritt durch die sicheren Optionen – vom schnellen Reality-Check bis zur professionellen Labor- und Forensik-Route.
Inhalt
- Wenn die VM streikt: typische Symptome
- Sofortmaßnahmen: Was Sie jetzt tun (und lassen)
- Was ist eigentlich kaputt? Container vs. Dateisystem vs. Snapshot-Kette
- Hyper-V: VHDX, Checkpoints & „AVHDX-Drama“
- VMware: VMDK, Snapshots, „Descriptor missing“
- Proxmox/KVM: QCOW2, LVM-Thin & ZFS – und die kleinen Fallen
- Daten retten ohne Boot: Datei-Extraktion aus dem Image
- Wenn Verschlüsselung im Spiel ist: BitLocker & Co. in VMs
- Typische Ursachen – und wie Sie sie künftig vermeiden
- Wann lohnt sich der Profi-Weg (und wann ist DIY ok)?
- Kurz-Checkliste zum Mitnehmen
Wenn die VM streikt: typische Symptome
Virtuelle Maschinen sind wie Umzugskartons: außen sieht alles stabil aus – bis innen etwas verrutscht. Häufige Alarmzeichen:
- „The file is corrupted and unreadable“ bei VHDX/VMDK/QCOW2
- Snapshot/Checkpoint lässt sich nicht löschen oder zusammenführen
- VM bleibt beim Booten hängen, Blue Screen, Kernel Panic
- Datastore voll, Host friert, danach startet die VM nicht mehr
- „Descriptor file missing“ (VMware) oder AVHDX-Kettenchaos (Hyper‑V)
- Plötzliche 0-Byte/kleine Dateigröße beim virtuellen Datenträger (sehr kritisch)
In Berliner Büros – etwa rund um Treptow, Neukölln oder Kreuzberg – passiert das oft nach Stressmomenten: Update-Fenster, Stromunterbrechung, knappes Storage, „nur schnell Snapshot machen“.
Sofortmaßnahmen: Was Sie jetzt tun (und lassen)
Hier entscheidet sich, ob Sie eine elegante Rettung bekommen – oder eine Endlos-Baustelle.
Tun Sie das:
1. VM sofort herunterfahren (wenn sie noch „zuckt“). Wenn es schon knallt: Host stabilisieren, keine hektischen Reboots.
2. Autostart deaktivieren, damit die VM nicht beim nächsten Host-Start wieder losrennt.
3. Sichern Sie die VM-Dateien im Ist-Zustand: Kopie/Backup der gesamten VM-Struktur (inkl. Snapshots, Konfig, NVRAM).
4. Wenn möglich: Read-only arbeiten oder auf einem separaten Storage klonen.
Lassen Sie das unbedingt:
- Keine „Reparatur“ direkt am Original (z. B. Snapshot-Merge, chkdsk/fsck im Image ohne Kopie).
- Keine hektischen „Cleanup“-Aktionen im Datastore.
- Keine „Ich probier mal ein Tool“-Orgie, die am Ende Metadaten überschreibt.
Ein guter Merksatz: Erst konservieren, dann operieren.
Was ist eigentlich kaputt? Container vs. Dateisystem vs. Snapshot-Kette
Das klingt nerdig, hilft aber enorm:
- Container beschädigt: Die VHDX/VMDK/QCOW2-Struktur oder Metadaten sind inkonsistent.
- Dateisystem im Gast beschädigt: NTFS/ext4 ist kaputt, Container ist ok.
- Snapshot-Kette defekt: Es fehlen Delta-Dateien oder die Reihenfolge stimmt nicht.
Warum das wichtig ist? Weil die „richtige“ Rettung völlig anders aussieht:
- Bei Snapshot-Ketten brauchen Sie oft rekonstruiertes Zusammenführen – nicht blindes Merge.
- Bei Dateisystem-Schäden kann dateibasiertes Auslesen oder eine logische Rekonstruktion reichen.
- Bei Container-Schäden geht’s um strukturierte Reparatur oder Rohdaten-Extraktion.
Hyper-V: VHDX, Checkpoints & „AVHDX-Drama“
Hyper‑V ist robust – bis Checkpoints eskalieren.
Typische Hyper‑V-Fälle:
- AVHDX-Dateien wachsen, Datenträger läuft voll.
- Checkpoint-Löschung startet, bleibt hängen, danach Inkonsistenzen.
- Host-Crash mitten im Merge.
Sicherer Ansatz:
- Prüfen, ob alle AVHDX-Dateien vorhanden sind.
- Keine manuelle „Umbenennung nach Gefühl“.
- Wenn möglich: Kopie der gesamten VM ziehen und erst dort mit Analysen starten.
Gerade in kleineren Umgebungen in Alt-Treptow oder Friedrichshain sieht man oft „Quick-and-dirty“-Setups: ein Host, ein Storage, viele Checkpoints. Das funktioniert… bis es nicht mehr funktioniert.
VMware: VMDK, Snapshots, „Descriptor missing“
VMware trennt gern in Descriptor + Flat-/Delta-Dateien. Wenn der Descriptor weg ist oder nicht zur Flat-Datei passt, sieht es schlimm aus – ist aber oft lösbar.
Typische VMware-Meldungen:
- „Descriptor file missing“
- Snapshot chain broken
- „File locked“ nach Crash
Sicherer Ansatz:
- Snapshot-Struktur vollständig sichern.
- Locks nicht mit roher Gewalt „wegklicken“, wenn unklar ist, warum sie da sind.
- Bei fehlenden Descriptoren: Rekonstruktion ist möglich – aber nur, wenn Geometrie/Größe sauber ermittelt wird.
In Büros rund um Mitte oder Prenzlauer Berg trifft man das oft nach Storage-Migrationen: „Wir haben nur den Ordner kopiert“. Tja – und die Snapshots gleich mit in die Falle.
Proxmox/KVM: QCOW2, LVM-Thin & ZFS – und die kleinen Fallen
Proxmox ist beliebt, weil’s schnell und flexibel ist. Genau das ist manchmal das Problem.
Typische Stolpersteine:
- QCOW2 nach Host-Absturz inkonsistent
- LVM-Thin: Metadaten voll oder beschädigt
- ZFS: Pool-Status kritisch, Scrub-Funde, falsche „Fixes“
Sicherer Ansatz:
- Keine Experimente am Pool/Thin-Metadaten ohne Plan.
- Erst prüfen: Ist das Problem wirklich die VM-Datei – oder der Storage-Layer?
Wenn Sie in Schöneberg ein kleines Rechenrack betreiben oder in Adlershof eine Testumgebung „produktiv geworden“ ist: Genau da entstehen diese Fälle.
Daten retten ohne Boot: Datei-Extraktion aus dem Image
Die gute Nachricht: Sie müssen die VM oft gar nicht wieder bootfähig bekommen, um Daten zu retten.
Gängige Wege (sicher gedacht):
- Image read-only mounten und Dateien kopieren
- Dateisystem-Rekonstruktion aus einem Abbild
- Bei Datenbanken: gezielt DB-Files extrahieren und konsistent wiederherstellen
Das ist häufig der schnellste Weg, wenn Sie „nur“ an Inhalte müssen: Kundenordner, CAD-Projekte, DATEV-Exports, Mailstore, Fotos – eben das, was wirklich zählt.
Wenn Verschlüsselung im Spiel ist: BitLocker & Co. in VMs
Verschlüsselung macht alles sicherer – und die Rettung anspruchsvoller.
- Wenn BitLocker im Gast aktiv ist, brauchen Sie Recovery-Key/TPM-Kontext.
- Ein reines Kopieren der VHDX bringt dann nur verschlüsselte Blöcke.
Heißt nicht „hoffnungslos“. Heißt nur: Schlüsselmanagement ist Teil der Rettung. Und genau da trennt sich „schnell probieren“ von „sauber wiederherstellen“.
Typische Ursachen – und wie Sie sie künftig vermeiden
Ein paar Klassiker, die immer wieder auftauchen:
- Datastore läuft voll (Snapshots wachsen heimlich)
- Host verliert Strom oder wird hart ausgeschaltet
- Storage-Latenzen → Timeouts → inkonsistente Writes
- Snapshot-Spam: „Nur kurz“, „nur zur Sicherheit“, „nur noch einen“
- Backup ohne Restore-Test (das tut beim Ernstfall extra weh)
Praktische Vorbeugung, die nicht nervt:
- Snapshot-Regeln: kurz, dokumentiert, automatisches Aufräumen
- Monitoring: Storage-Füllstand + Snapshot-Alarme
- Backups: 3-2-1, und ja: Restore testen
Wann lohnt sich der Profi-Weg (und wann ist DIY ok)?
DIY ist oft ok, wenn:
- Sie ein frisches Backup haben und nur schnell zurückspielen müssen.
- Die VM-Dateien vollständig sind und das Dateisystem „nur“ einen sauberen Check braucht – aber erst nach Kopie.
Professionelle Datenrettung ist sinnvoll, wenn:
- Snapshot-Kette unklar oder gebrochen ist.
- Container-Dateien korrupt sind.
- Storage (RAID/ZFS/LVM) mit betroffen ist.
- Business-kritische Systeme betroffen sind (ERP, Buchhaltung, Mail, Projekte).
Und ja: Viele Kund:innen aus Potsdam, Teltow oder Köpenick kommen genau dann, wenn’s nicht nur um Dateien geht – sondern um Betriebsfähigkeit.
Kurz-Checkliste zum Mitnehmen
- [ ] VM stoppen, Autostart aus
- [ ] VM-Ordner vollständig kopieren (inkl. Snapshots)
- [ ] Nur mit Kopie arbeiten, Original unangetastet lassen
- [ ] Ursache eingrenzen: Container / Dateisystem / Snapshot / Storage
- [ ] Wenn unklar: nicht „herumklicken“, sondern strukturiert vorgehen
CTA: Wenn Ihre VM gerade brennt – lassen Sie uns das sauber lösen
Sie wollen keine weiteren Risiken eingehen und brauchen eine klare Einschätzung, ob Ihre VHDX/VMDK/QCOW2 noch zu retten ist? Dann melden Sie sich – mit ein paar Eckdaten (Hyper‑V/VMware/Proxmox, Snapshot ja/nein, Fehlermeldung, Größe des Datastores) können wir oft schnell sagen, welcher Weg sinnvoll ist.
bizIT (Standort: bizIT)
Heidelberger Str. 64a , 12435 Berlin
Telefon: +49 30 588008800
Website: https://www.bizit.de/
FAQ
Was tun, wenn die VM nicht mehr startet und die VHDX/VMDK als „corrupt“ gilt?
Sofort VM stoppen, Autostart deaktivieren und den kompletten VM-Ordner inklusive Snapshots/Checkpoints 1:1 sichern. Keine Reparatur am Original (kein Merge, kein chkdsk/fsck im Image). Häufig sind Daten trotz korruptem VHDX/VMDK/QCOW2 noch vorhanden – sichere Datenrettung klappt meist über Klon/Read-only-Analyse und gezielte Datei-Extraktion.
Wie kann ich Daten aus einer virtuellen Maschine retten, ohne die VM wieder bootfähig zu machen?
Datenrettung aus virtuellen Maschinen funktioniert oft ohne Boot: Virtuellen Datenträger (VHDX/VMDK/QCOW2) read-only mounten oder ein Abbild erstellen und daraus Dateien/Ordner extrahieren. Das schützt das Original-Image und ist häufig der schnellste Weg für Projekte, Buchhaltung, Mail-Archive und Benutzerprofile.
Hyper-V: Was bedeutet AVHDX-Drama und wie rette ich Daten bei kaputter Checkpoint-Kette?
Bei Hyper-V entstehen Checkpoints als AVHDX-Deltas; ist die Snapshot-/Checkpoint-Kette defekt oder ein Merge abgebrochen, darf nicht „nach Gefühl“ umbenannt oder zusammengeführt werden. Erst vollständige Kopie aller VHDX/AVHDX-Konfig-Dateien erstellen, dann Kette analysieren und kontrolliert rekonstruieren oder Daten direkt aus dem passenden Delta/Stand extrahieren.
VMware: Was heißt „Descriptor file missing“ bei VMDK und ist das reparierbar?
Bei VMware besteht eine VMDK oft aus Descriptor + Flat-/Delta-Datei. Fehlt der Descriptor („Descriptor file missing“) oder passt er nicht, wirkt die VMDK unbrauchbar, ist aber häufig rekonstruierbar, wenn Größe/Geometrie und Snapshot-Struktur sauber ermittelt werden. Wichtig: Erst alles sichern, dann Descriptor/Snapshot-Chain kontrolliert rekonstruieren oder Daten aus der Flat-/Delta-Datei auslesen.
Proxmox/KVM: Was sind typische Ursachen bei QCOW2, LVM-Thin oder ZFS, wenn die VM „plötzlich“ kaputt ist?
Typisch sind inkonsistente QCOW2 nach Host-Absturz, volle/beschädigte LVM-Thin-Metadaten oder ZFS-Pool-Probleme. Entscheidend ist die Trennung: VM-Image-Problem vs. Storage-Layer (LVM/ZFS/RAID). Keine Experimente am Pool/Thin ohne Plan – zuerst read-only sichern/klonen und dann strukturiert analysieren.
Was ist häufiger kaputt: Container (VHDX/VMDK/QCOW2), Dateisystem oder Snapshot-Kette – und warum ist das wichtig?
Es gibt drei Hauptfehlerklassen: Container-Schaden (Metadaten der VHDX/VMDK/QCOW2), Dateisystem-Schaden im Gast (NTFS/ext4) oder eine defekte Snapshot-/Checkpoint-Kette. Die Rettungsstrategie hängt davon ab: Snapshot-Kette rekonstruieren, Dateisystem logisch wiederherstellen oder Rohdaten aus dem Container extrahieren – deshalb zuerst konservieren, dann diagnostizieren.
Wann sollte ich professionelle Datenrettung in Berlin beauftragen statt DIY zu probieren?
Professionelle Datenrettung ist sinnvoll, wenn Snapshot-Ketten unklar/gebrochen sind, VHDX/VMDK/QCOW2 korrupt wirkt, der Storage-Layer (RAID/ZFS/LVM) betroffen ist oder Business-kritische Systeme (ERP, Buchhaltung, Mail) ausfallen. DIY ist eher ok bei vorhandenem Backup oder klarer, kopierter Ausgangslage – grundsätzlich gilt: nicht am Original schreiben.