VM in Error state - must be disabled and fixed first

Aus Thomas-Krenn-Wiki
Zur Navigation springen Zur Suche springen

Proxmox VE bietet die Möglichkeit der Hochverfügbarkeit für virtuelle Maschinen (VM) und Container. Der High Availability Modus - kurz HA-Modus - startet in Fehlerfällen wie dem Ausfall eines Servers die VMs und Container auf anderen Hosts neu, damit diese wieder erreichbar werden. Eine Fehlkonfiguration kann jedoch dazu führen, dass die neue VM nicht korrekt gestartet werden kann. Dieser Artikel beschreibt für diesen Fall die passenden Lösungswege.

Fehlermeldung

Falls durch eine fehlerhafte Konfiguration die VM oder der Container auf dem Zielhost nicht gestartet werden kann, erscheint folgende Meldung:

Requesting HA start for VM 106
service 'vm:106' in error state, must be disabled and fixed first
TASK ERROR: command 'ha-manager set vm:106 --state started' failed: exit code 255

Ursache

VMs und Container können aus unterschiedlichen Gründen in den Error State geraten. Der am häufigsten auftretende Fall ist der Verweis auf ungeeignete lokale Ressourcen.

Ungeeignete lokale Ressource

Die verwendeten lokalen Ressourcen müssen für Hochverfügbarkeit geeignet sein. Das ist dann der Fall, wenn sie auf allen Hosts vorhanden und entsprechend konfiguriert sind. In den meisten Fällen tritt der Fehler dann auf, wenn die VM in der Hardware-Konfiguration einen Verweis auf eine lokale Ressourcen wie z.B. einen USB-Stick oder eine Grafikkarte enthält, die auf den anderen Hosts nicht vorhanden ist:

task started by HA resource agent
TASK ERROR: USB Mapping invalid (hardware probably changed): usb device '0781:5583' not found

Lösung

Zur Fehlerbehebung ist die Hardware aus der Konfiguration zu entfernen, damit diese entsprechend auf dem neuen Host wieder gestartet werden kann. Die VM bzw. der Container befindet sich nach dem Austausch jedoch weiterhin im Error State. Mit folgenden Schritten werden die Instanzen wieder in den normalen Status überführt: Ressource auswählen -> More -> Manage HA -> State: Disabled und nachdem die Ressource im Stopped State ist, diese mittels More -> Manage HA -> State: started wieder in den korrekten "started" Modus bringen.

Hat man dies erledigt, wird die VM wieder gestartet und der Fehler ist somit behoben.

Proxmox Mastery Minute Tipp: Seit Proxmox VE 8 können Ressource-Mappings auf der Datacenter-Ebene erstellt werden. Ein Ressource-Mapping stellt eine virtuelle Schicht da, welche je nach Host der VM ein anderen lokales Gerät zur Verfügung stellt. Ist z.B. eine Grafikkarte auf Host 1 vorhanden, aber auch in Host 2 und 3 - kann man dies mittles Mapping entsprechend einstellen. Beispielsweise gibt es dann das Mapping: "Grafikkarte-NVIDIA". Die VM, welche sonst direkt mittels Pass-Through die einzelne Grafikkarte direkt verwendet hat, bekommt nun stattdessen das virtuelle Device "Grafikkarte-NVIDIA" zugeordnet. "Grafikkarte NVIDIA" zeigt auf Host1 auf die Grafikkarte mit der ID 12345, auf Host2 auf die Grafikkarte mit der ID 6789 usw. Somit kann die VM nun je nach Host automatisch auf das richtige Gerät zugreifen, anstatt in einen Fehler zu laufen - da die VM automatisch anhand des Mappings weiß, welche Grafikkarte auf welchem Host vorhanden ist und somit verwendet werden darf.


Foto Jonas Sterr.jpg

Autor: Jonas Sterr

Ich beschäftige mich mit den Themen Software Defined Storage, Proxmox Virtualisierung auf Basis von KVM, QEMU & Ceph im Produktmanagement der Thomas-Krenn.AG in Freyung. Proxmox ist meine absolute Leidenschaft und ich freue mich gerne über Kontaktanfragen und einen Austausch auf LinkedIn.


Das könnte Sie auch interessieren

ESXi VM Importer - Proxmox VE Storage Plugin
Mail Notifications in Proxmox VE konfigurieren und erstellen
Proxmox VE installieren