Hostname ändern in einem produktiven Proxmox Ceph HCI Cluster

Aus Thomas-Krenn-Wiki
Zur Navigation springen Zur Suche springen
Proxmox-logo-stacked-black-220px.png

Unter Umständen möchte man bei einem System den Hostname ändern, diese Anleitung erklärt dies, bezieht sich aber NUR auf das Ändern eines Hostnames bei einem Cluster-System. Zusätzlich betrachtet werden hier die notwendigen Änderungen innerhalb Ceph, Corosync und dem HA-Mode von Proxmox VE, wenn der Hostname sich von einem Node ändert.

Disclaimer: Proxmox selbst empfiehlt das Umbenennen eines Hosts nicht - besser wäre eine Neuinstallation und Re-Integration des Hosts in das Cluster. Die Gründe sind hierfür vermutlich die starke Komplexität, die wir aber mit Hilfe dieses Wiki-Artikels reduzieren möchten. Trotzdem: Sie agieren auf eigene Gefahr / eigenes Risiko.



Wichtige Hinweise

Achtung: Stellen Sie sicher, dass der Host, welcher umbenannt werden soll keine VMs, keine Container, keine Vorlagen oder anderen Ressourcen mehr enthält. Bitte machen Sie vorher eine Bulk-Migration aller Ressourcen auf einen anderen Host.

Achtung: Diese Anleitung wurde mehrfach auf einem Test-System getestet, allerdings mit dem Anspruch, keine Downtime oder Service-Unterbrechung zu haben (weder im Corosync, noch im Ceph). Dies hat geklappt! Trotzdem: dieses Tutorial richtet sich an fortgeschrittene User, da Konfigurationsdateien angepasst werden, die bei falscher Konfiguration / Anpassung Ihr System negativ beeinflussen könnten. Konkret ist hier die Corosync-Konfigurationsdatei gemeint - bitte befolgen Sie die Anleitung Schritt für Schritt und lesen Sie diese komplett durch.

Welche Namensänderungen sind dabei?

  • der reguläre Hostname des Servers wird geändert
  • Anpassungen an der Corosync-Config vom Proxmox Cluster
  • Änderung der Ceph-Service Namen auf den neuen Hostname
  • Anpassung der Datacenter.cfg sofern notwendig
  • Neuausstellung der Proxmox Zertifikate (Web-UI/SSH)
  • Anpassung der Anzeige des HA-LRM Status (unter Datacenter -> HA)

Welche Namensänderungen fehlen?

  • Nicht dabei sind die Anpassung alter Log-Einträge auf den neuen Namen, dies ist allerdings analyse-technisch wohl auch besser so.
  • Alte Host-Metriken (Statistiken) sind ggf. unbrauchbar aufgrund des anderen Namens, neue Metriken verwenden den neuen Hostnamen.

HA temporär deaktivieren

Eine Änderung des Hostnames und dem anschließenden Reboot des Servers könnte potentiell auch Auswirkungen auf die HA-Funktion von Proxmox VE-Clustern haben - da ggf. ein Fencing (= Reboot der anderen Nodes) getriggert wird. Bei korrekt konfiguriertem HA ist das sehr unwahrscheinlich aber potentiell möglich. Man könnte das kleine Risiko reduzieren, indem man vor der Hostname Änderung, das Proxmox-VE-HA temporär mit folgenden Kommandos deaktiviert. Zuerst auf allen Nodes nacheinander den PVE-HA-LRM dienst stoppen:

 systemctl stop pve-ha-lrm

ist dies auf allen Nodes erledigt, bitte den PVE-HA-CRM Dienst auf jedem Node einzeln stoppen:

 systemctl stop pve-ha-crm 

Es folgt eine Auflistung aller Dateien und Befehle, die entsprechend zur Änderung des Hostnames unter Proxmox VE 8.0 notwendig sind.

Hostname ändern

  • /etc/hosts auf jedem Cluster-Node auf den neuen Namen ändern (PMX1 -> PMX4)
  • /etc/postfix/main.cf auf dem einzelnen Node umbenennen (PMX1 -> PMX4)
  • den neuen Hostnamen setzen, bei uns: hostnamectl hostname PMX4
hostnamectl hostname <newhostname>
  • das Node-Verzeichnis im Proxmox Cluster File Systeme erstellen, bei uns: mkdir /etc/pve/nodes/PMX4
mkdir /etc/pve/nodes/<newhostname>
  • Backup des alten Node-Verzeichnis machen, bei uns: cp -r /etc/pve/nodes/PMX1 /root/
cp -r /etc/pve/nodes/<oldhostname> /root/
  • Anpassung der Corosync-Datei /etc/pve/corosync.conf (Namen ändern und config_version um 1 erhöhen!)
  • Corosync-Dienst auf jedem Node neustarten, entweder über Web-UI (System) oder mittels
 systemctl restart corosync 
  • Browser refreshen (ggf. Cache löschen) (nicht wundern, der neue Hostname wird noch mit einem Fragezeichen dargestellt)
  • Falls in der Storage-Definition der alte Hostname verwendet wird, diesen abändern in /etc/pve/storage.cfg

Server neustarten

  • Server neustarten (damit /etc/pve/nodes/newhostname erzeugt wird)
  • Zertifikate erneuern auf jedem Node ausführen:
 pvecm updatecerts -f 
  • Alten Node-Ordner im Cluster File System entfernen
 rm -rf /etc/pve/nodes/oldhostname 
  • Unable to read lrm_status Fehler beheben in der Datacenter --> HA Ansicht
systemctl stop pve-ha-crm.service (auf jedem Node ausführen)
rm -f /etc/pve/ha/manager_status (nur auf einem Node ausführen)
# Am Ende des Artikels starten wir wieder den pve-ha-crm.service, damit HA auch wieder aktiv ist.
  • tls_process_server_certificate: certificate verify failed (596) Fehler beheben mit:
systemctl restart pveproxy && systemctl restart pvestatd

auf jedem Node!

Ceph Dienste (Hostname-Korrektur)

Achtung: Es ist wichtig, dass das Ceph HEALTHY ist und dass ein Quorum bei den Ceph-Diensten vorhanden ist. Die folgenden Schritte bitte nur mit einem gesunden Cluster-Status ausführen - durch das Löschen des alten Ceph-Monitors darf kein Quorum-Loss entstehen.

  • Alten Ceph Monitor löschen und neu erstellen (damit er den neuen Namen bekommt)
  • Alten Ceph Manager löschen und neu erstellen (damit er den neuen Namen bekommt)
  • Alten Ceph Meta-Data-Service löschen und neu erstellen (damit er den neuen Namen bekommt)
  • Alte Ceph Host Crush Map Eintrag entfernen (vorher bitte Health Status prüfen, ob alles passt)
 ceph osd crush remove <oldhostname> 

Abschluss

Danach sollten alle technischen notwendigen Änderungen aber auch die optischen Korrekturen erledigt sein, der neue Host sollte an allen Stellen entsprechend den neuen Namen aufweisen. Bitte nun auf allen Hosts nacheinander zuerst mittels

 systemctl start pve-ha-lrm 

den HA-Local-Ressource-Manager starten und DANACH auf allen Nodes mittels

 systemctl start pve-ha-crm

den HA-Cluster-Ressource Manager starten.


Foto Jonas Sterr.jpg

Autor: Jonas Sterr

Ich beschäftige mich mit den Themen Software Defined Storage, Proxmox Virtualisierung auf Basis von KVM, QEMU & Ceph im Produktmanagement der Thomas-Krenn.AG in Freyung. Proxmox ist meine absolute Leidenschaft und ich freue mich gerne über Kontaktanfragen und einen Austausch auf LinkedIn.


Das könnte Sie auch interessieren

BNXT NVM - failed to get mac address
H11DSI - NT Installation aborted (starting chrony) - Proxmox 7
ZFS cannot import rpool no such pool available - Proxmox Boot Problem beheben