STERNENLABOR

Wiki und Dokuspace

Benutzer-Werkzeuge

Webseiten-Werkzeuge


infrastruktur:cluster:start

Dies ist eine alte Version des Dokuments!


Proxmox Cluster

4 Node - Test

  • Aufbau
    • 4 nodes Cluster
    • alle VM, LXC, Templates im HA Cluster
    • Ceph 17.2.6: 4 Monitors, 4 Managers, 4 Meta Data Servers - up and running
  • Test 1.1: Node 4 (VM and LXC Templates) –> offline
    • HA cluster Konfiguration: Templates in state - disabled
    • Ceph: 1/4 mon down, 1 osd down, 1 host down, → PGs cleaned after 15 minutes - ok
    • VM and LXC von Node4 wurd nicht migriert - ok, da als disabled konfguriert
  • Test 1.2: zusätzlich Node 2 (GalacticEye) –> offline
    • Ceph: nicht erreichbar → fail → Erwartung ist, dass bei einem 3 Node Cluster, 2 übernehmen können
    • alle VMs down –> cluster not ready - no quorum → fail → Erwartung ist, dass bei einem 3 Node Cluster, 2 übernehmen können
  • Test 2.1: Node 4 (VM and LXC Templates) –> offline
    • HA cluster Konfiguration: Templates in state - stopped
    • Ceph: 1/4 mon down, 1 osd down, 1 host down, → PGs cleaned after 15 minutes - ok
    • VM and LXC von Node4 wurden migriert - ok
  • Test 2.2: Node 4 –> wieder online
    • Node up and running
    • keine Migration der VM/LXC zurück auf Node 4 → kann man da noch was automatisieren?
  • Test 2.3: Node 2 (VM Deban Templates + GalacticEye) –> offline
    • VM Debian wurde nach Node 1 verschoben, stopped - ok
    • GalacticEye wurde nach Node 4 verschoben, started - ok
  • Test 2.4: Node 4 zusätzlich –> offline
    • Ceph: nicht erreichbar → fail → Erwartung ist, dass bei einem 3 Node Cluster, 2 übernehmen können
    • alle VMs down –> cluster not ready - no quorum → fail → Erwartung ist, dass bei einem 3 Node Cluster, 2 übernehmen können
infrastruktur/cluster/start.1711969377.txt.gz · Zuletzt geändert: 2024/04/01 13:02 von ralf

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki