Unrealfighter Geschrieben 27. August 2008 Geschrieben 27. August 2008 Hallo zusammen! Ich habe ein kleines Problem mit Heartbeat bei einem Linux Cluster. Und zwar habe ich zwei Server node1 und node2. Auf beiden ist heartbeat und apache2 installiert. Nun habe ich Heartbeat konfigurietert und Node1 als Master angegeben. Bei einem Ausfall soll auf Node2 der apache2 gestartet werden. Soweit so gut wenn ich den Node1 abschalte übernimmt der Node2 auch ohne Probleme. Dabei legt er ein Alias eth2:0 mit der Adresse von Node1 an. Auf beiden Maschinen habe ich autofailback auf on gestellt. Nur mein Problem ist jetzt das von Node2 übernommen hat und Node1 wieder startet laufen auf beiden Servern die Apache. Eigentlich sollten die Dienste doch wenn der Master wieder da ist doch wieder abgeschaltet werden oder?? Ich denke das Problem liegt darin das der Node2 ja ein Alias mit der IP-Adresse von Node1 anlegt. Daran erkennt er Node1 ist da und Node2 ist da. Nur wie krieg ich das hin das wenn Node1 wieder da ist das Node2 den Apache ausschaltet?? Node1 hat 192.168.153.128 Node2 hat 192.168.153.129 Hier die ha.cf von Node1: logfile /var/log/ha-log logfacility local0 keepalive 2 deadtime 30 warntime 10 udpport 694 bcast eth1 # Linux auto_failback on node node1 node node2 Hier die ha.cf von Node2: logfile /var/log/ha-log logfacility local0 keepalive 2 deadtime 30 warntime 10 udpport 694 bcast eth2 # Linux auto_failback on node node1 node node2 Hier die haresources von beiden: node1 192.168.153.128 apache2 Hier die /etc/hosts: 192.168.153.128 node1 192.168.153.129 node2 Zitieren
charmanta Geschrieben 30. August 2008 Geschrieben 30. August 2008 (bearbeitet) ich kenne herartbeat nicht, aber normalerweise startet man Cluster mit einer STANDBY Adresse und erst bei Start der Dienste wird diese in die SERVICE Adresse überführt. Diese Routine kann dann nochmals prüfen, ob ein anderer Rechner bereits die SERVICE IP benutzt und reagieren. Auf "grossen" Systemen wird damit exakt Dein Problem vermieden Meldet sich hier die ehemalige primäre Maschine am Cluster wieder an ( und ist dieser entsprechend konfiguriert ) dann erzwingt der die Übernahme vom sekundären Rechner. So rein vom schnellen Drübernachdenken könntest Du auch einen falschen Clustertyp angelegt haben ( falls Heartbeat sowas kann ): rotating oder mutual takeover oder standby cluster ? Bearbeitet 30. August 2008 von charmanta Zitieren
Empfohlene Beiträge
Dein Kommentar
Du kannst jetzt schreiben und Dich später registrieren. Wenn Du ein Konto hast, melde Dich jetzt an, um unter Deinem Benutzernamen zu schreiben.