Langer2002 Geschrieben 29. April 2004 Geschrieben 29. April 2004 Hallo zusammen... hat jemand schon einmal einen Linux Cluster installiert. Habe vor einen Linux Cluster zu installieren und bin auf der suche nach einer Firma die das gegebenfalls machen kann ( Erfahrungen ) und mit welchem Aufwand das verbunden ist. Unter Windows ist mir das Problem so bekannt das man bestimmte Dienste dem einen Server und andere Dienste dem anderen Server zuweisen kann. Sobald ein Server ausfällt werden alles Dienste dem noch laufenden Server übertragen. Wie läuft das unter Linux. Geht das unter Linux überhaupt schon und wenn ja wo bekomme ich gute aussagekräftige Informationen dazu? Wäre schön wenn ich mal ein paar Antworten bekommen könnte. Danke schon einmal an alle im voraus mit freundlichen Grüßen der Lange! :marine Zitieren
SystemError Geschrieben 29. April 2004 Geschrieben 29. April 2004 ...Wie läuft das unter Linux. Geht das unter Linux überhaupt schon und wenn ja wo bekomme ich gute aussagekräftige Informationen dazu? Jo, es geht. Ich gehe jetzt mal einfach davon aus dass Du eigentlich beliebige LinuxApplikationen clustern willst und keine Klimasimulationen auf 1024 Rechnern laufen lassen willst. *g* Das ginge dann in Richtung HPC (HighPerformanceComputing), z.B. BeoWulf. Du kannst mit sog. FailOverClustern (fast) jede beliebige Applikation unter Windows / Linux / Unix hochverfügbar halten. Zu den FailOverClustern kann ich Dir ein bisserl weiterhelfen. Kleines Beispiel: 2 KnotenCluster aus 2 intelbasierten LinuxServern + externe SCSI-PlattenEinheit. (geshared) Auf Knoten A läuft im NormalFall eine OracleDB; Die "NutzDaten" der DB liegen auf der gesharedten Platteneinheit. Die beiden Knoten "reden" ständig über einen "HeartBeat" miteinander; fällt Knoten A aus bemerkt B dies anhand des ausbleibenden HeartBeats und übernimmt die OracleDB incl. der "ServiceIPAdresse" unter der die DB zu erreichen sein soll. Das ganze funktioniert nur weil beide Knoten gemeinsamen Zugriff auf die PlattenEinheit haben. Du benötigst dafür spezielle ClusertSoftware wie z.B. : - Die RedHat ClusterSuite http://www.redhat.com/software/rha/cluster/manager/ - ServiceGuard for Linux von HP http://h71028.www7.hp.com/enterprise/cache/4176-0-0-0-121.aspx - LifeKeeper for Linux von SteelEye http://www.steeleye.com/products/linux/ Zusätzlich benötigst Du in der Regel ein "SharedStorageDevice" auf das alle Deine ClusterKnoten Zugriff haben. (SCSI oder FibreChannel) Als HeartBeatDevice kannst Du entweder eine Ethernet oder eine serielle Verbindung zwischen den beteiligten ClusterKnoten verwenden. Du kannst Dich ja auf den oben gelinkten WebSeiten umsehen; da gibt es einige PDFs, die dann jeweils auf das spezielle Produkt eingehen. Bevor Du irgendwelche weiteren Überlegungen anstellst: Welche Applikationen willst Du denn hochverfügbar halten ? Für Rückfragen stehe ich gerne zur Verfügung. Bye SystemError Zitieren
DanielB Geschrieben 29. April 2004 Geschrieben 29. April 2004 Bei Shared Storage Lösung (z.B. SCSI over Fibre, etc.) empfiehlt sich unter Umständen noch ein STONITH Geräte um sicherzustellen das der Datenbestand konsistent bleibt. Der Heartbeat(www.linux-ha.org) zwischen den beiden Knoten sollte ebenfalls redundant sein, d.h. sowohl über eine serielle Leitung, als auch über die Netzwerkverbindung. Wenn Du High Availability erst meinst sind redundante Netzteile und eine RAID Lösung ebenfalls empfehlenswert, ist natürlich kostenintensiver. Wenn eine solche Failover Lösung kostengünstig realisiert werden soll ist es möglich anstatt einer SCSI over Fibre Lösung, bzw. vergleichbaren externen Speicherlösung, z.B. DRBD zu verwenden (www.drbd.org). DRBD ermöglicht eine Art Netzwerk RAID-1. Allerdings sollte hier zwischen den beiden Knoten eine Gigabit Verbindung Point-to-Point Verbindung über ein Crosskabel existieren, um die Daten schnell synchronisieren zu können. Ausser Heartbeat und DRBD + einiger Skripte ist hier eigentlich keine weitere Software nötig. Der Aufwand für eine solche Lösung hängt im wesentlichen davon ab zu welcher Möglichkeit Du tendierst und welche Dienste abgesichert werden sollen. Die Einrichtung einer Failover Lösung für z.B. Apache, MySQL, Samba, DNS, OpenLDAP auf 2 Knoten schätze ich auf ca. 1 - 2 Tag(e), wenn Du weisst was Du tust. Aber wie gesagt, es kommt sehr stark auf die abzusichernde Software an. Zitieren
SystemError Geschrieben 29. April 2004 Geschrieben 29. April 2004 Bei Shared Storage Lösung (z.B. SCSI over Fibre, etc.) empfiehlt sich unter Umständen noch ein STONITH Geräte um sicherzustellen das der Datenbestand konsistent bleibt. ... Yup. Full ACK. STONITH steht für ShootTheOtherNodeInTheHead d.h. die ClusterKnoten bekommen geeignete Mittel in die Hand gelegt um ggf. andere Knoten auf die ganz harte Tour "abzuschiessen". In der Regel verwendet man hierzu entweder managebare SteckDoseLeisten mit denen man den Knoten den Saft abdrehen kann oder spezielle ManagementBoards wie z.B. die RemoteInsights von HP. Ich würde generell empfehlen zuerst alle Komponenten innerhalb eines Knotens wie z.B. interne Platten, Netzwerkkarten, SCSI-Kontroller, Netzwerkteile, etc.. redundant auszulegen. Anschliessend kann man sich dann an den eigentlichen Cluster machen. Wenn hierfür das Geld nicht da ist dann ist eine ClusterLösung wahrscheinlich das falsche für dieses Projekt. Noch ein Wort zum SharedStorage: Bei FailOverClustern sollte das RAID im SharedStorage von der PlattenEinheit selbst gemacht werden(und nicht von einem lokalen RAIDController) um zu verhindern dass der RAIDControllerCache auf einem einzelnen Server noch nicht auf Platte weggeschriebene Daten enthält. Im FailOverFall könnte das zu Datenkoruption führen. Eine Alternative hierzu wäre das Spiegeln der ControllerCaches zwischen 2 Knoten; das könnte man z.B. mit SSARAIDAdaptern von IBM machen. Ansonsten denke ich das Hochverfügbarkeit in erster Linie eine kopflastige, trockene, konzeptionelle GrundSatzEntscheidung ist, und dass das verwendete ClusterProdukt dann schon eher zweitrangig ist. Hochverfügbarkeit ist ein Weg, der einmal eingeschlagen bis ins kleinste Detail befolgt werden will und keine Fehltritte verzeiht. Beliebte Beispiele für inkonsequent geplante Cluster sind ClusterKnoten mit nicht redundanten Platten oder redundante Netzteile die alle am selben StromKreis hängen. Ein derartiger "HochverfügbarkeitsCluster" wird zwar viel kosten wenn man dann aber auf ihn angewiesen ist wird es stets eine dolle Begündung geben warum er jetzt in genau dieser Situation nicht funktioniert hat... ;-) Bye SystemError Zitieren
Empfohlene Beiträge
Dein Kommentar
Du kannst jetzt schreiben und Dich später registrieren. Wenn Du ein Konto hast, melde Dich jetzt an, um unter Deinem Benutzernamen zu schreiben.