lordy Geschrieben 29. Juli 2010 Geschrieben 29. Juli 2010 Hallo, für meine Kollegen soll ich demnächst eine Schulung zum Thema "Linux-Troubleshooting" halten. Wir kümmern uns um den Betrieb von insgesamt ca. 500 Servern (mit allen möglichen Anwendungen) und soll z.B. unseren Datenbankadministratoren ein paar tiefergehende Kenntnisse vermitteln. Für die Schulung sind leider nur erstmal 60 Minuten angesetzt (eigentlich ein Witz), aber ich will versuchen, das Beste aus der Zeit zu machen. Ich bin nun einmal die Themenliste der LPIC 101 Prüfung durchgegangen, die auch reichlichen Themen liefert, aber das ist einfach viel zu viel (vom Bootloader bis zu Shell-Tricks). Meine Frage daher an Euch: Welche Themen würdet Ihr in solch einer Schulung behandeln/erwarten ? Als Grundvorraussetzung nehme ich immer ein halbwegs lauffähiges System an (also keine defekte HW), es soll mehr um die Prozesse, Logfiles, etc. gehen. Ich hatte mir z.B. folgende Sachen gedacht: - Wie finde ich das Logfile zu einem Prozess ? - Wie finde ich raus, zu welchem Prozess eine Datei gehört ? - Wie "arbeite" ich mit Prozessen ? (kill, pgrep, etc) - Wie checke ich die Eckdaten des Systems (CPU, Speicher, Plattenplatz) ? - Wie arbeite ich effektiv mit der Shell ? (history, Schleifen, etc) Würde mich über Anregungen freuen Zitieren
allesweg Geschrieben 29. Juli 2010 Geschrieben 29. Juli 2010 Was können die Teilnehmer denn schon? Es ist ein kleiner Unterschied, ob du vor Windows-Klickiklacker-Leuten stehst oder welchen, die nur in der shell leben. Zitieren
gimbo Geschrieben 29. Juli 2010 Geschrieben 29. Juli 2010 Bei 60 Minuten würde ich ehrlich gesagt gar nichts erwarten. Die Auswahl scheint mir ganz passend zu sein, das ist aber natürlich abhängig vom Zielpublikum. Mit kill, pkill, top und grep könnte man Profis natürlich auch langweilen. Das Thema Shell könnte eigentlich schon für sich genommen einen ganzen Tag und mehr füllen. Unter Troubleshooting könnte ich mir vorstellen, wie ich Abhängigkeiten zwischen Bibliotheken auflösen kann, was man bei Kernel Panic machen kann oder wie ich das Ding ans Netz kriege. Letztlich alle Sachen, die letztlich elementar sind, damit man mit dem Ding überhaupt wieder arbeiten kann. Wie ich Prozesse killen kann, kann ich ansonsten auch schnell über Google herausfinden, aber wenn das Ding gar nichts mehr macht und ich gerade vor dem einzigen PC stehe, muss ich evtl. allein auf das eigene Wissen zurückgreifen. Naja, aber das sind wohl Schulungsinhalte, die man nicht direkt an den Kopf geknallt bekäme, sondern erst später. Insofern finde ich die Auswahl als Grundlage in Ordnung. Zitieren
lilith2k3 Geschrieben 29. Juli 2010 Geschrieben 29. Juli 2010 - Wie finde ich das Logfile zu einem Prozess ? - Wie finde ich raus, zu welchem Prozess eine Datei gehört ? - Wie "arbeite" ich mit Prozessen ? (kill, pgrep, etc) - Wie checke ich die Eckdaten des Systems (CPU, Speicher, Plattenplatz) ? - Wie arbeite ich effektiv mit der Shell ? (history, Schleifen, etc) Evtl. noch (s)locate (anstelle von find),grep und awk (ansatzweise) und damit hättest Du schon mehr als 'ne Stunde voll. Achja: und chrooten in ein System, falls man sich versehentlich selbst ausgesperrt hat Zitieren
Wodar Hospur Geschrieben 29. Juli 2010 Geschrieben 29. Juli 2010 Versuch halt am besten auch Möglichkeiten zur Selbsthilfe zu geben, welches sind gute Linux Ressourcen, das mit den Logs ist gut, auch man gehört dazu und vielleicht paar kleinere Tools + Möglichkeit Hardwaredefekte zu finden. Soll die Userverwaltung auch zum Troubleshooting gehören? Zitieren
lordy Geschrieben 29. Juli 2010 Autor Geschrieben 29. Juli 2010 Also es geht hauptsächlich darum die Leute, die eben keine Profi-Sysadmins sind (z.B. unsere Datenbank-Spezis) ein paar Hilfsmittel an die Hand zu geben für die Rufbereitschaft. In der RB schlagen sehr selten HW-Ausfälle oder ähnliches auf, meistens geht es um "Prozess läuft nicht, oder hängt", "Cronjob ist abgebrochen", "komische Meldung im Log", sowas in der Art. Grundsätzlich haben wir alle Kisten doppelt oder mehrfach sodass wir den HW-Ausfall einer Kiste in der RB überstehen können und die Leute können notfalls auch die Profi-Sysadmins anrufen, aber die möchten natürlich auch mal schlafen Über User-Verwaltung (in unserem Fall LDAP) hatte ich schon nachgedacht, aber das alleine füllt (mehr als) eine Stunde. Zitieren
bigvic Geschrieben 29. Juli 2010 Geschrieben 29. Juli 2010 (bearbeitet) Denke immer dran ... gefährliches Halbwissen heisst nicht umsonst so. Ich habe mal ein paar Usern die system tools top, iostat, prstat, vmstat, etc. gezeigt und dann kamen diese "reserveadmins" auf einmal an mit irgendwelchen verrückten Thesen über load average und sonstigem Unfug, wenn mal was nicht so funktionierte wie sie wollten. Aber diese Erfahrung nur am Rande. Ich denke für eine Stunde haste doch mehr schon als genug Stoff. Vielleicht kannst ja noch sowas reinnehmen wie "Wie mache ich einen manuellen failover der db im cluster?", wenn das nicht automatisiert sein sollte. Bearbeitet 29. Juli 2010 von bigvic Zitieren
Crash2001 Geschrieben 30. Juli 2010 Geschrieben 30. Juli 2010 Ich würde evtl noch cron-Jobs hinzufügen als Thema und dort dann wie etwas z.B. täglich um x Uhr, jede halbe Stunde, einmal in der Woche o.ä. aufgerufen wird automatisch. Ist schnell erklärt, aber bringt einem etwas, das zu wissen. Zitieren
Empfohlene Beiträge
Dein Kommentar
Du kannst jetzt schreiben und Dich später registrieren. Wenn Du ein Konto hast, melde Dich jetzt an, um unter Deinem Benutzernamen zu schreiben.