lordy Geschrieben 29. Juli 2010 Geschrieben 29. Juli 2010 Hallo, für meine Kollegen soll ich demnächst eine Schulung zum Thema "Linux-Troubleshooting" halten. Wir kümmern uns um den Betrieb von insgesamt ca. 500 Servern (mit allen möglichen Anwendungen) und soll z.B. unseren Datenbankadministratoren ein paar tiefergehende Kenntnisse vermitteln. Für die Schulung sind leider nur erstmal 60 Minuten angesetzt (eigentlich ein Witz), aber ich will versuchen, das Beste aus der Zeit zu machen. Ich bin nun einmal die Themenliste der LPIC 101 Prüfung durchgegangen, die auch reichlichen Themen liefert, aber das ist einfach viel zu viel (vom Bootloader bis zu Shell-Tricks). Meine Frage daher an Euch: Welche Themen würdet Ihr in solch einer Schulung behandeln/erwarten ? Als Grundvorraussetzung nehme ich immer ein halbwegs lauffähiges System an (also keine defekte HW), es soll mehr um die Prozesse, Logfiles, etc. gehen. Ich hatte mir z.B. folgende Sachen gedacht: - Wie finde ich das Logfile zu einem Prozess ? - Wie finde ich raus, zu welchem Prozess eine Datei gehört ? - Wie "arbeite" ich mit Prozessen ? (kill, pgrep, etc) - Wie checke ich die Eckdaten des Systems (CPU, Speicher, Plattenplatz) ? - Wie arbeite ich effektiv mit der Shell ? (history, Schleifen, etc) Würde mich über Anregungen freuen
allesweg Geschrieben 29. Juli 2010 Geschrieben 29. Juli 2010 Was können die Teilnehmer denn schon? Es ist ein kleiner Unterschied, ob du vor Windows-Klickiklacker-Leuten stehst oder welchen, die nur in der shell leben.
gimbo Geschrieben 29. Juli 2010 Geschrieben 29. Juli 2010 Bei 60 Minuten würde ich ehrlich gesagt gar nichts erwarten. Die Auswahl scheint mir ganz passend zu sein, das ist aber natürlich abhängig vom Zielpublikum. Mit kill, pkill, top und grep könnte man Profis natürlich auch langweilen. Das Thema Shell könnte eigentlich schon für sich genommen einen ganzen Tag und mehr füllen. Unter Troubleshooting könnte ich mir vorstellen, wie ich Abhängigkeiten zwischen Bibliotheken auflösen kann, was man bei Kernel Panic machen kann oder wie ich das Ding ans Netz kriege. Letztlich alle Sachen, die letztlich elementar sind, damit man mit dem Ding überhaupt wieder arbeiten kann. Wie ich Prozesse killen kann, kann ich ansonsten auch schnell über Google herausfinden, aber wenn das Ding gar nichts mehr macht und ich gerade vor dem einzigen PC stehe, muss ich evtl. allein auf das eigene Wissen zurückgreifen. Naja, aber das sind wohl Schulungsinhalte, die man nicht direkt an den Kopf geknallt bekäme, sondern erst später. Insofern finde ich die Auswahl als Grundlage in Ordnung.
lilith2k3 Geschrieben 29. Juli 2010 Geschrieben 29. Juli 2010 - Wie finde ich das Logfile zu einem Prozess ? - Wie finde ich raus, zu welchem Prozess eine Datei gehört ? - Wie "arbeite" ich mit Prozessen ? (kill, pgrep, etc) - Wie checke ich die Eckdaten des Systems (CPU, Speicher, Plattenplatz) ? - Wie arbeite ich effektiv mit der Shell ? (history, Schleifen, etc) Evtl. noch (s)locate (anstelle von find),grep und awk (ansatzweise) und damit hättest Du schon mehr als 'ne Stunde voll. Achja: und chrooten in ein System, falls man sich versehentlich selbst ausgesperrt hat
Wodar Hospur Geschrieben 29. Juli 2010 Geschrieben 29. Juli 2010 Versuch halt am besten auch Möglichkeiten zur Selbsthilfe zu geben, welches sind gute Linux Ressourcen, das mit den Logs ist gut, auch man gehört dazu und vielleicht paar kleinere Tools + Möglichkeit Hardwaredefekte zu finden. Soll die Userverwaltung auch zum Troubleshooting gehören?
lordy Geschrieben 29. Juli 2010 Autor Geschrieben 29. Juli 2010 Also es geht hauptsächlich darum die Leute, die eben keine Profi-Sysadmins sind (z.B. unsere Datenbank-Spezis) ein paar Hilfsmittel an die Hand zu geben für die Rufbereitschaft. In der RB schlagen sehr selten HW-Ausfälle oder ähnliches auf, meistens geht es um "Prozess läuft nicht, oder hängt", "Cronjob ist abgebrochen", "komische Meldung im Log", sowas in der Art. Grundsätzlich haben wir alle Kisten doppelt oder mehrfach sodass wir den HW-Ausfall einer Kiste in der RB überstehen können und die Leute können notfalls auch die Profi-Sysadmins anrufen, aber die möchten natürlich auch mal schlafen Über User-Verwaltung (in unserem Fall LDAP) hatte ich schon nachgedacht, aber das alleine füllt (mehr als) eine Stunde.
bigvic Geschrieben 29. Juli 2010 Geschrieben 29. Juli 2010 (bearbeitet) Denke immer dran ... gefährliches Halbwissen heisst nicht umsonst so. Ich habe mal ein paar Usern die system tools top, iostat, prstat, vmstat, etc. gezeigt und dann kamen diese "reserveadmins" auf einmal an mit irgendwelchen verrückten Thesen über load average und sonstigem Unfug, wenn mal was nicht so funktionierte wie sie wollten. Aber diese Erfahrung nur am Rande. Ich denke für eine Stunde haste doch mehr schon als genug Stoff. Vielleicht kannst ja noch sowas reinnehmen wie "Wie mache ich einen manuellen failover der db im cluster?", wenn das nicht automatisiert sein sollte. Bearbeitet 29. Juli 2010 von bigvic
Crash2001 Geschrieben 30. Juli 2010 Geschrieben 30. Juli 2010 Ich würde evtl noch cron-Jobs hinzufügen als Thema und dort dann wie etwas z.B. täglich um x Uhr, jede halbe Stunde, einmal in der Woche o.ä. aufgerufen wird automatisch. Ist schnell erklärt, aber bringt einem etwas, das zu wissen.
Empfohlene Beiträge
Erstelle ein Benutzerkonto oder melde Dich an, um zu kommentieren
Du musst ein Benutzerkonto haben, um einen Kommentar verfassen zu können
Benutzerkonto erstellen
Neues Benutzerkonto für unsere Community erstellen. Es ist einfach!
Neues Benutzerkonto erstellenAnmelden
Du hast bereits ein Benutzerkonto? Melde Dich hier an.
Jetzt anmelden