Linux-Troubleshooting Schulung

lordy · 29. Juli 2010

Hallo,

für meine Kollegen soll ich demnächst eine Schulung zum Thema "Linux-Troubleshooting" halten. Wir kümmern uns um den Betrieb von insgesamt ca. 500 Servern (mit allen möglichen Anwendungen) und soll z.B. unseren Datenbankadministratoren ein paar tiefergehende Kenntnisse vermitteln.

Für die Schulung sind leider nur erstmal 60 Minuten angesetzt (eigentlich ein Witz), aber ich will versuchen, das Beste aus der Zeit zu machen. Ich bin nun einmal die Themenliste der LPIC 101 Prüfung durchgegangen, die auch reichlichen Themen liefert, aber das ist einfach viel zu viel (vom Bootloader bis zu Shell-Tricks).

Meine Frage daher an Euch: Welche Themen würdet Ihr in solch einer Schulung behandeln/erwarten ? Als Grundvorraussetzung nehme ich immer ein halbwegs lauffähiges System an (also keine defekte HW), es soll mehr um die Prozesse, Logfiles, etc. gehen.

Ich hatte mir z.B. folgende Sachen gedacht:

- Wie finde ich das Logfile zu einem Prozess ?

- Wie finde ich raus, zu welchem Prozess eine Datei gehört ?

- Wie "arbeite" ich mit Prozessen ? (kill, pgrep, etc)

- Wie checke ich die Eckdaten des Systems (CPU, Speicher, Plattenplatz) ?

- Wie arbeite ich effektiv mit der Shell ? (history, Schleifen, etc)

Würde mich über Anregungen freuen

allesweg · 29. Juli 2010

Was können die Teilnehmer denn schon? Es ist ein kleiner Unterschied, ob du vor Windows-Klickiklacker-Leuten stehst oder welchen, die nur in der shell leben.

gimbo · 29. Juli 2010

Bei 60 Minuten würde ich ehrlich gesagt gar nichts erwarten. Die Auswahl scheint mir ganz passend zu sein, das ist aber natürlich abhängig vom Zielpublikum. Mit kill, pkill, top und grep könnte man Profis natürlich auch langweilen. Das Thema Shell könnte eigentlich schon für sich genommen einen ganzen Tag und mehr füllen.

Unter Troubleshooting könnte ich mir vorstellen, wie ich Abhängigkeiten zwischen Bibliotheken auflösen kann, was man bei Kernel Panic machen kann oder wie ich das Ding ans Netz kriege. Letztlich alle Sachen, die letztlich elementar sind, damit man mit dem Ding überhaupt wieder arbeiten kann. Wie ich Prozesse killen kann, kann ich ansonsten auch schnell über Google herausfinden, aber wenn das Ding gar nichts mehr macht und ich gerade vor dem einzigen PC stehe, muss ich evtl. allein auf das eigene Wissen zurückgreifen.

Naja, aber das sind wohl Schulungsinhalte, die man nicht direkt an den Kopf geknallt bekäme, sondern erst später. Insofern finde ich die Auswahl als Grundlage in Ordnung.

lilith2k3 · 29. Juli 2010

- Wie finde ich das Logfile zu einem Prozess ?
- Wie finde ich raus, zu welchem Prozess eine Datei gehört ?
- Wie "arbeite" ich mit Prozessen ? (kill, pgrep, etc)
- Wie checke ich die Eckdaten des Systems (CPU, Speicher, Plattenplatz) ?
- Wie arbeite ich effektiv mit der Shell ? (history, Schleifen, etc)

Evtl. noch (s)locate (anstelle von find),grep und awk (ansatzweise) und damit hättest Du schon mehr als 'ne Stunde voll.

Achja: und chrooten in ein System, falls man sich versehentlich selbst ausgesperrt hat

Wodar Hospur · 29. Juli 2010

Versuch halt am besten auch Möglichkeiten zur Selbsthilfe zu geben, welches sind gute Linux Ressourcen, das mit den Logs ist gut, auch man gehört dazu und vielleicht paar kleinere Tools + Möglichkeit Hardwaredefekte zu finden.

Soll die Userverwaltung auch zum Troubleshooting gehören?

lordy · 29. Juli 2010

Also es geht hauptsächlich darum die Leute, die eben keine Profi-Sysadmins sind (z.B. unsere Datenbank-Spezis) ein paar Hilfsmittel an die Hand zu geben für die Rufbereitschaft. In der RB schlagen sehr selten HW-Ausfälle oder ähnliches auf, meistens geht es um "Prozess läuft nicht, oder hängt", "Cronjob ist abgebrochen", "komische Meldung im Log", sowas in der Art.

Grundsätzlich haben wir alle Kisten doppelt oder mehrfach sodass wir den HW-Ausfall einer Kiste in der RB überstehen können und die Leute können notfalls auch die Profi-Sysadmins anrufen, aber die möchten natürlich auch mal schlafen

Über User-Verwaltung (in unserem Fall LDAP) hatte ich schon nachgedacht, aber das alleine füllt (mehr als) eine Stunde.

bigvic · 29. Juli 2010

Denke immer dran ... gefährliches Halbwissen heisst nicht umsonst so. Ich habe mal ein paar Usern die system tools top, iostat, prstat, vmstat, etc. gezeigt und dann kamen diese "reserveadmins" auf einmal an mit irgendwelchen verrückten Thesen über load average und sonstigem Unfug, wenn mal was nicht so funktionierte wie sie wollten. Aber diese Erfahrung nur am Rande.

Ich denke für eine Stunde haste doch mehr schon als genug Stoff. Vielleicht kannst ja noch sowas reinnehmen wie "Wie mache ich einen manuellen failover der db im cluster?", wenn das nicht automatisiert sein sollte.

Bearbeitet 29. Juli 2010 von bigvic

Crash2001 · 30. Juli 2010

Ich würde evtl noch cron-Jobs hinzufügen als Thema und dort dann wie etwas z.B. täglich um x Uhr, jede halbe Stunde, einmal in der Woche o.ä. aufgerufen wird automatisch. Ist schnell erklärt, aber bringt einem etwas, das zu wissen.

Anmelden

Linux-Troubleshooting Schulung

Empfohlene Beiträge

lordy

allesweg

gimbo

lilith2k3

Wodar Hospur

lordy

bigvic

Crash2001

Erstelle ein Benutzerkonto oder melde Dich an, um zu kommentieren

Benutzerkonto erstellen

Anmelden

Fachinformatiker Jobs

Fachinformatiker.de, 2024 by SE Internet Services

Links

Fachinformatiker.de App

Kontakt

Social media u. feeds

Jobboard für Fachinformatiker und IT-Fachkräfte

Umsehen

Aktivitäten

Stellenanzeigen

Blog

Über Fachinformatiker.de