Zum Inhalt springen

Server 2003 friert ein - seltsame Phänomene


Empfohlene Beiträge

Geschrieben

Siehe Titel...

Kurz zum Rechner:

Athlon 64 3500+

1 GB DDR2 RAM

1x120 GB HD

2 x 640 GB HD im RAID1-Verbund (Nvidia Raid)

Alles fing damit an, als ich vor 2 Tagen die virtuellen Maschinen umziehen wollte und die virtuellen Disks (VMWare) auf den neuen Server kopieren wollte. Irgendwann beim Kopieren der großen Datei hängte der Server 2003 sich immer auf. Maus konnte man noch bewegen, anpingbar war er ebenso aber sonst ging rein gar nix mehr. Freigaben gingen nicht mehr, RDP auch nicht.

Der Fehler war reproduzierbar: Immer beim Kopieren von größeren Dateien hing er sich auf. Ich vermutete natürlich direkt ein Problem mit der onboard-Netzwerkkarte (nforce). Und tätsächlich fand ich folgenden Eintrag im Ereignisprotokoll:

Durch die Berechtigungseinstellungen (Anwendungsspezifisch) wird der SID (S-1-5-20) für Benutzer NT-AUTORITÄT\NETZWERKDIENST keine Aktivierungberechtigung (Lokal) für die COM-Serveranwendung mit CLSID

{BA126AD1-2166-11D1-B1D0-00805FC1270E}

gewährt. Diese Sicherheitsberechtigung kann mit dem Verwaltungsprogramm für Komponentendienste geändert werden.

Unter der CLSID fand ich in der Registry Einträge die mit "Network Connection Manager Class" oder irgendwas mit "Nvidia Network" zu tun hatten. Ich habe dann mal in den Komponentendiensten bei DCOM nachgeschaut, aber einen Eintrag mit dieser CLSID gab es nicht (wollte da eben die Berechtigungseinstellungen korrigieren). Danach habe ich die Treiber der Netzwerkkarte neu installiert.

Das hat dann für 2-3 Stunden geholfen aber dann ging es wieder los. Schließlich habe ich es aufgegeben, die Onboard-Netzwerkkarte deaktiviert und eine 3Com-Karte eingebaut. Dies lief dann auch problemlos, ich konnte die Dateien kopieren.

Aber nach einiger Zeit verabschiedete sich der Server wieder, selbe Phänomene wie bereits beschrieben. In der Ereignisanzeige stand jetzt allerdings NICHTS mehr. Ausser halt

Das System wurde zuvor am 21.04.2009 um 22:37:39 unerwartet heruntergefahren.

Weitere Informationen über die Hilfe- und Supportdienste erhalten Sie unter Events and Errors Message Center: Basic Search.

Aber das liegt daran, dass ich den Resetknopf drücken musste, weil der Rechner auf nix mehr reagierte.

Ein Eintrag hat mich jedoch stutzig gemacht:

Der Treiber hat einen Controllerfehler auf gefunden.

Weitere Informationen über die Hilfe- und Supportdienste erhalten Sie unter Events and Errors Message Center: Basic Search.

Quelle: NVRaid

Kam aber nur ein einziges mal vor! Und nie im direkten Zusammenhang mit einem Zeitpunkt wo der Rechner nicht mehr reagierte.

RAM wurde getestet, ist i.O.

Hat noch jemand eine Idee? Ich verzweifele langsam :(

Geschrieben

Hi,

also ich tippe mal auf enien defekt am Mainboard (anscheinend fallen die Onboard Komponenten nacheinander aus). Versuch doch mal (wenn möglich) deinen Ansatz mit dem Tausch der Komponenten weiter fortzusetzen (bleibt ja nicht mehr viel übrig)...ka inwieweit sich das noch lohnt... Schon mal einen Burn-In Test probiert?!

Geschrieben

Ich habe gestern Abend eine Synchronisierung gestartet und heute morgen hatte ich folgende Fehler in der Ereignisanzeige:

Beim SMART Selbsttest in DatentrΣger SAMSUNG HD642JJ auf Port SATA 0.1 wurde ein Fehler ermittelt. Ein Lese-Testelement schlug fehl. Bitte sichern Sie Ihre Daten sichern und ersetzen Sie die Festplatte

Quelle: NVRAIDSERVICE

und

Ein Paritätsfehler wurde auf \Device\Scsi\nvgts1 gefunden.

Weitere Informationen über die Hilfe- und Supportdienste erhalten Sie unter Events and Errors Message Center: Basic Search.

Quelle: NVGTS

Sieht doch nach defektem RAID-Controller aus, oder? Eventuell ist aber nur ein Kanal defekt, denn von der ersten Platte im Verbund kann ich einen SMART-Test machen (Ergebnis erfolgreich) und von der anderen zwar auch aber von der erhalte ich dann "Ergebnis nicht erfolgreich". Oder bedeutet das eher, dass die zweite Platte kaputt ist?

Frage: Kann ich einfach mal die zweite Platte ausbauen, in einen anderen Rechner hängen und dort checken lassen? Oder zerstört dies das RAID?

Was ich vergaß zu erwähnen: Auf den 640er-Platten ist das System mit drauf!

Geschrieben

Kannst Du mal schildern, was das für ein Raid Controller ist?!

Ich habe nämlich zumindest in Teilen den gleichen Fehler am Start:

"Ein Paritätsfehler wurde auf \Device\Scsi\nvgts1 gefunden."

ich habe mittlerweile auch die Treiber gewechselt (jetzt die generischen Treiber von XP Pro SP 3 über Windows Update, vorher die von Asus, Board ist ein M3N-H HDMI mit aktuellem Bios (Stand 29.4.). Der Klopper ist, dass Asus es nicht auf die Reihe kriegt, das aktuelle Treiberpaket runterladbar zu machen-mein Download bricht permanent ab-und damit hatte ich vorher nie Probleme).

Jetzt habe ich den generischen Treiber auch für's RAID gewählt, bislang habe ich noch keine Fehlermeldung erhalten, aber ich will mal nicht den Tag vor dem Abend loben ...

Geschrieben

Ist ein Nforce-Board, sprich Nvidia Raid.

Bis jetzt traten keine Fehler mehr auf aber ich kann weiterhin nicht den SMART-Selbsttest in der Nvidia-Systemsteuerung durchführen (Lesefehler auf Platte 2).

Geschrieben

nachdem ich jetzt von nForce Driver den Treiber runtergeladen habe und installiert habe, scheint jetzt endlich erstmal alles ok. Aber wie's nach einem Neustart aussieht, wird sich noch zeigen ...

vielleicht hilft's ja, den Treiber zu aktualisieren? Ist das schon der aktuellste Bios-Stand?

  • 1 Monat später...
Geschrieben
aber: vielleicht unterstützt die Platte gar kein SMART? Oder die Funktion ist deaktiviert?

Hi,

sry, späte Meldung aber ich war mit dem Prüfungsstress beschäftigt ^^

Also die Platte unterstützt natürlich SMART denn die erste tut es ja auch. Kenne auch eigtl keine Platten mehr, die kein SMART können.

Und deaktiviert ist SMART auch nicht. Normale SMART-Werte gibt die Platte ja laut Nvidia-Raid-Tool aus, nur beim tiefergreidendem Test gibt es Lesefehler.

Ich werde diese Woche die entsprechende Platte mal ausbauen und an einem anderen Rechner checken. Das dürfte ich doch theoretisch einfach so machen können, oder? Und danach kann ich die Platte wieder einstecken. Was passiert, wenn ich auf die Platte in der Zwischenzeit was schreibe? Angenommen irgendwas im WIndows-Verzeichnis?

Wie erkennt das RAID dann, von welcher Platte es booten muss und wie es rekonstruieren muss?

Geschrieben

Laeuft der Server im Dauerbetrieb (24x7)?

Ja -> Dann hast Du verkehrte Festplatten drin.

Die Samsung Spinpoint HD642JJ ist eine Desktop-Festplatte.

Desktop-Festplatten sind fuer einen taeglichen Betrieb von normalerweise max. 8h ausgelegt, nicht fuer den Dauerbetrieb eines Servers.

Fuer den Dauerbetrieb eines Servers waere von Samsung nur die Spinpoint-Serie F1 Raid geeignet.

Wenn SMART-Festplattenfehler meldet, dann helfen nur diese Schritte:

- Daten retten

- Platte austauschen

Geschrieben
Laeuft der Server im Dauerbetrieb (24x7)?

Ja, Server halt.

Ja -> Dann hast Du verkehrte Festplatten drin.

Nein, da Privatserver/Homeserver. ;-)

Desktop-Festplatten sind fuer einen taeglichen Betrieb von normalerweise max. 8h ausgelegt, nicht fuer den Dauerbetrieb eines Servers.

Mag sein, in einem meiner Rechner läuft seit 6 Jahren die selbe Platte ohne Unterbrechung (Linux-Router) - eine alte 20GB-Platte. Es werden pro Tag ca. 100 MB an LOG-Dateien geschrieben.

Wenn SMART-Festplattenfehler meldet, dann helfen nur diese Schritte:

- Daten retten

- Platte austauschen

Da setzte meine Frage an: Wie genau? Kann ich die entsprechende Platte erstmal ausbauen und evtl. in einen anderen Rechner einbauen und dort bspw. per chkdsk oder irgendwelchen SMART-Tools auslesen? Oder kann es da Probleme geben wenn ich die Platte schließlich wieder ins RAID danach hänge _falls_ Daten auf die Platte geschrieben worden?

Kann ich bei dem RAID die Platte einfach während des Betriebes entfernen? (SATA2-Hotplug) Und wieder reinstecken?

Ich habe sowas bei solchen "billigen Raids" noch nie gemacht. Auf meiner Arbeitsstätte sind die Geräte halt viel komfortabler (NetApp-Geräte) wo das alles kein Problem darstellt.

Ich glaube halt eher an einen RAID-Fehler bzw. Controller-Fehler. Die Platten sind nagelneu und machen sonst keine Probleme. Auch meldet der RAID-Controller sonst keinerlei Probleme.

Dein Kommentar

Du kannst jetzt schreiben und Dich später registrieren. Wenn Du ein Konto hast, melde Dich jetzt an, um unter Deinem Benutzernamen zu schreiben.

Gast
Auf dieses Thema antworten...

×   Du hast formatierten Text eingefügt.   Formatierung wiederherstellen

  Nur 75 Emojis sind erlaubt.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Dein vorheriger Inhalt wurde wiederhergestellt.   Editor leeren

×   Du kannst Bilder nicht direkt einfügen. Lade Bilder hoch oder lade sie von einer URL.

Fachinformatiker.de, 2024 by SE Internet Services

fidelogo_small.png

Schicke uns eine Nachricht!

Fachinformatiker.de ist die größte IT-Community
rund um Ausbildung, Job, Weiterbildung für IT-Fachkräfte.

Fachinformatiker.de App

Download on the App Store
Get it on Google Play

Kontakt

Hier werben?
Oder sende eine E-Mail an

Social media u. feeds

Jobboard für Fachinformatiker und IT-Fachkräfte

×
×
  • Neu erstellen...