Problemy z serwerem

Z Thomas-Krenn-Wiki
Przejdź do nawigacji Przejdź do wyszukiwania

Artykuł ten opisuje możliwe sposoby analizy problemu podczas awarii serwera.

Serwer nie może zostać ponownie uruchomiony

Serwer nie może zostać ponownie włączony.

Kontrola informacji dostarczanych przez diody statusu i sygnał akustyczny

Kontrola następujących rzeczy:

  1. Świecą się lub mrugają jakieś diody serwera?
  2. Generuje serwer (lub jakiś jego komponent jak np. kontroler RAID) akustyczny sygnał?

Kontrola w instrukcji (serwera, płyty głównej, komponentów). W instrukcji znajduje się często opis znaczenia poszczególnych zachowań diod jak i sygnałów akustycznych. Jeżeli nie można w ten sposób określić bliżej przyczyny problemu to należy przeprowadzić kolejne kroki.

Odizolowanie serwera, podłączenie dedykowanego monitora i klawiatury

Należy przeprowadzić następujące kroki:

  1. Odłączyć wszystkie kable od serwera (kabel: zasilania, sieciowy, monitora, klawiatury, myszy itd.).
  2. Odczekać 10 sekund.
  3. Podłączyć wszystkie kable.
  4. Podłączyć dedykowany monitor i klawiaturę (nie przez switch KVM). Wcześniejsza kontrola z innym komputerem czy monitor i klawiatura funkcjonują.
  5. Włączyć serwer.

Jeżeli problem nadal występuję należy przeprowadzić następujące kroki.

Testy serwera w minimalnej konfiguracji

Należy przeprowadzić następujące kroki:

  1. Odłączyć wszystkie kable od serwera (kabel: zasilania, sieciowy, monitora, klawiatury, myszy itd.).
  2. Otworzyć obudowę serwera.
  3. Odłączenie wszystkich opcjonalnych kabli z płyty głównej, które nie są konieczne do pracy w minimalnej (np. kable do kontrolera on-board SATA).
  4. Wymontować wszystkie karty PCI/PCIe.
  5. Wymontować wszystkie moduły pamięci RAM, które nie są potrzebne do uruchomienia płyty głównej w minimalnej konfiguracji.
  6. Zamknąć obudowę serwera.
  7. Podłączyć kable zasilania, monitora i klawiatury.
  8. Włączyć serwer.

Opcjonalnie w systemach dual CPU może zostać jeszcze wymontowany jeden procesor. Jeżeli jednak problem nadal występuję to należy przeprowadzić następujące kroki:

Wymiana podzespołów

Należy systematycznie wymienić następując komponenty w podanej kolejności. Należy pamiętać, aby zawsze uprzednio zostały odłączone od serwera wszystkie kable (zasilania, sieciowy, monitora, klawiatury, myszy itd.). Po wymianie danego podzespołu należy zawsze przetestować czy serwer funkcjonuje.

  1. Pamięć RAM (instalacja minimalnej ilości potrzebnej do uruchomienia płyty głównej)
  2. Zasilacz
  3. Procesor
  4. Płyta główna

Serwer działa, ale podczas pracy występują problemy

Sieć nie jest osiągalna

  1. Instalacja aktualnych sterowników
  2. Odłączenie serwera od sieci i próba bezpośredniego połączenia przez kabel crossover z innym urządzeniem sieciowym. Wyklucza to zakłócenia pracy przez inne urządzenia (switch, firewall itd.) w sieci.

Niska wydajność macierzy RAID

  1. Kontrola czy wykorzystywany jest sterownik i firmware z tego samego Codeset-u producenta
  2. Kontrola statusu macierzy. Jeżeli macierz ma status "initializing" lub "degraded" to wydajność będzie niższa do momentu zmiany statusu na normal
  3. Kontrola konfiguracji bufora zapisu (write Cache). Podczas korzystania z BBU powinien on być włączony (ON).

Sygnał akustyczny

  1. Zlokalizowanie źródła. Komponenty takie jak backplane, kontroler i płyta główna posiadają możliwość sygnalizacji awarii przez sygnał akustyczny.

Najczęściej macierz RAID nie jest w optymalnym stanie, gdy serwer generuje sygnał akustyczny.

Sporadyczne wypadanie dysków HDD z macierzy RAID

  1. W systemach z kontrolerem SCSI należy najpierw wymienić terminator lub go skontrolować
  2. Skontrolowac czy serwer nie jest poddany silnym wibracja (które mogą być spowodowane np. przez niesprawny wentylator)

Dalsze informacje

Powiązane artykuły

Flashowanie firmware'u na karcie sieciowej Emulex OCE14102
Określenie modelu płyty głównej wykorzystywanej w systemie
Podstawowe informacje o NVMe