Problemy z serwerem
Artykuł ten opisuje możliwe sposoby analizy problemu podczas awarii serwera.
Serwer nie może zostać ponownie uruchomiony
Serwer nie może zostać ponownie włączony.
Kontrola informacji dostarczanych przez diody statusu i sygnał akustyczny
Kontrola następujących rzeczy:
- Świecą się lub mrugają jakieś diody serwera?
- Generuje serwer (lub jakiś jego komponent jak np. kontroler RAID) akustyczny sygnał?
Kontrola w instrukcji (serwera, płyty głównej, komponentów). W instrukcji znajduje się często opis znaczenia poszczególnych zachowań diod jak i sygnałów akustycznych. Jeżeli nie można w ten sposób określić bliżej przyczyny problemu to należy przeprowadzić kolejne kroki.
Odizolowanie serwera, podłączenie dedykowanego monitora i klawiatury
Należy przeprowadzić następujące kroki:
- Odłączyć wszystkie kable od serwera (kabel: zasilania, sieciowy, monitora, klawiatury, myszy itd.).
- Odczekać 10 sekund.
- Podłączyć wszystkie kable.
- Podłączyć dedykowany monitor i klawiaturę (nie przez switch KVM). Wcześniejsza kontrola z innym komputerem czy monitor i klawiatura funkcjonują.
- Włączyć serwer.
Jeżeli problem nadal występuję należy przeprowadzić następujące kroki.
Testy serwera w minimalnej konfiguracji
Należy przeprowadzić następujące kroki:
- Odłączyć wszystkie kable od serwera (kabel: zasilania, sieciowy, monitora, klawiatury, myszy itd.).
- Otworzyć obudowę serwera.
- Odłączenie wszystkich opcjonalnych kabli z płyty głównej, które nie są konieczne do pracy w minimalnej (np. kable do kontrolera on-board SATA).
- Wymontować wszystkie karty PCI/PCIe.
- Wymontować wszystkie moduły pamięci RAM, które nie są potrzebne do uruchomienia płyty głównej w minimalnej konfiguracji.
- Zamknąć obudowę serwera.
- Podłączyć kable zasilania, monitora i klawiatury.
- Włączyć serwer.
Opcjonalnie w systemach dual CPU może zostać jeszcze wymontowany jeden procesor. Jeżeli jednak problem nadal występuję to należy przeprowadzić następujące kroki:
Wymiana podzespołów
Należy systematycznie wymienić następując komponenty w podanej kolejności. Należy pamiętać, aby zawsze uprzednio zostały odłączone od serwera wszystkie kable (zasilania, sieciowy, monitora, klawiatury, myszy itd.). Po wymianie danego podzespołu należy zawsze przetestować czy serwer funkcjonuje.
- Pamięć RAM (instalacja minimalnej ilości potrzebnej do uruchomienia płyty głównej)
- Zasilacz
- Procesor
- Płyta główna
Serwer działa, ale podczas pracy występują problemy
Sieć nie jest osiągalna
- Instalacja aktualnych sterowników
- Odłączenie serwera od sieci i próba bezpośredniego połączenia przez kabel crossover z innym urządzeniem sieciowym. Wyklucza to zakłócenia pracy przez inne urządzenia (switch, firewall itd.) w sieci.
Niska wydajność macierzy RAID
- Kontrola czy wykorzystywany jest sterownik i firmware z tego samego Codeset-u producenta
- Kontrola statusu macierzy. Jeżeli macierz ma status "initializing" lub "degraded" to wydajność będzie niższa do momentu zmiany statusu na normal
- Kontrola konfiguracji bufora zapisu (write Cache). Podczas korzystania z BBU powinien on być włączony (ON).
Sygnał akustyczny
- Zlokalizowanie źródła. Komponenty takie jak backplane, kontroler i płyta główna posiadają możliwość sygnalizacji awarii przez sygnał akustyczny.
Najczęściej macierz RAID nie jest w optymalnym stanie, gdy serwer generuje sygnał akustyczny.
Sporadyczne wypadanie dysków HDD z macierzy RAID
- W systemach z kontrolerem SCSI należy najpierw wymienić terminator lub go skontrolować
- Skontrolowac czy serwer nie jest poddany silnym wibracja (które mogą być spowodowane np. przez niesprawny wentylator)