RAID

Z Thomas-Krenn-Wiki
Przejdź do nawigacji Przejdź do wyszukiwania

Jako RAID (Redundant Array of Independent Disks) określane jest połączenie kilku dysków lub innych nośników danych w jeden logiczny wolumen. W zależności od poziomu RAID możliwe jest zwiększenie bezpieczeństwa danych jak i zwiększenie wydajności w stosunku do jednego dysku. Macierze RAID mogą być realizowane za pomocą kontrolerów sprzętowych, programowych lub firmware/driver.

Poziomy RAID

RAID Level RAID 0 RAID 1 RAID 4 RAID 5 RAID 6 RAID 10
Minimalna ilość dysków 2 2 3 3 4

(5 z kontrolerami 3ware)

4
Sposób funkcjonowania RAID 0 RAID 1 RAID 4 RAID 5 RAID 6 RAID 10
Ochrona danych brak awaria jednego
dysku
awaria jednego
dysku
awaria jednego
dysku
awaria dwóch
dysków
awaria
jednego dysku
na sub array
Wykorzystanie powierzchni dyskowej 100% 50% 67% - 94% (z 16 HDD) 67% - 94% (z 16 HDD) 50% - 88% (z 16 HDD) 50%
Rebuild po awarii jednego dysku brak możliwości,
utrata danych!
(*)
dane są kopiowane z drugiego dysku zawartość dysku jest obliczana za pośrednictwem funkcji XOR (pozostałe dyski muszą zostać w całości odczytane) zawartość dysku jest obliczana za pośrednictwem funkcji XOR (pozostałe dyski muszą zostać w całości odczytane) zawartość dysku jest obliczana (zależne od realizacji konkretnego RAID 6) dane są kopiowane z drugiego dysku
Rebuild po awarii 2 dysków brak możliwości,
utrata danych!
(*)
brak możliwości,
utrata danych!
(*)
brak możliwości,
utrata danych!
(*)
brak możliwości,
utrata danych!
(*)
zawartość dysku jest obliczana (zależne od realizacji konkretnego RAID 6) możliwy jedynie w przypadku, gdy drugi dysk pochodzi z innego sub array, dane są kopiowane z drugiego dysku

(*) W wielu przypadkach dane mogą zostać odzyskane tylko za pośrednictwem profesjonalnego odzyskiwania danych.

RAID 0

  • Wysoka wydajność: zarówno podczas odczytu jak i zapisu wykorzystywanych jest kilka dysków.
  • Brak odporności na awarię dysków: awaria jednego dysku powoduje utratę wszystkich danych wolumenu RAID.
RAID 0: wysoka wydajność, ale brak odporności na awarię


RAID 1

  • Wydajność: podczas zapisu wydajność jest zbliżona do wydajności jednego dysku, podczas odczytu większej ilości danych istnieje możliwość odczytu z obu dysku i w ten sposób zwiększenie wydajności.
  • Odporność na awarię dysków: wszystkie dane są zdublowane, awaria jednego dysku nie powoduje utraty danych.
RAID 1: wszystkie dane są zdublowane


RAID 4

RAID 4 funkcjonuje podobnie jak RAID 5, sumy kontrolne są zapisywane tylko na jednym dedykowanym dysku - nie są rozproszone na wszystkich dyskach tak jak w RAID 5.

RAID 4: sumy kontrolne są zapisywane tylko na jednym dysku, w przypadku awarii jednego dysku i po jego wymianie na nowy zawartość może zostać zrekonstruowana


RAID 5

  • Awaria jednego dysku nie powoduje utraty danych: ponadto w RAID 5 może zostać wykorzystana większa powierzchnia dyskowa niż jest to możliwe w przypadku RAID 1, gdzie wykorzystane może zostać jedynie 50% sumy pojemności dysków.
  • Sumy kontrolne: zamiast dublowania danych w RAID 5 obliczane są sumy kontrolne, wykorzystywana jest do tego funkcja XOR.
  • Rozmieszczenie sum kontrolnych: sumy kontrolne w RAID 5 są rozproszone na wszystkich dostępnych dyskach. W przeciwieństwie do RAID 4, gdzie wszystkie sumy kontrolne są zapisane na jednym dedykowanym dysku, co w RAID 4 zwiększa zużycie tego dedykowanego dysku w porównaniu z pozostałymi w macierzy. Dlatego obecnie RAID 4 nie gra znaczącej roli.
  • Wyższa wydajność odczytu: podczas odczytu większej ilości danych odczyt może zostać przeprowadzone równocześnie z kilku dysków i w ten sposób może zostać zwiększona wydajność w porównaniu z jednym dyskiem.
  • Wydajność zapisu: podczas zapisu mniejszej ilości danych konieczna jest wcześniejsza operacja odczytu, aby obliczyć nowa sumę kontrolną dla danego stripe i późniejszy zapis (read-modify-write, write penalty). W przypadku kontrolerów sprzętowych RAID ze zintegrowanym cachem jest to minimalizowane przez bufor.
  • Konieczność inicjalizacji podczas tworzenia RAID 5: aby operacje read-modify-write funkcjonowały prawidłowo musi pierwotna suma kontrolna być poprawna. Zapewnione może to zostać przez inicjalizację macierzy RAID 5 podczas jej tworzenia. Proces incjalizacji w zależności od wielkości macierzy może potrwać od paru godz. do kilku dni. W przeciwieństwie do tego RAID 1 i RAID 6 (przynajmniej w software RAID w Linuksie) nie wymaga inicjalizacji.[1]
  • Czasochłonna procedura odzyskiwania danych zapisanych na uszkodzonym dysku: w RAID 1 po awarii jednego dysku jest po prostu kopiowana na nowy dysk zawartość pozostałego, sprawnego dysku. W przypadku awarii dysku w RAID 5 zawartość uszkodzonego dysku jest obliczana za pośrednictwem funkcji XOR po odczytaniu danych ze wszystkich pozostałych dysków wolumenu.
RAID 5: Sumy kontrolne są podzielone między wszystkie nośniki danych, w przypadku gdy jeden nośnik danych ulegnie awarii i zostanie zastąpiony nowym to jego zawartość może zostać zrekonstruowana


RAID 6

  • Awaria dwóch dysków nie powoduje utraty danych
  • Różne implementacje RAID 6: istnieją różne matematyczne możliwości obliczania podwójnych sum kontrolnych i ich wykorzystywania (np. Galois field lub RAID DP)
RAID 6: podwójne sumy kontrolne pozwalają na awarie dwóch nośników bez utraty danych


RAID 10

RAID 10: oferuje wysoką wydajność jak RAID 0 w połączeniu z bezpieczeństwem danych macierzy RAID 1


RAID: Zapobieganie utracie danych i odzyskiwanie danych

W artykule odzyskiwanie danych znajdują się informacje, które należy znać korzystając z systemu RAID:

  • Objawy zbliżającej się awarii.
  • Jakie zagrożenia czyhają w systemach RAID.
  • Zapobieganie utracie danych w macierzy RAID.

Odnośniki

  1. RAID is more than parity and mirrors (Vortrag Neil Brown bei der LCA 2013)

Dalsze informacje


Autor: Werner Fischer

Powiązane artykuły

Tworzenie logów diagnostycznych kontrolerów RAID i serwera Intel Modular Server
Update firmware'u kontrolerów RAID firmy Adaptec za pośrednictwem ASM
Wybór odpowiedniego poziomu RAID dla określonego zastosowania