Protéger l’entreprise contre les pertes de données liées aux pannes mécaniques ou électroniques des disques durs : c’est la mission de la technologie Raid (Redundant Array of Inexpensive Disks ou matrice redondance de disques économiques), une technologie mise en oeuvre par la plupart des baies de stockage du marché comme les baies VNX et VNXe d’EMC.

Du fait de leur nature mécanique, les disques durs qui stockent les données de nos ordinateurs ne sont pas à l’abri de pannes. Et ces mêmes pannes peuvent aussi se produire sur les baies de stockage d’entreprise, même si les disques de ces équipements sont sélectionnés de façon plus exigeante. Les baies de stockage d’entreprise ayant pour mission de protéger les données les plus importantes de l’entreprise, il est toutefois hors de question de ne pas se prémunir contre les éventuelles pannes ou dysfonctionnements d’un disque dur, sous peine de perdre irrémédiablement des données.

C’est pour parer à ces désagréments que la technologie Raid a été inventée. L’idée générale est la suivante : au lieu de stocker les données sur un disque unique, on crée des grappes composées de plusieurs disques, dont certains ont pour mission de fournir un niveau de redondance. Ainsi, en cas de défaillance d’un ou plusieurs disques, le contrôleur Raid de la baie pourra reconstituer à la volée les données contenues sur les disques défectueux. Le Raid permet donc de protéger les données contre les pannes mais aussi assure que la baie continue à fonctionner même avec un ou plusieurs disques défaillant, un point essentiel pour des applications informatiques qui de plus en plus doivent fonctionner 24 heures/24 et sept jours sur sept.

Protection informatique - Principe de base du Raid 1

En mode Raid1, toutes les données écrites sur le disque 1 sont clonées sur le disque 2.En cas de panne d'un disque, le système continuera ainsi à fonctionner normalement

Il existe toutefois de multiples modes raid adaptés à des scénarios d’usage différents. Selon le mode Raid choisi, une grappe de disques sera plus ou moins fiable et plus ou moins performante. Certains modes Raid permettent ainsi de se prémunir contre les pannes mécaniques d’un ou plusieurs disques tandis que d’autres permettent d’accroître les performances. Certains, enfin, permettent de combiner ces deux avantages.

Raid 1

Le Raid 1 (ou miroir) consiste à dupliquer sur autant de disques que contient la grappe, les données écrites sur le premier disque de la grappe. Ce faisant, le niveau de protection de données croît avec le nombre de miroirs. En cas de panne d’une unité, le contrôleur désactive automatiquement le disque incriminé et attend l’insertion d’un disque neuf pour rebâtir un nouveau disque miroir. Le prix à payer pour cette tolérance aux pannes est un coût élevé (lié au doublement du nombre de disques) et des performances en retrait (du fait des opérations de miroir à réaliser).

Raid 5

Utilisable à partir de trois disques, le Raid 5 permet de répartir les données sur l’ensemble des disques de la grappe et assure leur protection par le calcul d’informations de parité permettant de reconstituer les données en cas de défaillance d’un disque. Dans une grappe à n disques, chaque bande est constituée de n-1 blocs de données et d’un bloc de parité calculé à partir des n-1 blocs de données précédents. Une grappe Raid 5 peut ainsi survivre à la perte d’un disque : pour chaque bande, il manquera soit un bloc de données soit le bloc de parité. La perte du bloc de parité n’a aucun impact sur l’intégrité des données, tandis qu’un bloc perdu peut être recalculé à partir des blocs survivant et des informations de parité. Du fait de ces caractéristiques, une grappe Raid 5 moderne allie performances et fiabilité, sans trop sacrifier la capacité. Par exemple une grappe Raid 5 composée de 4 disques 1 To a une capacité utilisable de 3 To (1 To étant consommé par les informations de parité).

Protection de données - le mode Raid 5

Les données écrites sur une grappe Raid 5 peuvent survivre à la panne d'un disque de la grappe

Outre la protection des données, les principaux avantages du Raid 5 et du Raid 6 sont leurs performances élevées en lecture (à peu près similaires à celle du Raid 0 – voir ci-après) et leur meilleure utilisation de la capacité disponible par rapport au Raid 1. En revanche, le calcul de parité étant une opération gourmande en temps de calcul, elle a, en général, un impact sur la performance en écriture (même si les cartes Raid modernes et les processeurs récents ont largement réduit ce défaut).

Raid 6

L’un des problèmes du Raid 5 est que la reconstitution de la grappe après le remplacement d’un disque défectueux par une nouvelle unité est d’autant plus longue que la capacité des disques est élevée, ce qui peut présenter un risque si la grappe est constituée d’un grand nombre de disques et/ou si ceux-ci ont une grande capacité. La probabilité de panne d’un second disque pendant l’opération de reconstruction s’accroît en effet avec la capacité. Le Raid 6 a en partie été créé pour cette raison : pour chaque bande, on écrit deux blocs de parité, ce qui fait que l’on est protégé contre la panne de deux disques, au prix toutefois d’une capacité réduite.

Outre la protection des données, les principaux avantages du Raid 5 et du Raid 6 sont leurs performances élevées en lecture (a peu près similaires à celle du Raid 0) et leur meilleure utilisation de la capacité disponible par rapport au Raid 1. En revanche, le calcul de parité étant une opération gourmande en temps de calcul, elle a en général un impact perceptible sur la performance en écriture (même si les cartes Raid modernes et les processeurs récents ont largement réduit ce défaut).

RAID 0 : la performance au détriment de la fiabilité

Le Raid 0 (ou striping) permet d’obtenir des performances élevées en distribuant les données sur l’ensemble des disques d’une grappe mais sans aucune information de parité. Dans ce mode, les données à écrire sont découpées en bandes de tailles égales (ou stripe). Sur une configuration à trois disques, la première stripe est écrite sur le disque n° 1 tandis que la seconde est écrite en parallèle sur le disque n° 2 et la troisième sur le disque n° 3, et ainsi de suite en repartant du 1er disque. Le résultat est une grappe dont la capacité est égale à la somme des capacités de ses membres et dont les performances augmentent avec le nombre de disques.

Dans un monde parfait (où le temps de découpage en stripe serait nul et sans impact sur les performances), une grappe RAID 0 à quatre disques serait quatre fois plus véloce qu’un disque seul. Ce n’est pas tout à fait le cas, mais le mode RAID 0 permet d’obtenir des performances très élevées. Seul (vrai) problème : la panne d’un seul disque de la grappe entraîne la perte de l’ensemble des données de la grappe – or la probabilité d’une panne croit avec le nombre de disques… Le Raid 0 est donc à réserver aux applications qui ont un besoin absolu de performances mais pour lesquelles la perte de données est un risque acceptable.

Quel mode Raid choisir pour quel usage ?

Notons qu’en plus des modes standards, il est possible avec certains contrôleurs Raid possible de combiner plusieurs modes raid. Par exemple, le Raid 10 permet de « striper » des agrégats raid en miroir, en clair de faire du Raid 0 à partir de grappe en Raid 1. Le résultat est un ensemble de disques alliant les performances du Raid 0 avec la fiabilité des grappes en miroir sous-jacentes.

Comprendre le principe des modes Raid est une chose, les utiliser à bon escient en est une autre. Il est par exemple courant de placer le volume de démarrage d’un serveur sur une grappe en Raid 1 (le miroir permet de se prémunir contre une panne sur un disque de boot). Le Raid 10 est préconisé pour les applications nécessitant beaucoup d’écritures aléatoires et un assez haut niveau de protection. Microsoft, par exemple, le recommande pour son serveur de messagerie Exchange, tandis qu’Oracle le préconise pour les applications de bases de données transactionnelles intensives. Le Raid 5, enfin, est une bonne approche pour les applications NAS bureautiques ou pour les applications de bases de données effectuant essentiellement des opérations de lecture (cas d’un datawarehouse par exemple). Il est à noter pour terminer que des baies récentes comme les baies VNXe d’EMC savent sélectionner automatiquement le mode de protection adapté aux principales applications du marché. Ce qui dans la plupart des cas vous évite d’avoir à vous préoccuper du mode Raid (sauf bien sûr si vous voulez conserver un contrôle manuel sur ce paramètre).