Pocket

4_isilonServir à la fois les besoins extrêmes du Big Data (grande capacité, faibles temps de réponse, administration simplifiée) et ceux de l’entreprise traditionnelle (sécurité, interopérabilité, continuité d’activité), tel est le double but recherché par EMC dans la conception des solutions de stockage NAS « Scale-Out » Isilon.

La solution Isilon est constituée, pour la partie matérielle, d’un cluster de nœuds basés sur des éléments standards (processeurs x86, mémoire, disques, NVRAM avec batterie de secours pour parer aux interruptions de courant et interconnexion InfiniBand). Toute la logique de l’ensemble réside dans le système d’exploitation unique OneFS. OneFS s’occupe du système de fichier, unique pour l’ensemble du cluster, de l’accès aux données via les protocoles standards (NFS, SMB, HTTP, FTP) ainsi que ceux plus récents (REST, SWIFT, HDFS), tout en assurant la protection de données.

Un cluster de contrôleurs pour un volume unique

Le système de fichiers considère l’ensemble des nœuds comme un seul volume logique. Pour les utilisateurs cela permet d’accéder, de manière transparente, à un système de fichier unique de très grande capacité, qui cumule les capacités de tous les nœuds sans effet de bord. Cette fonction existe sur d’autres solutions, mais à la différence de celles-ci, les solutions Isilon présentent l’avantage de ne pas être limitées. En effet, habituellement, le contrôleur de ce genre de solutions de stockage impose des volumes de 100 To maximum et voit ses performances se dégrader au fur et à mesure de l’ajout de volumétrie, voire ne sait gérer qu’un nombre limité de nœuds. Dans la solution Isilon, chaque nœud contient un contrôleur, avec son propre cache, avec sa propre puissance de gestion des entrées-sorties. De fait, il n’y a plus de limites : on peut atteindre une capacité de 50 Po pour un volume sans jamais observer une quelconque baisse de performances. EMC estime ainsi qu’il est possible d’atteindre sur un cluster Isilon 3 millions d’IOPS, avec un débit simultané de 200 Go/s. Bien entendu, la solution Isilon s’administre simplement, avec les outils de Microsoft Management Console (MMC) typiquement.

Chaque nœud dispose de sa propre copie du système OneFS, mais une unique interface permet d’administrer le cluster, ce qui permet de réaliser des opérations très simplement. Typiquement, on peut étendre la capacité du système de fichier à chaud: après avoir connecté le nœud supplémentaire au cluster, un clic suffit pour bénéficier de la volumétrie et la performance apportée par celui-ci.

Plusieurs classes de stockage pour optimiser automatiquement les fichiers

Mieux, on peut mélanger dans le cluster des nœuds de différentes natures, certains avec des disques plus rapides (nœuds Isilon de la gamme S), d’autres avec des disques plus capacitifs (gamme NL) et d’autres qui apporte densité et performance (gamme X). Le logiciel Isilon SmartPools dresse ainsi une carte de l’organisation interne du cluster en pools de stockage, permettant à OneFS de savoir où il doit stocker les données en fonction de leur utilisation. On parle de hiérarchie du stockage. L’administrateur la définit en écrivant des règles dans SmartPools.

SmartPools peut par ailleurs considérer que les disques SSD, les plus rapides, seront exclusivement utilisés pour stocker les métadonnées, ces informations qui décrivent le contenu des fichiers et qui sont interrogées lors des traitements analytiques. Ce qui fait du cluster Isilon une solution particulièrement rapide dans le cadre de traitements Big Data, typiquement et, ce, avec un effort de paramétrage réduit au strict minimum.

Cela dit, lorsque le cluster Isilon n’est pas destiné aux traitements Big Data, les disques SSD peuvent tout aussi bien être considérés comme du cache, pour accélérer la lecture d’un grand nombre de fichiers stockés sur des nœuds NL ou X. par défaut, le cache utilise la mémoire DRAM des nœuds. Le fait d’utiliser des disques SSD pour le cache, permet à celui-ci d’être étendu (jusqu’à 1 Po avec des SSD, contre 37 To maximum en n’utilisant que la DRAM).

Mieux que le RAID, FlexProtect

Autre avantage de la gestion de l’ensemble des ressources comme un volume unique, OneFS distribue automatiquement les données sur tous les nœuds. Lors de l’écriture d’un fichier, mais aussi lorsque l’on ajoute un nœud à postériori : à ce moment-là, le processus interne AutoBalance de OneFS rééquilibre automatiquement les remplissages. Le fait que cette opération se fasse de manière transparente, sans solliciter l’administrateur, ne représente pas qu’un gain de temps : elle évite surtout les mauvaises reconfigurations manuelles qui, en moyenne, gaspillent 43% de la capacité de stockage. Selon une étude menée par EMC, le taux d’utilisation des Isilon dépasse les 80% de capacité avant que l’entreprise ne décide d’ajouter des nœuds supplémentaires. A noter qu’EMC propose en option le logiciel SmartDedupe qui augmente plus encore le taux d’utilisation.

Répartir les données sur tous les nœuds permet d’éviter de perdre des informations si un nœud tombe en panne. A contrario des acteurs traditionnels OneFS n’utilise pas la technologie RAID, mais FlexProtect. La différence ? Basée sur des algorithmes plus élaborés (erasure coding), FlexProtect offre une protection contre quatre défaillances simultanées, qu’elles surviennent au niveau des nœuds, comme au niveau des disques. Mieux, le temps de reconstruction des données en cas de défaillance est réduit car FlexProtect gère les informations de protection par fichier. C’est-à-dire qu’il ne restaure que ce qui a disparu et, en travaillant de concert avec AutoBalance, va trouver de la puissance de calcul disponible sur l’ensemble des nœuds constituant le cluster.

Il est à noter que OneFS n’attend pas qu’une défaillance survienne. Surveillant en permanence le cluster, il détecte les menaces de pannes et réalloue les fichiers vers les ressources les plus saines de manière transparente, tout en signalant à l’administrateur l’émergence d’un problème. Différents niveaux de protection sont possibles. On les définit par des règles pour chaque répertoire.

En option, EMC fournit les logiciels de clichés / point de restauration SnapshotIQ, qui peut créer jusqu’à 20.000 snapshots sur un cluster Isilon avec des restaurations qui ne durent généralement qu’une seconde, et SyncIQ qui réplique les fichiers de manière asynchrone et continue sur un site distant, en les divisant en plusieurs flux afin de sécuriser rapidement même les fichiers très volumineux.

Pour en savoir plus :

Vous trouverez ce rapport d’IDC et Gartner (en anglais)

et sur le site 

Pocket