Avec l’adoption du cloud, l’intérêt des entreprises pour les architectures de stockage SAN et NAS scale-out progresse. Ces architectures partagent des caractéristiques communes. Tout d’abord, elles s’appuient sur l’assemblage de nœuds de stockage standards généralement composés de serveurs 86 disposant de leurs propres tiroirs de disque en un système cohérent à même de délivrer des services de stockage en mode NAS (NFS ou SMB) ou en mode SAN (iSCSI, Fibre Channel ou FCoE). Ensuite, elles sont évolutives : du fait de leur nature « scale-out », les systèmes de stockage en cluster évoluent par simple ajout de nœud. Cette opération permet à la fois d’augmenter la capacité du système mais aussi ses performances ainsi que, dans certains cas, sa tolérance aux pannes.

Les plus évolutifs des systèmes de stockage en cluster ont la capacité de gérer plusieurs Petaoctets de données sur plus de 10 000 nœuds, mais ils sont accessibles et gérés comme un seul système stockage grâce à l’utilisation d’un système de gestion de fichiers en général propriétaire (ce système est la clé du fonctionnement du cluster). Chez EMC, plusieurs technologies utilisent des architectures scale-out : Isilon est la solution proposée par le constructeur pour le stockage scale-out en mode NAS, tandis que ScaleIO est la technologie développée par EMC pour le stockage scale-out en mode bloc. VMware propose aussi son propre système de stockage logiciel en mode scale-out, VSAN, intégré à vSphere. Dans sa version actuelle il est limité à 32 nœuds, alors qu’un cluster Isilon peut comprendre plus de 100 nœuds et un cluster Scale-IO plusieurs dizaines de milliers de nœuds. Notons au passage que ces chiffres sont des limites hautes. Tous ces systèmes peuvent être utilisés à partir de 3 nœuds, ce qui les rend aussi adaptés aux PME.

L’un des grands intérêts des systèmes scale-out est qu’ils permettent de faire évoluer l’infrastructure au gré des besoins de l’entreprise et qu’ils peuvent être optimisés selon les besoins pour la capacité ou les performances. Les architectures scale-out NAS permettent aussi des migrations en douceur, plus simples que les systèmes traditionnels, et sans interruption sur la production, une caractéristique qui devient de plus en plus importante à l’heure où les systèmes d’information doivent être disponibles de façon quasi continue.

Des architectures distribuées très souples

L’une des différences clés entre les systèmes scale-out et les systèmes de stockage traditionnels comme une baie EMC VMAX est que les nœuds ne sont pas couplés de façon serrée (on parle d’une architecture de type « Loosely coupled »). Les nœuds ne partagent pas leur mémoire ou leur cache. La résilience provient du mécanisme de distribution qui assure la protection des données (soit par réplication des blocs ou des fichiers sur plusieurs nœuds, soit par un mécanisme de Raid distribué, soit par un mécanisme de type Erasure codes – un algorithme calcule des informations de parité et les distribue de façon à pouvoir reconstruire les données en cas de perte de disques ou de nœuds).

Du fait des communications entre nœuds au sein du cluster, l’un des principaux défis de ces architectures et de veiller à ce que la latence des opérations d’entrées-sorties (notamment en écriture) n’explose pas. Pour cela, chaque nœud dispose en général d’un étage de cache NVRAM ou SSD utilisé pour acquitter les opérations d’IO en écriture de façon rapide (le délestage des données sur disque se faisant dans un second temps, une fois que les données ont été au moins acquittées par deux nœuds afin de garantir l’intégrité des IO). Schématiquement, une donnée est transmise par un serveur à un nœud qui la reçoit, la stocke dans son cache et la duplique aussi rapidement que possible dans le cache d’un autre nœud. Une fois la donnée présente sur deux nœuds, l’opération d’IO est acquittée vers le serveur. La donnée est alors traitée (éventuellement compressée, dédupliquée…) par le cluster de stockage, puis écrite sur disque et le cache purgé en conséquence. En lecture, un système de métadonnées permet d’orienter les requêtes vers le nœud approprié et la distribution des données fait que plusieurs nœuds peuvent participer aux opérations d’entrée sorties ce qui permet d’obtenir des performances en lecture impressionnantes.

La différence entre les systèmes scale-out dépend en général de l’intelligence en matière de placement de données, des mécanismes interne de gestion des écritures et des mécanismes de protection de données. Certaines technologies sont aussi bien adaptées à la mise en œuvre d’architectures convergées ou le stockage cohabite avec les autres fonctions du serveur (c’est notamment le cas de VSAN de VMware et de ScaleIO d’EMC). Et c’est là qu’intervient le savoir-faire du contructeur. Par exemple, l’architecture de stockage scale-out VSAN de VMware veille à placer les données d’une VM sur le serveur qui accède à cette VM de façon à minimiser les communications inter-nœuds dans le cluster. Un autre point important est le débit du réseau entre les nœuds. De façon générale, toutes les architectures scale-out s’appuient sur des interconnexions de type 10 Gbit Ethernet ou Infiniband. Dans tous les cas, il ne faut pas attendre d’une architecture de type scale-out le niveau de latence extrêmement bas que peut proposer une architecture bi-contrôleur de type VNX ou une architecture NUMA de type VMAX.

Des performances spectaculaires

En revanche, il est possible d’atteindre des niveaux d’IOPS extrêmement élevé du fait du très grand nombre de nœuds (et donc de disques) utilisés. Ainsi dans une évaluation de la technologie ScaleIO réalisée avec des serveurs Cisco ECS, le cabinet d’étude ESG a obtenu une performance de plus de 830 000 d’IOps en lecture de blocs de 4K avec un cluster de 8 nœuds et 8,5 millions d’IOPS en lecture aléatoire de blocs de 4K avec un cluster de 53 nœuds, le tout avec une bande passante plafond de l’ordre de 114 Go/s (sur des blocs de 64K). ESG a publié les résultats détaillés de son test sur son site web.

En savoir plus :