Implanté à Montpellier, le Centre International de Recherche Agronomique pour le Développement est un établissement public industriel et commercial qui se consacre à la recherche en matière d’agriculture et de développement au profit et en collaboration avec les pays du sud. Le Cirad emploie 1 800 agents dont 800 chercheurs répartis sur 3 départements scientifiques et 36 unités de recherche. Son réseau mondial se compose de 12 directions régionales qui collaborent avec plus de 90 pays.

Le projet en bref

cirad-logo

Secteur d’activité

  • Recherche et développement en agronomie

L’entreprise

  • Le Centre International de Recherche Agronomique pour le Développement travaille sur les problématiques agricoles intéressant les pays du sud.

Le défi industriel

Mise en œuvre d’une plate-forme de bio-informatique pour organiser et valoriser des données de génomique végétale.

La solution

  • 1 cluster primaire de 8 nœuds EMC Isilon X200
  • 1 cluster secondaire EMC Isilon de 3 nœuds 36NL
  • 1 nœud NL400

Les bénéfices du projet

    Une plate-forme performante, évolutive, d’une grande fiabilité et en bonne adéquation avec les besoins de la communauté scientifique.

Une plate-forme de calcul appliquée à la recherche génétique et génomique

Le Cirad produit et transmet des connaissances pour accompagner le développement agricole des pays du sud. Organisme orienté vers une recherche finalisée, il établit sa programmation à partir des besoins exprimés par ses partenaires. Il s’est doté de 2 puissants outils informatiques de pointe dont une plate-forme dédiée à la bio-informatique appliquée à la génétique et à la génomique des plantes tropicales et méditerranéennes.

Cet outil est exploité par l’unité mixte de recherche AGAP – pour Amélioration génétique et adaptation des plantes méditerranéennes et tropicales – qui associe le Cirad, l’Inra (*) et Montpellier SupAgro (**). La plate-forme AGAP a pour objet d’analyser et d’organiser les données générées par les travaux de recherche afin de les rendre facilement accessibles à la communauté scientifique internationale. Son but est aussi de valoriser l’information sur les espèces modèles par l’analyse comparative, structurale et fonctionnelle de génomes apparentés.

Ces objectifs de travail ont nécessité la mise en place en 2010 d’un puissant cluster de calcul (1,7 Tflops) associé à une grappe de disques rapides offrant 20 To d’espace de travail, le tout adossé à d’importantes capacités de stockage de données, capables de répondre aux sollicitations de plusieurs centaines d’utilisateurs et aux requêtes de plusieurs milliers de connexions internet.

Un stockage évolutif adapté aux besoins du calcul à haute performance

Le choix d’une solution de stockage réseau NAS a été arrêté fin 2011 sur la base d’un cahier des charges prenant en compte les exigences spécifiques du calcul haute performance ainsi que les besoins de sauvegarde d’un nombre important d’utilisateurs opérant sur site et à distance. La problématique étant nouvelle, l’équipe projet n’avait qu’une visibilité approximative de l’évolution de la capacité de stockage mais elle a cependant décidé de la scinder en 2 entités distinctes et complémentaires avec un NAS primaire, capacitif, performant et très réactif, et un NAS secondaire à haute densité et plus économique, puisqu’orienté vers l’archivage à haute accessibilité. Compte tenu de la non-prédictibilité des volumes de données produits par les nombreux projets de recherches utilisant la plate-forme, notamment tous les travaux liés au génotypage, il était également impératif de sélectionner une solution capable de croître aisément en volumétrie, sans perturber le fonctionnement de la plate-forme ni interrompre les travaux des utilisateurs.

« La plate-forme AGAP dispose d’un niveau de performance optimal y compris dans le domaine du stockage. Nous avons particulièrement apprécié la facilité d’évolution des NAS qui n’imposent aucune interruption de service lors de l’ajout des nœuds supplémentaires, ainsi que la simplicité d’administration qui est en totale adéquation avec nos besoins. De plus, durant les 24 mois d’exploitation écoulés nous n’avons déploré aucun dysfonctionnement entraînant l’arrêt du service»

Bertrand Pitollat, Administrateur Système

Après consultation de plusieurs fournisseurs, c’est finalement la proposition d’EMC Isilon qui a été retenue. L’intégration de l’ensemble de la plate-forme a été confiée à la société Serviware, filiale du groupe Bull spécialisée dans le calcul haut performance (HPC) et qui compte Isilon parmi ses partenaires habituels. Deux ensembles constituent le système de stockage : un NAS primaire composé de 8 nœuds EMC Isilon X200 totalisant une capacité de 80 To, chaque nœud étant doté de 12 disques Sata de 1 To (avec 6 Go de RAM et 4 interfaces réseau à 1 Gbit/s) et un NAS secondaire dédié à la sauvegarde composé de 3 nœuds EMC Isilon 36NL et d’un nœud NL400 totalisant 120 To, chacun équipé de 36 disques Sata de 1 To (avec 12 Go de RAM et 4 interfaces réseau à 1 Gbit/s).

Les 2 NAS ont été configurés en protection N + 2:1 ce qui leur permet de supporter la perte de 2 disques sur un nœud voir un nœud complet sans perte de donnée. Ils ont également été dotés de plusieurs logiciels applicatifs fournis par EMC Isilon tels qu’Insight IQ (pour le reporting), Smartconnect Advanced (équilibrage de charge), SnapshotIQ (état instantané de la base de données), SyncIS (réplication asynchrone) et Smart Quotas (attribution de quotas aux utilisateurs), ce dernier uniquement sur le NAS primaire.

En fonction des évolutions du plan de charge d’AGAP, des augmentations de puissance de calcul, de capacité de stockage et de sauvegarde sont envisagées de même qu’un archivage long terme.