Chaque jour, les entreprises amassent des quantités conséquentes de données stockées sous la forme de documents, d’enregistrements dans des applications et de multiples autres formats. Dans la plupart des cas, ces informations doivent être protégées et archivées que ce soit pour des raisons métiers ou des raisons réglementaires.

Le problème est que la part active des données stockées par les entreprises ne cesse de régresser. On estime ainsi que près de 80 % des données stockées par les entreprises, quelle que soit leur taille, sont inactives, c’est-à-dire pas ou rarement accédées. Pourtant ces données occupent souvent un espace de stockage coûteux et ont un coût opérationnel non négligeable. Leur simple existence nuit à la performance générale des applications, et a un impact quotidien sur les performances et le coût de gestion des applications. Si dans une application 80 % des données sont dormantes, cela veut dire que les performances de l’application pourraient être accrues de façon importante en archivant ces 80 %. De même des gains opérationnels non négligeables pourraient être réalisés en matière de serveurs (il faut moins de puissance CPU pour faire des recherches dans une base de 20 Go que dans une base de 100 Go), de stockage (pas la peine de stocker ses 80 % de données inutiles dans un stockage primaire coûteux…), mais aussi de licences logicielles (de bases de données, etc.).

Un autre problème est que les entreprises hésitent à décommissionner des applications obsolètes faute d’une plate-forme adéquate pour archiver leur contenu, parfois visé par des contraintes réglementaires fortes

C’est pour répondre à l’ensemble de ces besoins que la division IIG d’EMC, qui héberge notamment la solution de gestion de contenus Documentum, a conçu la plate-forme d’archivage InfoArchive.

Une plate-forme nouvelle pour l’archivage de données structurées et non structurées, actives ou non 

Lancée au printemps, la plate-forme InfoArchive 3.0 a été présentée par Rick Devenutti, le patron d’EMC IIG comme la solution ultime pour l’archivage de données, structurées ou non, active ou non, et pour le décommisionnement d’applications et des données associées — les besoins en la matière sont, il est vrai, énormes puisque d’ici 2020, 50 % des applications existant aujourd’hui auront été mises à la retraite.

Infoarchive

InfoArchive est une plateforme homogène, flexible et évolutive, dont l’objectif est de devenir le point central l’archivage des données de l’entreprise, structurées (provenant de bases de données) ou non (documents, messages, vidéos…) actives ou inactives. Conforme à la norme internationale OAIS (Open Archival Information System) et sécurisée par RSA, InfoArchive supporte des milliards d’enregistrements et est capable de gérer le stockage de façon intelligente, par exemple en orchestrant de façon automatisée la migration des données sur les supports les plus appropriées en matière de coûts et de performance ou en optimisant les données (un gain de 90% est atteignable par simple compression des données ingérées).

Infoarchive2

La plate-forme dispose de fonctions avancées de sécurité et d’authentification et sait notamment assurer le contrôle d’accès des utilisateurs ainsi que la journalisation de leurs activités à des fins de traçabilité. Selon les droits de chacun, la plate-forme est aussi capable de masquer certaines données. Elle peut aussi assurer l’immutabilité des données grâce à ses fonctions WORM. Enfin elle dispose d’outils de recherche évolués qui ne devraient que s’enrichir avec le temps pour fournir à terme des capacités d’analyse Big Data sur les données archivées.

Techniquement, InfoArchive s’appuie sur la base de données XML xDB acquise par EMC avec le rachat en 2007 de X-Hive et a été développé en s’appuyant sur des technologies modernes également utilisées par la solution de PaaS Pivotal comme le framework Spring ou le front end HTML/CSS bootstrap.js. La plate-forme propose une API riche  de type Restful. Autant de choix techniques qui garantissent que la plate-forme dispose de marges d’évolutions importantes et s’intègre bien avec les nouveaux modèles de développement d’applications.

InfoArchive est potentiellement utilisable par tout type d’entreprise et son usage est facturé en fonction du volume de données archivé. Les secteurs visés en priorité sont les secteurs soumis à un cadre réglementaire fort, notamment dans le domaine de la santé (hôpitaux, recherche médicale…), de l’industrie (industrie aéronautique, automobile), de la banque et de la finance, des assurances, mais aussi l’ensemble du secteur public désireux de s’appuyer sur une solution d’archivage à la norme OAIS.

En savoir plus

La fiche PDF de présentation d’InfoArchive