|
Déduplication : une solution provisoire ou l’avenir du stockage ? Par Frédéric Bouzy, Directeur Europe du Sud d’Iron Mountain Digital
Mardi 26 Août 2008
L'explosion des volumes de données générées et stockées par les entreprises est devenue un enjeu crucial pour les entreprises. Pour répondre à ce défi stratégique, les entreprises tendent à privilégier la déduplication. Le marché de cette technologie est estimé à 1 milliard de dollars d'ici 2009 par le cabinet d'étude 451 Group. Les acteurs du stockage et les constructeurs ont parfaitement senti l'air du temps, et multiplié les annonces touchant à cette technologie. Cette évolution est elle un phénomène provisoire, ou traduit-elle un véritable mouvement de fond pour le secteur du stockage ? Après avoir été une source de préoccupation pour les seules équipes informatiques, la problématique du volume croissant des données commence à toucher les entreprises dans leur ensemble. Celles-ci sont obligées d'imposer des restrictions sur les boîtes de messagerie et les supports de stockage local en raison du volume des données produites par les utilisateurs sur le réseau. Le problème peut sembler difficile à résoudre, pourtant une clé de la réduction des volumes de données réside dans l'examen de la quantité d'informations qui sont tout simplement dupliquées par des utilisateurs multiples. Les systèmes d'exploitation et applications standard s'accompagnent de milliers de fichiers similaires sur une multitude d'ordinateurs. Si l'on y ajoute les pièces jointes identiques stockées dans les boîtes de réception des différents destinataires, il est facile d'imaginer combien de documents en double viennent accroître les besoins d'une entreprise en matière de stockage. Par conséquent, si les entreprises ne souhaitent pas courir le risque de subir une déferlante de données, il leur faut soit réduire les volumes de données stockées, soit les rendre plus faciles à gérer. Si les acteurs du marché ont été prompts à s'attaquer à ce point critique, il n'est pas évident que les technologies proposées aient la capacité de faire face à de nouvelles évolutions telles que l'augmentation de taille des fichiers, les formats multimédias et les données distribuées. A moins d'évaluer la situation dès à présent, les entreprises risquent de se retrouver avec une solution provisoire qui pourrait rapidement les ramener à la case départ. Déduplication : l'invention la plus géniale depuis le pain en tranches ? La déduplication s'est rapidement hissée en tête des méthodes informatiques pouvant contribuer à réduire les coûts en espace de stockage et en énergie grâce à l'optimisation de la quantité d'informations à sauvegarder. Elle permet également de répondre à des problématiques telles que la continuité de l'activité, la recherche de documents électroniques (e-discovery) et les obligations de conformité. Les technologies de déduplication peuvent revêtir une multitude de formes, mais il existe plusieurs méthodologies fondamentales : - L'élimination des fichiers identiques (doublons) sur le réseau ;
- Les sauvegardes incrémentielles (consistant à ne sauvegarder que les différences entre les fichiers du jour et ceux de la veille) ;
- La compression des fichiers (permettant de réduire encore le volume des données stockées).
Ces techniques se révèlent d'une grande efficacité pour éviter la sauvegarde de nombreuses données superflues. Elles peuvent également s'appliquer entre des centres de données distribués, de sorte qu'une seule version centralisée d'un document est sauvegardée, au lieu de plusieurs versions sur différents équipements. Or, la déduplication ne traite en fait que les signes précurseurs de l'avalanche de données et ne sera pas en mesure de suivre le rythme de croissance de la taille moyenne des fichiers avec la multiplication de la vidéo et du multimédia. Une compression est déjà appliquée à l'intérieur de ces formats de fichiers, ce qui induit un taux de réduction au stade de la transmission. Dans les faits, l'état du stockage pourrait plutôt empirer que s'améliorer. Réduction des données : la déduplication de nouvelle génération La réduction des données fait franchir un nouveau pas à la déduplication, en remplaçant une approche réactive par une approche proactive de la gestion des données. Cette technique automatise les déplacements et suppressions de données sur le poste de travail, réduisant le volume physique d'informations en circulation à travers l'entreprise. Il s'agit de « marquer » les fichiers qui ne sont plus jugés nécessaires, suivant des règles prédéfinies par un administrateur ou un responsable informatique. Ces fichiers peuvent ensuite être extraits de leur emplacement actuel, puis archivés ou bien détruits de manière sécurisée. La réduction des données devrait avoir pour effet de limiter les besoins d'apprendre aux utilisateurs à gérer efficacement le stockage de leurs propres données. Cette opération étant confiée à un système automatisé à base de règles, les utilisateurs n'ont plus à se soucier du lieu et du moment de la sauvegarde de leurs informations. Toutefois, il sera toujours utile, pour favoriser le succès de la stratégie à long terme de l'entreprise en matière de stockage, de s'assurer que les utilisateurs comprennent pourquoi des règles de réduction des données ont été mises en place et comment ils peuvent contribuer à éliminer tout obstacle au processus de sauvegarde. Des pratiques courantes, telles que l'emploi de la messagerie comme système de stockage secondaire pour les documents volumineux (présentations PowerPoint, par exemple) ne seront pas abandonnées du jour au lendemain, c'est pourquoi les responsables informatiques doivent encourager les utilisateurs à faire preuve de rigueur dans leurs habitudes individuelles de stockage. Une constante demeure dans le stockage : le volume de données que nous produisons journellement ne cessera de croître. Les responsables informatiques qui ne pratiquent pas la politique de l'autruche sont sur la bonne voie. Des règles de réduction des données doivent être élaborées et mises en œuvre dès à présent afin que les utilisateurs ne soient pas débordés par une vague de données.
Les derniers articles mis en ligne
|
le 08/01/2009 à 13:02