Haut de page>
 

Data Management

 
 
 
 
 
 
 
 
 
 

Storage Virtualization

Les plateformes de virtualisation de stockage permettent de présenter des volumes de stockage de manière unifiée indépendamment du matériel sous-jacent.

Plus clairement, elles offrent la possibilité de construire des clusters de stockage en mode actif/actif entre plusieurs datacenters avec des baies de stockage potentiellement hétérogènes, elles peuvent faciliter un processus de migration entre deux générations ou technologies de stockage différentes, et ce de manière totalement transparente.

Enfin, il s'agit de la seule solution du marché permettant d'offrir un véritable RTO/RPO zéro, même en cas de panne du stockage sur le site primaire. Enfin, certaines solutions de virtualisation de stockage peuvent assumer un certain nombre de fonctions supplémentaires comme la journalisation d'I/O (CDP), les snapshots de volume ou d'applications, ce qui permet d'éliminer ces coûts de licence sur les baies de stockage sous-jacentes.

 

Sync or Async Replication

En matière de réplication, il existe trois mécanismes distincts permettant d'assurer la réplication de données entre deux plateformes de stockage, soit :

  • La réplication synchrone qui a l'avantage de garantir que deux volumes répliqués soient systématiquement identiques. Néanmoins, ce mode de réplication implique que la vitesse du stockage sera dépendante de la latence entre les datacenters et de la performance du système le plus lent., En outre, il ne permet pas de se protéger contre les risques de corruption de données.
  • La réplication asynchrone qui fonctionne sur base d'une planification définie par l'administrateur du stockage. Dans ce cas, la baie de stockage primaire stocke les données modifiées dans un volume temporaire et les réplique à intervalle régulière.
  • La réplication "near synchrone" qui consiste à tenter de répliquer de manière synchrone, sans attendre que les données ne soient écrites sur les disques de la baie du site distant, et à utiliser un tampon en cas d'opérations d'écriture intensives sur le site primaire, avant de revenir rapidement à une situation synchrone entre les deux sites. Ces technologies permettent également de dupliquer l'I/O primaire avec un "splitter driver" intégré dans la baie de stockage afin d'assurer une journalisation des I/O et d'offrir des possibilités de restauration extrèmement granulaires, à la transaction ou à la seconde près, pour restaurer ses données, même en cas de corruption du stockage primaire.

 

Enterprise Backup

Les sauvegardes sont généralement le moyen le plus sûr de restaurer des données critiques ou des systèmes complets. Dans un environnement Entreprise, les solutions utilisées peuvent soit reposer sur du matériel, soit être proposées uniquement sous forme de suite logicielle.

Les principaux critères de choix pour une solution de gestion des sauvegardes concernent la couverture fonctionnelle en termes de systèmes (OS, hyperviseurs, baies de stockage SAN ou NAS, etc.) et d'applications, la facilité d'administration et les options de restauration granulaire.

La majorité des solutions du marché intègrent de la déduplication des données "target", pour limiter l'espace disque consommé par les sauvegardes, d'autres ont la capacité d'effectuer ce travail à la source pour limiter la charge sur l'environnement et réduire la consommation de bande passante pour des environnements distribués.

Les sauvegardes peuvent ensuite être exportées sur bande ou conservées sur disque. L'utilisation de baies de stockage spécialement intégrées aux logiciels de sauvegardes permet notamment permet notamment de mettre en oeuvre des logiques de backup en mode "full synthetic", soit la réalisation d'un seul backup "full", suivi de backups incrémentaux (Incremental forever), avec la possibilité de reconstituer des backups "full" de manière hebdomadaire ou mensuelle directement depuis la baie de disques.

Enfin, certaines de ces solutions ont également la possibilité de piloter les mécanismes de protection propres aux baies de stockage en gérer de manière unifiée toutes les fonctions de protection des données.

Le licensing de ces solutions est soit basé sur une comptabilité des agents (Machines physiques ou virtuelles, applications, etc.), soit des hosts (Ex : Hyperviseurs), soit de la volumétrie source (Front-end TeraByte).

 

Virtualization Backup

Les solutions de sauvegarde dédiées aux environnements virtualisés disposent généralement de fonctions relativement similaires aux solutions entreprise, à la différence près qu'elles se limitent souvent aux environnements virtuels (Support limité des sauvegardes de serveurs physiques ou de plateformes NAS).

Elles proposent malgré tout d'autres avantages comme la possibilité de tester les sauvegardes de manière régulière dans un environnement cloisonné, de répliquer les VMs sur un autre site en plus d'en assurer la sauvegarde localement, et enfin de gérer le redémarrage d'un environnement complet depuis un site de Disaster Recovery (Ex : Ordre de redémarrage, changement de l'adressage IP, etc.).

Comme pour les solutions de virtualisation serveurs, le licensing de ces solutions est par défaut basé sur un nombre de CPU physiques.

 

Backup Repositories

De plus en plus de clients se départissent des bandes comme support de stockage primaire pour leurs sauvegardes. Leurs motivations peuvent être opérationnelles (Tâches manuelles liées à la sortie des bandes) ou techniques (Lenteur de restauration depuis les bandes), c'est la raison pour laquelle le disque est devenu le support privilégié.

Les baies de stockage utilisées pour les données issues des sauvegardes intègrent une logique de déduplication des données en "post-process" afin de ne pas péjorer les performances des tâches de backup, et d'optimiser l'espace de stockage à disposition. Dans la plupart des environnements les taux de réduction avoisinent les 90% étant donné qu'une majorité des données n'est pas modifiée entre deux jobs de backup.

Ces repositories de backup disposent généralement d'intégrations natives avec les principales solutions de sauvegarde ou d'archivage du marché, pour offrir un certain nombre de fonctions avancées comme les logiques de backup en mode "full synthetic", la restauration de VMs directement depuis les disques de la baie.

Pour les systèmes ou applications "legacy" ne supportant que les technologies de bandes, ces baies de stockage peuvent également présenter une partie de leur espace disque en émulant des bandes virtuelles (Options VTL).

La réplication entre deux systèmes se fait également de manière déduplifiée, ce qui permet de ne pas surcharger les liens inter-sites entre deux datacenters.

Enfin, il est possible en option d'ajouter des fonctions de sécurité comme le chiffrement des sauvegardes, la protection de certains volumes en "read-only" (Fonctions WORM), ou la mise en oeuvre de logiques de "multi-tenancy" pour offrir un cloisonnement des données entre différentes entités.

 

Enterprise Archiving

Etant donnée la croissance des données dans la plupart des environnements, il est souvent nécessaire de décharger le stockage de production pour alléger les systèmes concernés, ou réduire le temps alloué aux sauvegardes.

Dans ce contexte, il est nécessaire de mettre en oeuvre des logiques d'archivage des données pour déporter sur d'autres supports de stockage, les données les moins utilisées ou les plus anciennes.
Les stratégies mises en oeuvre concernent généralement les services de messagerie ou de fichiers, mais peuvent également s'appliquer à d'autres systèmes ou applications (Ex : IM).

Ces technologies utilisent généralement temporairement des "stubs", soit des raccourcis permettant d'accéder directement à un mail ou à un fichier, puis utilisent exclusivement des consoles de recherche dédiées pour que les utilisateurs puissent facilement retrouver une donnée archivée.

Dans certains cas, une logique d'archivage légal (e-Discovery) peut être couplée à l'archivage fonctionnel pour permettre à des services internes à une organisation (Ex : Département RH ou légal) d'effectuer des recherches avancées qui auront valeur de preuve, par exemple en cas de litige avec un employé.

 

Content Addressable Storage

Les plateformes CAS ont pour objectif de pouvoir archiver les données les moins accédées pour, à terme, ne plus avoir besoin de les sauvegarder comme des données de production.

Les baies CAS stockent les données d'archivage en mode objet. Plus clairement, elles permettent de stocker des données en y ajoutant des meta-données pour en faciliter la recherche.

 

Software Defined Data Protection

Dans la logique de Software Defined DataCenter, les technologies de réplication de données évoluent également vers une approche 100% logicielle, indépendante du matériel sous-jacents.

La notion de Software Defined Data Protection permet donc de se départir des mécanismes propriétaires de réplication ou de journalisation d'I/O propres aux environnements de stockage, et d'envisager une externalisation de ces données soit entre des datacenters hétérogènes, soit à destination de services Cloud.

 

Big Data

La notion de Big Data correspond au traitement de volumétries de données très importantes, soit des capacités de stockage quasi-infinies, une indexation à la volée des données collectées, et des fonctions de recherche avancées.

Les plateformes en question reposent généralement sur des technologies scale-out NAS, qu'elles soient matérielles ou logicielles, pour mettre en oeuvre un système de fichiers unique reposant sur une architecture matérielle hautement distribuée (Ex : HDFS).