Inscrivez-vous ici pour recevoir une copie GRATUITE de « Data De-duplication for Dummies », le livre exclusif de Quantum. Parcourez la liste pour trouver les réponses aux 10 questions les plus fréquentes sur la déduplication des données.

Prénom:
Nom de famille:
Fonction:
Société:
Adresse:
Adresse 2:
Ville:
Pays:
Téléphone:
E-mail:
Quelle quantité de données avez-vous besoin de sauvegarder ?
Quand avez-vous l'intention d'ajouter ou de remplacer une solution de stockage ?
Tenez-moi au courant des produits, infos et événements Quantum par e-mail :  
Consulter la politique de confidentialité de Quantum
Oui  Non

Vous voulez recevoir le livre dès que possible ? Appelez Quantum au +33 1 41 43 49 00 pour savoir comment la déduplication des données peut vous aider à améliorer vos opérations de sauvegarde.

10 questions fréquentes à propos de la déduplication des données.

1. Que signifie réellement le terme "déduplication des données"?
Il n’y a pas réellement de définition standard pour le moment, mais nous nous en rapprochons. Tout le monde est d’accord sur le fait qu’il s’agit d’un système ayant pour but d’éliminer le besoin de stocker des données redondantes, et que la plupart des gens le limitent à un système qui déduplique des données au niveau du bloc, et non du fichier. C’est une caractéristique importante. Imaginez que vous disposez de 20 copies d’une présentation. Ces copies ont différents titres de page. Au regard d’un système de réduction qui travaille au niveau du fichier, on voit 20 fichiers complètement différents. Une approche au niveau du bloc permet en revanche d’identifier et de ne stocker que les éléments différents.

La déduplication des données la plus puissante utilise ainsi une approche au niveau bloc variable. Les offres qui utilisent cette approche observent la séquence de données, la segmente en blocs variables, et quand elles détectent des blocs identiques ne stockent qu'un pointeur vers l'original au lieu de stocker le bloc à nouveau. Comme le pointeur prend moins d'espace que le bloc, vous gagnez en capacité. En sauvegarde, les mêmes blocs réapparaissent de façon redondante, les utilisateurs peuvent typiquement stocker 10 à 50 fois plus de données que sur un disque conventionnel grâce à la déduplication.

2. Comment la déduplication peut-elle s'appliquer à la réplication ?
La réplication est le processus qui consiste à envoyer des données dupliquées d'une source à une cible. Si vous répliquez toutes les données sauvegardées, vous avez besoin d'un réseau très performant. Mais avec la déduplication, le système source, celui qui envoie les données, recherche les blocs dédupliqués dans le flux à répliquer. Si un bloc a déjà été transmis au système de cible, cela signifie qu'il n'a plus besoin d'être transmis à nouveau, un pointeur est tout simplement envoyé. Le pointeur étant beaucoup plus petit que le bloc, beaucoup moins de bande passante est requise pour la réplication.

3. Quelles sont les applications opérées par la déduplication? En existe-t-il certaines qui ne fonctionnent pas ?
Quand elle est utilisée pour la sauvegarde, elle supporte toutes les applications (email, base de données, impressions et fichiers d'application etc…) et supporte tous les logiciels de sauvegarde référencés. La déduplication peut repérer les blocs redondants durant le processus de sauvegarde. Certains types de fichiers, multimédia par exemple, ne voient pas de bénéfice la première fois qu'ils utilisent la déduplication car les applications qui écrivent les fichiers éliminent déjà la redondance. Mais si ces fichiers sont sauvegardés plusieurs fois ou après de minces modifications, la déduplication comporte de puissants avantages en termes de capacité.

4. Est-il possible de prévoir les bénéfices de la déduplication sur mes données ?
Il y a quatre variables principales. Le taux de changement des données (combien de nouveaux blocs sont introduits ), la qualité de la compression de celles-ci, la méthodologie de sauvegarde (totale ou incrémentale par exemple) et les outils mis en place pour conserver les données. Certains fournisseurs, dont Quantum, ont des outils de calcul pour permettre d'évaluer votre niveau de réduction des données.

5. Quel est le réel avantage procuré par l'utilisation de la déduplication ?
Il y en a deux principaux : 1) La technologie de déduplication permet de sauvegarder plus de données sur disque que sur un système de sauvegarde conventionnel, ce qui signifie que vous pouvez restaurer ces mêmes données plus rapidement. 2) Elle facilite l’utilisation du WAN traditionnel pour la réplication, la protection et le plan de reprise d’activité, ce qui permet de réduire la manipulation des bandes.

6. Qu'est-ce que la déduplication des données à blocs variables ? Comment obtenir des blocs variables et quels en sont les avantages ?
Si vous divisez un flux de données en segments de taille fixe, à chaque changement tous les blocs en aval subiraient également des modifications. Avec un système de blocs de taille variable, certains segments peuvent être réduits ou allongés, sans pour autant affecter les blocs en aval. Cela augmente par conséquent la capacité du système à trouver des segments de données dupliquées, générant un gain financier et d'espace significatif.

7. Diviser les données en blocs, est-ce sécurisé ? Comment les restaure-t-on ?
La technologie d'utilisation des pointeurs permettant de référencer une séquence de segments de données a été standardisée dans l'industrie depuis des décennies, vous l'utilisez tous les jours et elle est fiable. Chaque fois que vous sauvegardez un large fichier, il est stocké en blocs sur différents secteurs de disque dans un ordre dicté par l'espace disponible. Lorsque vous "lisez" un fichier, vous lisez les pointeurs vers différents secteurs, dans le bon ordre. La déduplication se base sur une technologie quasi-similaire. Et les fournisseurs de déduplication fournissent un panel de tests pour assurer que le système est robuste et les données toujours disponibles.

8. Où se situe la déduplication des données dans le processus de sauvegarde ?
Deux choix sont proposés. Vous pouvez envoyer toutes vos données sauvegardées vers une cible de sauvegarde et appliquer la déduplication sur cette cible ou dédupliquer sur le système hôte pendant la sauvegarde. Les deux approches sont possibles et ont chacune leurs avantages. Si vous dédupliquez sur l'hôte durant la sauvegarde, vous envoyez moins de données sur votre réseau mais vous devez gérer le logiciel sur tous les systèmes hôtes, la sauvegarde ralentit car la déduplication consomme des ressources, et elle peut ralentir d'autres applications en cours sur le serveur. Si vous dédupliquez sur la cible de sauvegarde, vous envoyez plus de données sur le réseau, mais vous pouvez utiliser tout logiciel de sauvegarde. Vous devez seulement gérer une seule cible, et la performance est généralement plus élevée car la solution est dédiée à la déduplication.

9. Peut-on utiliser la déduplication avec des bandes ?
Oui et non. La déduplication des données requiert un accès aléatoire aux blocs de données pour la lecture et l'écriture des données. Elle doit donc être mise en place sur un système de disques. Mais la bande peut être facilement écrite à partir d'un stock de données dédupliquées et en fait c'est la norme. La plupart des clients utilisant la déduplication conservent quelques semaines ou mois de sauvegarde sur disque, et utilisent ensuite la bande pour le stockage long terme. Lorsque vous créez une bande pour une donnée dédupliquée, celle-ci sera reconstruite, afin qu'elle puisse être lue directement sur un lecteur de bande. Elle n'aura donc pas à être d'abord réécrite sur un système disque.

10. Combien coûtent réellement les solutions de déduplication ?
Il y a beaucoup de variantes, mais il y a en revanche un point de départ. Supposons un avantage moyen de la déduplication de l'ordre de 20 : 1, un ratio fréquent dans l'industrie. Nous avons vu la liste des prix dans la gamme de $1/GB. Par conséquent, un système qui pourrait retenir 20TO de sauvegarde de données aurait une liste des prix aux alentours de $20 000, ce qui représente beaucoup moins que si vous protégiez les mêmes données utilisant un disque conventionnel. À noter : les options sont susceptibles d'augmenter le prix et les remises accordées par les revendeurs peuvent le réduire.

 
Backup. Recovery. Archive. It's What Do.   www.quantum.com
 
 

Quantum Corporation, 141 Innovation Dr, Irvine, CA 92617

Quantum respects your privacy. View Quantum's Privacy Policy