| |
| |
|
| |
Vous voulez recevoir le livre dès que possible ? Appelez
Quantum au +33 1 41 43 49 00 pour savoir comment la déduplication
des données peut vous aider à améliorer vos opérations
de sauvegarde.
10 questions fréquentes à propos
de la déduplication des données.
1. Que signifie réellement le terme "déduplication
des données"?
Il n’y a pas réellement de définition standard
pour le moment, mais nous nous en rapprochons. Tout le monde est d’accord
sur le fait qu’il s’agit d’un système ayant
pour but d’éliminer le besoin de stocker des données
redondantes, et que la plupart des gens le limitent à un système
qui déduplique des données au niveau du bloc, et non du
fichier. C’est une caractéristique importante. Imaginez
que vous disposez de 20 copies d’une présentation. Ces copies
ont différents titres de page. Au regard d’un système
de réduction qui travaille au niveau du fichier, on voit 20 fichiers
complètement différents. Une approche au niveau du bloc
permet en revanche d’identifier et de ne stocker que les éléments
différents.
La déduplication des données la plus puissante utilise
ainsi une approche au niveau bloc variable. Les offres qui utilisent
cette approche observent la séquence de données, la segmente
en blocs variables, et quand elles détectent des blocs identiques
ne stockent qu'un pointeur vers l'original au lieu de stocker le bloc à nouveau.
Comme le pointeur prend moins d'espace que le bloc, vous gagnez en capacité.
En sauvegarde, les mêmes blocs réapparaissent de façon
redondante, les utilisateurs peuvent typiquement stocker 10 à 50
fois plus de données que sur un disque conventionnel grâce à la
déduplication.
2. Comment la déduplication peut-elle s'appliquer à la
réplication ?
La réplication est le processus qui consiste à envoyer
des données dupliquées d'une source à une cible.
Si vous répliquez toutes les données sauvegardées,
vous avez besoin d'un réseau très performant. Mais avec
la déduplication, le système source, celui qui envoie les
données, recherche les blocs dédupliqués dans le
flux à répliquer. Si un bloc a déjà été transmis
au système de cible, cela signifie qu'il n'a plus besoin d'être
transmis à nouveau, un pointeur est tout simplement envoyé.
Le pointeur étant beaucoup plus petit que le bloc, beaucoup moins
de bande passante est requise pour la réplication.
3. Quelles sont les applications opérées par la
déduplication? En existe-t-il certaines qui ne fonctionnent pas
?
Quand elle est utilisée pour la sauvegarde, elle supporte toutes
les applications (email, base de données, impressions et fichiers
d'application etc…) et supporte tous les logiciels de sauvegarde
référencés. La déduplication peut repérer
les blocs redondants durant le processus de sauvegarde. Certains types
de fichiers, multimédia par exemple, ne voient pas de bénéfice
la première fois qu'ils utilisent la déduplication car
les applications qui écrivent les fichiers éliminent déjà la
redondance. Mais si ces fichiers sont sauvegardés plusieurs fois
ou après de minces modifications, la déduplication comporte
de puissants avantages en termes de capacité.
4. Est-il possible de prévoir les bénéfices
de la déduplication sur mes données ?
Il y a quatre variables principales. Le taux de changement des données
(combien de nouveaux blocs sont introduits ), la qualité de la
compression de celles-ci, la méthodologie de sauvegarde (totale
ou incrémentale par exemple) et les outils mis en place pour conserver
les données. Certains fournisseurs, dont Quantum, ont des outils
de calcul pour permettre d'évaluer votre niveau de réduction
des données.
5. Quel est le réel avantage procuré par l'utilisation
de la déduplication ?
Il y en a deux principaux : 1) La technologie de déduplication
permet de sauvegarder plus de données sur disque que sur un système
de sauvegarde conventionnel, ce qui signifie que vous pouvez restaurer
ces mêmes données plus rapidement. 2) Elle facilite l’utilisation
du WAN traditionnel pour la réplication, la protection et le plan
de reprise d’activité, ce qui permet de réduire la
manipulation des bandes.
6. Qu'est-ce que la déduplication des données à blocs
variables ? Comment obtenir des blocs variables et quels en sont les
avantages ?
Si vous divisez un flux de données en segments de taille fixe, à chaque
changement tous les blocs en aval subiraient également des modifications.
Avec un système de blocs de taille variable, certains segments
peuvent être réduits ou allongés, sans pour autant
affecter les blocs en aval. Cela augmente par conséquent la capacité du
système à trouver des segments de données dupliquées,
générant un gain financier et d'espace significatif.
7. Diviser les données en blocs, est-ce sécurisé ?
Comment les restaure-t-on ?
La technologie d'utilisation des pointeurs permettant de référencer
une séquence de segments de données a été standardisée
dans l'industrie depuis des décennies, vous l'utilisez tous les
jours et elle est fiable. Chaque fois que vous sauvegardez un large fichier,
il est stocké en blocs sur différents secteurs de disque
dans un ordre dicté par l'espace disponible. Lorsque vous "lisez" un
fichier, vous lisez les pointeurs vers différents secteurs, dans
le bon ordre. La déduplication se base sur une technologie quasi-similaire.
Et les fournisseurs de déduplication fournissent un panel de tests
pour assurer que le système est robuste et les données
toujours disponibles.
8. Où se situe la déduplication des données
dans le processus de sauvegarde ?
Deux choix sont proposés. Vous pouvez envoyer toutes vos
données sauvegardées vers une cible de sauvegarde et appliquer
la déduplication sur cette cible ou dédupliquer sur le
système hôte pendant la sauvegarde. Les deux approches sont
possibles et ont chacune leurs avantages. Si vous dédupliquez
sur l'hôte durant la sauvegarde, vous envoyez moins de données
sur votre réseau mais vous devez gérer le logiciel sur
tous les systèmes hôtes, la sauvegarde ralentit car la déduplication
consomme des ressources, et elle peut ralentir d'autres applications
en cours sur le serveur. Si vous dédupliquez sur la cible de sauvegarde,
vous envoyez plus de données sur le réseau, mais vous pouvez
utiliser tout logiciel de sauvegarde. Vous devez seulement gérer
une seule cible, et la performance est généralement plus élevée
car la solution est dédiée à la déduplication.
9. Peut-on utiliser la déduplication avec des bandes ?
Oui et non. La déduplication des données requiert un accès
aléatoire aux blocs de données pour la lecture et l'écriture
des données. Elle doit donc être mise en place sur un système
de disques. Mais la bande peut être facilement écrite à partir
d'un stock de données dédupliquées et en fait c'est
la norme. La plupart des clients utilisant la déduplication conservent
quelques semaines ou mois de sauvegarde sur disque, et utilisent ensuite
la bande pour le stockage long terme. Lorsque vous créez une bande
pour une donnée dédupliquée, celle-ci sera reconstruite,
afin qu'elle puisse être lue directement sur un lecteur de bande.
Elle n'aura donc pas à être d'abord réécrite
sur un système disque.
10. Combien coûtent réellement les solutions de
déduplication ?
Il y a beaucoup de variantes, mais il y a en revanche un point de départ.
Supposons un avantage moyen de la déduplication de l'ordre de
20 : 1, un ratio fréquent dans l'industrie. Nous avons vu la liste
des prix dans la gamme de $1/GB. Par conséquent, un système
qui pourrait retenir 20TO de sauvegarde de données aurait une
liste des prix aux alentours de $20 000, ce qui représente beaucoup
moins que si vous protégiez les mêmes données utilisant
un disque conventionnel. À noter : les options sont susceptibles
d'augmenter le prix et les remises accordées par les revendeurs
peuvent le réduire.
|
|
 |
|