août 2022
L M M J V S D
1234567
891011121314
15161718192021
22232425262728
293031  
  • Brave vs DuckDuckGo : ces navigateurs web protègent vos données, mais quel est le meilleur ? mardi 9 août 2022
    Brave et DuckDuckGo sont deux navigateurs web et moteurs de recherche dédiés à la confidentialité et à la protection de … Cet article Brave vs DuckDuckGo : ces navigateurs web protègent vos données, mais quel est le meilleur ? a été publié sur LeBigData.fr.  […]Tout lire → Brave vs DuckDuckGo : ces navigateurs web protègent […]
    Bastien L
  • BlenderBot 3 : Meta libère son IA sur le web pour qu’elle discute avec vous mardi 9 août 2022
    Afin d’entraîner son nouveau chatbot, Meta veut laisser le grand public discuter librement avec l’IA. N’importe qui peut converser avec … Cet article BlenderBot 3 : Meta libère son IA sur le web pour qu’elle discute avec vous a été publié sur LeBigData.fr.  […]Tout lire → BlenderBot 3 : Meta libère son IA sur le […]
    Bastien L
  • Crypto : les américains inflexibles sur la cybersécurité et le blanchiment d’argent mardi 9 août 2022
    Les régulateurs financiers américains rappellent qu’aucune entreprise, y compris les plateformes cryptos, ne peuvent passer outre les réglementations relatives à … Cet article Crypto : les américains inflexibles sur la cybersécurité et le blanchiment d’argent a été publié sur LeBigData.fr.  […]Tout lire → Crypto : les américains inflexibles sur la cybersécurité et le blanchiment d’argent
    Elina S.
  • Affaire Recco : « La malédiction du berceau de la tortue » mercredi 3 août 2022
    À la fin des années 1920, dans un petit village de Corse-du-Sud, à Propiano, les Recco, une famille catholique de pécheurs de 11 enfants, est frappée par « la malédiction du berceau de la tortue ». L'un des enfants de la famille, Joseph-Thomas Recco di... […]
  • Consultation sur l’avant-projet de réforme du droit des contrats jeudi 28 juillet 2022
    La direction des affaires civiles et du sceau lance une consultation publique sur l'avant-projet de réforme du droit des contrats spéciauxLe droit commun des contrats a été modernisé en profondeur par l’ordonnance du 10 février 2016 portant réfor... […]

Déduplication de données : définition et utilité

La déduplication de données est une technique de compression de données qui implique la suppression des données redondantes dans un système. Elle s’utilise pour sauvegarder des données et pour transmettre des données sur un réseau.

Quelle est son utilité ?

Elle permet de stocker un modèle unique de données dans une base de données ou dans un système d’information plus vaste. La déduplication de données examine puis compare les données entrantes avec les données déjà stockées. Si des données sont déjà présentes, les algorithmes de déduplication suppriment les nouvelles données et les remplacent par un pointeur.

Par exemple, lorsqu’on procède à la sauvegarde d’un ancien fichier, le fichier précédent et les modifications s’ajoutent au segment de données total. Cependant, en l’absence de différence, on crée tout simplement un pointeur tout en ignorant le nouveau fichier.

La déduplication de données est une technologie qu’utilisent les fournisseurs de solutions de stockage. Le but étant de mieux exploiter l’espace de stockage. Ces fonctionnalités se regroupent généralement dans une catégorie plus large, appelée réduction de données. Tous ces systèmes ont un même objectif : améliorer l’efficacité de stockage. Si elles utilisent les techniques de déduplication appropriées, les entreprises peuvent stocker davantage de données que le suggère leur capacité de stockage globale.

Exemple de cas d’une déduplication de données

Les entreprises exécutent souvent un environnement de bureau virtuel, où des centaines de postes de travail identiques sont stockés sur un serveur. Elles exploitent des centaines de fichiers provenant de Windows 8, Office 2013 et d’autres outils dont les utilisateurs peuvent avoir ponctuellement besoin.

Si l’on considère que les images de chaque poste de travail consomment 25 Go d’espace disque, cela représenterait 5 To de capacité pour 200 postes. Avec la déduplication, il est possible de ne stocker qu’une seule copie de ces machines virtuelles. À chaque fois que le système découvre une donnée qui est stockée quelque part dans l’environnement de stockage, il enregistre un petit pointeur à la place de la copie de données, libérant ainsi des blocs qui seraient autrement occupés.

Déduplication matérielle ou logicielle

Les déduplications fonctionnelles réduisent la charge de traitement associée aux produits logiciels. Ces systèmes peuvent aussi ajouter des matériels de protection des données, comme des instruments de sauvegarde, des VTL (Virtual Tape Libraries) ou des serveurs de stockage en réseau.

Bien que la déduplication logicielle puisse éliminer efficacement les redondances à la source, les méthodes matérielles se focalisent sur la réduction des données lors du stockage. Par conséquent, si la déduplication matérielle ne permet pas d’économiser de la bande passante, elle compense ce problème en offrant des vitesses de compression plus élevées.

La déduplication matérielle des données offre des performances élevées, une évolutivité et un déploiement relativement sans interruption. Elle s’adapte particulièrement bien aux déploiements des grandes entreprises, plutôt que par des PME ou des bureaux distants.

Cet article Déduplication de données : définition et utilité a été publié sur LeBigData.fr.


Lire cette source depuis LeBigData.fr

Commentaires clos pour le moment