décembre 2022
L M M J V S D
 1234
567891011
12131415161718
19202122232425
262728293031  
  • Retour sur les Rendez-Vous Nuclear Valley 6ème édition vendredi 9 décembre 2022
    Les 28, 29 et 30 novembre 2022 s’est déroulé la 6ème édition des Rendez-Vous Nuclear Valley, événement incontournable du Pôle qui regroupe les acteurs du nucléaire. Comme chaque année, l’ensemble des participants ont eu l’opportunité d’échanger avec les grands donneurs d’ordre de la filière via des rendez-vous b to b en visio mais aussi en […]
    Marie BARRE
  • Lensa AI : cette IA enflamme Instagram, mais cache un côté sombre vendredi 9 décembre 2022
    L’application Lensa AI connait un succès fou depuis plusieurs jours. Sa nouvelle fonctionnalité « Magic Avatars » permet de créer … Cet article Lensa AI : cette IA enflamme Instagram, mais cache un côté sombre a été publié sur LeBigData.fr.  […]Tout lire → Lensa AI : cette IA enflamme Instagram, mais cache un côté sombre
    Bastien L
  • Sortie du dernier rapport des salaires et des compétences dans l’IT. vendredi 9 décembre 2022
    Publié par le groupe Skillsoft Global Knowledge depuis 17 ans maintenant. Au fil des ans, il est devenu une ressource … Cet article Sortie du dernier rapport des salaires et des compétences dans l’IT. a été publié sur LeBigData.fr.  […]Tout lire → Sortie du dernier rapport des salaires et des compétences dans l’IT.
    Ouissal
  • Clôture de la 30e édition de Bulles en fureur vendredi 9 décembre 2022
    Le 8 décembre 2022, à l'occasion de la 30e édition de Bulles en fureur, les jeunes pris en charge par la protection judiciaire de la jeunesse ont vu leur bande dessinée favorite se faire récompenser par le prix littéraire André-Georges Hamon. Outil d'i... […]
  • Goncourt des détenus : silence, on délibère ! mercredi 7 décembre 2022
    Porté par le Centre national du livre (CNL) et la direction de l'administration pénitentiaire, le premier prix Goncourt des détenus sera décerné le 15 décembre 2022. Depuis le 21 novembre, les détenus des centres pénitentiaires participants délibèrent ... […]

Déduplication de données : définition et utilité

La déduplication de données est une technique de compression de données qui implique la suppression des données redondantes dans un système. Elle s’utilise pour sauvegarder des données et pour transmettre des données sur un réseau.

Quelle est son utilité ?

Elle permet de stocker un modèle unique de données dans une base de données ou dans un système d’information plus vaste. La déduplication de données examine puis compare les données entrantes avec les données déjà stockées. Si des données sont déjà présentes, les algorithmes de déduplication suppriment les nouvelles données et les remplacent par un pointeur.

Par exemple, lorsqu’on procède à la sauvegarde d’un ancien fichier, le fichier précédent et les modifications s’ajoutent au segment de données total. Cependant, en l’absence de différence, on crée tout simplement un pointeur tout en ignorant le nouveau fichier.

La déduplication de données est une technologie qu’utilisent les fournisseurs de solutions de stockage. Le but étant de mieux exploiter l’espace de stockage. Ces fonctionnalités se regroupent généralement dans une catégorie plus large, appelée réduction de données. Tous ces systèmes ont un même objectif : améliorer l’efficacité de stockage. Si elles utilisent les techniques de déduplication appropriées, les entreprises peuvent stocker davantage de données que le suggère leur capacité de stockage globale.

Exemple de cas d’une déduplication de données

Les entreprises exécutent souvent un environnement de bureau virtuel, où des centaines de postes de travail identiques sont stockés sur un serveur. Elles exploitent des centaines de fichiers provenant de Windows 8, Office 2013 et d’autres outils dont les utilisateurs peuvent avoir ponctuellement besoin.

Si l’on considère que les images de chaque poste de travail consomment 25 Go d’espace disque, cela représenterait 5 To de capacité pour 200 postes. Avec la déduplication, il est possible de ne stocker qu’une seule copie de ces machines virtuelles. À chaque fois que le système découvre une donnée qui est stockée quelque part dans l’environnement de stockage, il enregistre un petit pointeur à la place de la copie de données, libérant ainsi des blocs qui seraient autrement occupés.

Déduplication matérielle ou logicielle

Les déduplications fonctionnelles réduisent la charge de traitement associée aux produits logiciels. Ces systèmes peuvent aussi ajouter des matériels de protection des données, comme des instruments de sauvegarde, des VTL (Virtual Tape Libraries) ou des serveurs de stockage en réseau.

Bien que la déduplication logicielle puisse éliminer efficacement les redondances à la source, les méthodes matérielles se focalisent sur la réduction des données lors du stockage. Par conséquent, si la déduplication matérielle ne permet pas d’économiser de la bande passante, elle compense ce problème en offrant des vitesses de compression plus élevées.

La déduplication matérielle des données offre des performances élevées, une évolutivité et un déploiement relativement sans interruption. Elle s’adapte particulièrement bien aux déploiements des grandes entreprises, plutôt que par des PME ou des bureaux distants.

Cet article Déduplication de données : définition et utilité a été publié sur LeBigData.fr.

Approfondir le Big Data ...

Commentaires clos pour le moment