Official Blog
Decodificarea miturilor asociate cu deduplicarea datelor
Synology Team
27 June 2024

Decodificarea miturilor asociate cu deduplicarea datelor

Întrucât companiile creează mai multe date decât oricând, organizațiile trebuie să fie capabile să maximizeze capacitatea de stocare și să stocheze cât mai multe date posibil fără a cheltui prea mult. Aici intervine deduplicarea datelor. Prin utilizarea acestei tehnici, datele redundante sunt depistate și eliminate înainte de a fi salvate. Acest lucru duce la utilizarea unui spațiu de stocare mai mic, permițându-vă să salvați în schimb date noi în locul lor. Acest lucru vă asigură, de asemenea, că puteți efectua în mod eficient copii de rezervă pentru datele dumneavoastră, deoarece nu trebuie să pierdeți timp făcând copii de rezervă pentru copii duble ale acelorași date.

Rețineți că fiecare furnizor poate pretinde că produsul său oferă un anumit raport de deduplicare a datelor. De exemplu, un furnizor ar putea pretinde că poate oferi o rată de deduplicare de 20 de ori mai mare decât alții, depășind concurenții cu peste 200%. Cu toate acestea, multe variabile tind să afecteze rata reală de deduplicare.

Haideți să aflăm ce este deduplicarea datelor și cum să evaluăm rata de deduplicare atunci când selectăm o soluție de backup.

Cum se calculează rata de deduplicare a datelor

Pentru a elimina în mod eficient datele duplicate, dispozitivul dvs. trebuie să fie echipat cu procesoare și tehnologie software care să vă permită să economisiți spațiu de stocare.
Atunci când se utilizează deduplicarea datelor, sistemul identifică blocurile de date înainte de a le stoca. Fiecărui bloc de date i se atribuie un număr unic de identificare, în timp ce pentru blocurile stocate sunt create amprente digitale. Amprentele digitale pentru blocurile stocate sunt apoi comparate cu blocurile de date nou scrise.

În cazul în care este detectat un bloc duplicat, sistemul generează un index care indică locația datelor duplicate. Datele redundante sunt apoi eliminate, astfel încât capacitatea de stocare să poată fi optimizată.

Întrucât riscul atacurilor ransomware crește pe zi ce trece, întreprinderile trebuie să implementeze un plan eficient de backup și recuperare a datelor pentru a-și stoca în siguranță datele, asigurându-se că dispun de o capacitate de stocare suficientă cu ajutorul deduplicării datelor.

Întreprinderile au tendința de a efectua în mod regulat copii de rezervă pentru cantități mari de date, ceea ce ar putea duce la o creștere a costurilor de stocare. Datele noi sau datele modificate reprezintă, de obicei, doar o fracțiune infimă din totalul datelor copiate de rezervă. Acest lucru înseamnă că o mare parte din datele care sunt copiate zilnic conțin de fapt date duplicate sau redundante. Aici intervine deduplicarea datelor.

Pentru a calcula în mod eficient raportul de deduplicare a datelor, utilizatorii trebuie să calculeze procentul de date duplicate care sunt în cele din urmă șterse.

Deoarece fiecare furnizor tinde să calculeze ratele de deduplicare a datelor în mod diferit, explicăm mai jos cele trei etape de calculare a raportului de deduplicare a datelor. Fiecare etapă generează o valoare diferită:

Etapa 1 [set de date originale]: Capacitatea totală a datelor care trebuie să facă obiectul unei copii de rezervă înainte de eliminarea datelor redundante.

Etapa 2 [Transferul datelor după deduplicare]: Cantitatea de date care poate fi transmisă pentru a fi stocată pe un server după deduplicarea datelor.

Etapa 3 [Date stocate efectiv]: Cantitatea de date stocate pe serverul de backup.

Atunci când se măsoară eficiența deduplicării datelor, Synology recomandă să se analizeze Etapa 2 [Transferul de date după deduplicare]. Dacă vă uitați la valoarea generată în timpul Etapei 1 [Setul de date original], aceasta poate fi înșelătoare, deoarece conține atât datele “vechi”, cât și cele “noi”, care sunt apoi împărțite la cantitatea totală de date care este reținută. Unii furnizori pot umfla în mod artificial acest număr, inducând utilizatorii în eroare cu privire la etapa pe care o folosește de fapt furnizorul pentru a măsura eficiența deduplicării datelor.

După cum se arată mai jos, există două rezultate diferite după calcularea cifrelor. Există o discrepanță mare între cele două, ceea ce ar putea duce la confuzie, deoarece întreprinderile ar putea înțelege greșit efectele deduplicării datelor.

Atunci când am analizat modul în care produsele concurenților noștri realizează deduplicarea datelor, am descoperit cele trei etape enumerate mai sus. Împărțiți setul de date original înainte de deduplicare cu cantitatea de spațiu de stocare ocupat la destinație pentru o rată de reducere a datelor de 95%.

Cu toate acestea, întreprinderile ar trebui să se concentreze asupra dimensiunii datelor transmise, care ar trebui împărțită cu cantitatea de spațiu de stocare ocupat la destinația de stocare. Atunci când se utilizează această formulă pentru a calcula rata de deduplicare a datelor, reducerea medie a datelor va fi de aproximativ 40~66%.

De exemplu, Taiwan Shiseido a reușit să crească capacitatea de stocare cu 52%, folosind tehnicile de deduplicare a datelor incluse în soluțiile de backup de la Synology. În comparație cu alți furnizori de soluții de backup, Synology oferă soluții la un preț redus, permițând companiilor să economisească din costurile de stocare și să își maximizeze capacitatea de stocare, astfel încât să poată proteja cât mai multe date.

Maximizați capacitatea de stocare și reduceți costurile cu deduplicarea datelor

Ținând cont de problemele întreprinderilor, Synology a implementat tehnologia de deduplicare a datelor, astfel încât companiile să poată acum să își reducă la minimum costurile de stocare, maximizând în același timp capacitatea de stocare.

Companiile au tendința de a face în permanență copii de siguranță ale datelor în timp ce stochează datele pe dispozitivul de stocare. Acest lucru înseamnă că, dacă datele duplicate nu sunt eliminate înainte ca datele să fie scrise, acest lucru va crea un spațiu de stocare temporar pe dispozitivul de backup.

Acesta este motivul pentru care Synology a implementat deduplicarea inline atunci când efectuează copii de rezervă. Înainte ca orice date să fie scrise, sistemul va compara simultan conținutul datelor și va efectua ștergeri, reducând capacitatea de stocare necesară pentru a stoca datele.

În același timp, Synology a implementat și tehnologia de deduplicare globală la nivel de bloc, ca modalitate de a elimina copiile duplicate între mai multe surse de backup. Acest lucru are rolul de a se asigura că nu rămân date redundante între mai multe sarcini de backup în cadrul unui singur dosar. Acest lucru ajută companiile să economisească spațiu de stocare fără a afecta performanța de backup.

Întrucât datele sunt o mină de aur, companiile trebuie să facă tot ce le stă în putință pentru a-și stoca datele în siguranță. Acest lucru înseamnă că acestea trebuie să planifice din timp, pe măsură ce evoluează și să selecteze o soluție de backup care să răspundă nevoilor de scalabilitate și de extindere și care să includă tehnologii de reducere a stocării, cum ar fi deduplicarea datelor, pentru a reduce costul total de proprietate (TCO).

Faceți clic aici pentru a afla mai multe informații.