În timp, datele de pe hard disk pot deveni corupte. Motivul ar putea fi defecțiunile intervenite la nivelul hardware-ului, de exemplu. Aceste daune (sau, de asemenea, coruperea datelor) fac ca unitățile de stocare să funcționeze în mod anormal fără vreun avertisment. Următoarele două imagini ilustrează această problemă. Imaginea din stânga reprezintă fișierul original, iar imaginea din dreapta reprezintă fișierul cu eroarea de biți și corupere. Chiar și câteva erori de biți pot provoca datelor daune grave, iar curățarea datelor este o metodă de a preveni acest lucru.
Data scrubbing – definiție
Termenul “data scrubbing” înseamnă curățarea datelor. Această tehnologie constă în verificarea în mod regulat, în fundal, a datelor stocate pentru detectarea eventualelor deteriorări și corectarea lor automată pentru a preveni coruperea datelor. În comparație cu hard disk-urile externe simple, sistemele NAS precum Synology oferă două mecanisme de curățare a datelor: RAID data scrubbing și Btrfs data scrubbing.
Două mecanisme de data scrubbing
-
RAID data scrubbing
Pentru a explica mai departe RAID data scrubbing, este necesar să știți ce este RAID. RAID înseamnă “Redundant Array of Independent Disks”. Pentru a prezenta în mod simplificat, este vorba despre combinarea mai multor hard disk-uri independente într-o rețea de hard disk-uri. Printre altele, se poate obține redundanța datelor și creșterea eficienței stocării. Aceasta înseamnă că, dacă un hard disk se defectează, datele sunt încă disponibile în sistemul RAID. Trebuie luată în considerare diferența dintre RAID și backup. În timp ce o copie de rezervă oferă, printre altele, protecție împotriva ștergerii sau editării neintenționate a datelor, un sistem RAID poate doar ajuta la depășirea unor problemele apărute pe unul (sau mai multe) hard disk-uri. Există mai multe tipuri de RAID, fiecare cu un accent diferit pe reziliență și viteză. Curățarea datelor în RAID este utilizată cu RAID 5, RAID 6 și RAID F1, de exemplu, deoarece aceste tipuri RAID folosesc paritatea pentru redundanță.
Data scrubbing pentru RAID 5
Mecanismul de bază al RAID 5 se bazează pe cel puțin trei discuri. RAID 5 folosește pentru scriere striping de paritate a blocurilor de date. După cum se exemplifică în figura de mai jos, atunci când scrieți un element de date pe matricea de discuri, RAID 5 scrie A1, A2, A3, B1, B2 și B3 în secvență. Când citește datele, RAID citește secvențial și datele. Deci, ce sunt Pa, Pb și Pc? Sunt blocuri de paritate răspândite pe discuri. Când scrieți în A1, A2 și A3, RAID 5 utilizează operatorul bitwise XOR pentru a calcula Pa și a scrie blocurile corespunzătoare.
Pa = A1 (XOR) A2 (XOR) A3 (Function 1)
Deci, dacă unul dintre discuri este deteriorat, RAID 5 poate repara datele lipsă folosind datele de paritate și conținutul celorlalte două discuri. Presupunând că discul care conține datele A2 este corupt, datele pot fi reconstruite prin următorul calcul XOR:
A2 = A1 (XOR) A3 (XOR) Pa (Function 2)
Acest lucru permite redundanța cu RAID 5, oferind protecție împotriva defecțiunilor discurilor și pierderii de date.
RAID Scrubbing scanează întregul conținut al matricei pentru a se asigura că toate datele de paritate sunt Function 1. Dacă nu este, Function 2 îl va repara până când toate valorile sunt consistente. Acest lucru asigură că datele de pe disc sunt corecte.
Acum, s-ar putea să vă întrebați: „Atâta timp cât se execută în mod regulat RAID scrubbing, datele mele vor rămâne intacte pentru totdeauna?”. Din păcate, răspunsul este nu. Chiar și Synology, ca producător de soluții NAS, nu poate garanta că datele scrise pe hard disk vor rămâne întotdeauna corecte. Unele coruperi de date apar neobservate, motiv pentru care sunt cunoscute și sub numele de corupere silențioasă a datelor. Adică, unele date prezente pe hard disk conțin date neobservate și modificate în mod inexplicabil. Această defecțiune poate fi cauzată de o serie de motive, cum ar fi defecțiunea hard diskului sau interferența electromagnetică, pentru a numi doar două dintre ele.
În timp ce RAID scrubbing poate asigura consistența datelor stocate, nu poate preveni coruperea neobservată a datelor. Următorul exemplu explică acest lucru. Să presupunem că Pa urmează să fie reconstruit peste A1, A2 și A3 deoarece, de exemplu, discul 4 a trebuit să fie înlocuit. Acum, dacă un element de date A1, A2 și A3 este deteriorat, atunci funcția calculează o valoare incorectă și, în consecință, salvează această valoare incorectă. Dacă verificarea RAID scrubbing ar fi fost efectuată înainte de defecțiunea discului, elementul de date incorect ar fi putut fi identificat și corectat. Dar acum determină sistemul să valideze o valoare coruptă, deoarece RAID scrubbing nu poate detecta și remedia erorile (atât valoarea greșită, cât și valoarea lipsă). În acest caz, utilizatorii au nevoie de Btrfs data scrubbing.
2. Btrfs data scrubbing
Sistemul de fișiere Btrfs poate stoca două elemente de metadate într-un spațiu de stocare și poate calcula codurile de verificare asociate acestora. Btrfs Data Scrubbing utilizează exact această caracteristică pentru a realiza repararea automată a datelor.
Btrfs Data Scrubbing utilizează un mecanism de sumă de control pentru a examina datele stocate în sistemul de fișiere Btrfs. Dacă constată că datele nu se potrivesc cu suma de control, sistemul încearcă să le repare cu datele redundante.
Această caracteristică necesită ca utilizatorul să activeze suma de verificare a datelor atunci când creează un nou folder partajat. Sistemul de fișiere Btrfs calculează suma de control al datelor pentru fiecare fișier scris și îl protejează cu o sumă de control suplimentară (sumă de control al metadatelor).
Opriți riscul coruperii datelor cu ajutorul soluțiilor NAS
Când utilizatorii nu pot decide ce sistem de curățare a datelor să utilizeze, Synology NAS este alegerea perfectă. Synology Data Scrubbing System integrează Btrfs data scrubbing și RAID data scrubbing pentru a asigura integritatea datelor. Dacă se folosește sistemul de fișiere Btrfs, mai întâi este efectuată Btrfs data scrubbing. După ce ne asigurăm că datele sunt corecte, se efectuează RAID data scrubbing pentru a asigura în continuare coerența datelor. În acest fel, cele două sisteme funcționează perfect împreună. De asemenea, ele reduc riscul de corupere silențioasă a datelor și asigură că sistemul de stocare funcționează fără coruperea datelor și întreruperi costisitoare.
Citiți aici un ghid pas cu pas pentru curățarea datelor cu Synology NAS.
Citiți aici cum să faceți o copie de rezervă corectă a datelor și ce face o copie de rezervă bună.