Official Blog
Az adat-deduplikációval kapcsolatos tévhitek tisztázása
Synology Team
június 27, 2024

Az adat-deduplikációval kapcsolatos tévhitek tisztázása

Mivel a vállalkozások minden eddiginél több adattal rendelkeznek, fontos, hogy túlköltekezés nélkül tudják maximalizálni a tárolókapacitást. Itt kerül a képbe az adat deduplikáció. Ennek a technikának a használatával a redundáns adatok kiszűrésre és eltávolításra kerülnek, mielőtt a biztonsági mentés elkészülne. Ennek köszönhetően kevesebb tárhelyet használnak fel, így helyette új adatokat menthet el.

Ennek segítségével hatékonyan tud biztonsági mentést készíteni az adatokról, mivel nem kell időt töltenie ugyanazon adatok duplikált példányainak biztonsági mentésével.

Ne feledje, hogy egyes gyártók állíthatják, hogy termékük bizonyos mértékű adat-deduplikációs arányt kínál. A gyártó például azt állíthatja, hogy az általa kínált deduplikációs arány 20-szor nagyobb, és több mint 200%-kal felülmúlja a versenytársakét. A tényleges deduplikációs arányt azonban számos változó befolyásolja.

Nézzük meg, mi is az adat deduplikáció, és hogyan döntsük el, hogy a biztonsági mentési megoldás kiválasztásakor mekkora a megfelelő deduplikációs arány.

Hogyan kell kiszámítani az adat deduplikációs arányt?

A duplikált adatok hatékony eltávolításához az eszköznek olyan CPU-kkal és szoftveres technológiával kell rendelkeznie, amely lehetővé teszi a tárhely megtakarítást.

Az adat deduplikáció használatakor a rendszer az adatok tárolása előtt azonosítja az adatblokkokat. Minden egyes adatblokkhoz egyedi azonosító számot rendel, a tárolt blokkokhoz pedig ujjlenyomatok készülnek. A tárolt blokkok ujjlenyomatait ezután összehasonlítják az újonnan írt adatblokkokkal.

Ha a rendszer egy duplikált blokkot észlel, létrehoz egy indexet, amely a duplikált adat helyére mutat. A redundáns adatok ezután eltávolításra kerülnek, így a tárolási kapacitás optimalizálható.

Mivel a zsarolóvírus-támadások kockázata napról napra nő, a vállalkozásoknak hatékony adatmentési és helyreállítási tervet kell kidolgozniuk adataik biztonságos tárolására, biztosítva, hogy az adatok deduplikációjának segítségével elegendő tárolókapacitással rendelkezzenek.

A vállalkozások rendszeresen készítenek nagy mennyiségű biztonsági mentést adataikról, ami a tárolási költségek növekedéséhez vezethet. Az új adatok vagy a módosított adatok általában csak a töredékét teszik ki a teljes, korábban mentett adatmennyiségnek. Ez azt jelenti, hogy a naponta mentett adatok nagy része valójában duplikált vagy redundáns adatokat tartalmaz. Itt jön képbe az adatok deduplikálása.

Az adatteduplikáció arányának hatékony kiszámításához a felhasználóknak ki kell számítaniuk a törölt duplikált adatok százalékos arányát.

Mivel az egyes gyártók eltérő módon számítják ki az adatdeduplikációs arányokat, az alábbiakban ismertetjük az adatduplikációs arány kiszámításának három szakaszát. Mindegyik szakasz más-más értéket eredményez:

1. szakasz [Eredeti adatsor]: A redundáns adatok eltávolítása előtt biztonsági mentést igénylő adatok teljes kapacitása.

2. szakasz [Adattovábbítás a deduplikálás után]: Az adatok deduplikálása után a kiszolgálón tárolandó adatok továbbítható mennyisége.

3. szakasz [Ténylegesen tárolt adatok]: A biztonsági mentési kiszolgálón tárolt adatok mennyisége.

Az adat deduplikálás hatékonyságának mérésekor a Synology a 2. fázis [Adatátvitel a deduplikálás után] vizsgálatát javasolja.
Az 1. fázis [Eredeti adathalmaz] során keletkezett érték ugyanis félrevezető lehet, mivel tartalmazza a “régi” és az “új” adatokat is, amelyeket aztán el kell osztani a megőrzött adatok mennyiségével. Nem ritka, hogy egyes gyártók ezt a számot mesterségesen felfújják, így felhasználóként nehéz megállapítani, hogy a gyártó valójában melyik fázist használta az adat-deduplikáció hatékonyságának mérésére.

Amint az alábbiakban látható, a számok kiszámítása után két különböző eredményt kapunk. A kettő között nagy az eltérés, így a vállalkozások félreérthetik az adatdeduplikáció hatékonyságát.

Amikor utána néztünk, hogy versenytársaink termékei hogyan végzik az adatok deduplikálását, a fent felsorolt három fázist azonosítottuk.

A 95%-os adatcsökkentési arányhoz a deduplikáció előtti eredeti adathalmazt el kell osztani a célállomáson elfoglalt tárhely mennyiségével.

A vállalkozásoknak azonban a továbbított adatok méretére kell összpontosítaniuk, amelyet el kell osztani a tárolási célállomáson elfoglalt tárhely mennyiségével. Ha ezt a képletet használjuk az adatok deduplikációs arányának kiszámításához, az átlagos adatcsökkentés nagyjából 40~66% lesz.

A tajvani Shiseido például 52%-kal tudta növelni a tárolókapacitását a Synology biztonsági mentési megoldásaihoz tartozó adat-deduplikációs technikák segítségével. Más biztonsági mentésekkel foglalkozó gyártókkal összehasonlítva a Synology kedvezőbb áron kínál megoldásokat, megtakaríthatva a tárolási költségeket, és maximalizálva a tárolási kapacitást, a lehető legtöbb adat megvédése érdekében.

Maximalizálja a tárolókapacitást és csökkentse költségeit az adatok deduplikálásával

A vállalatok gyenge pontjait szem előtt tartva a Synology kidolgozott egy adatok deduplikálására szolgáló technikát, így a vállalatok mostantól minimalizálhatják tárolási költségeiket, miközben maximalizálhatják tárolási kapacitást.

A Synology bevezette az inline deduplikációt a biztonsági mentések végrehajtásakor. Az adatok beírása előtt a rendszer egyidejűleg összehasonlítja az adatok tartalmát, és törléseket hajt végre, így csökkentve az adatok tárolásához szükséges tárolókapacitást. Emellett a Synology blokkszintű globális deduplikációs technológiát is bevezetett a több biztonsági másolatforrás közötti duplikált másolatok eltávolítására. Ezzel biztosítható, hogy egyetlen mappán belül több mentési feladat között ne maradjanak redundáns adatok.

A vállalkozásoknak mindent meg kell tenniük az adataik biztonságos tárolása érdekében. Ez magában foglalja az előre tervezést, és egy olyan biztonsági mentési megoldás kiválasztását, amely megfelel a skálázhatósági és bővítési igényeknek.

Kattintson ide a további információkért.