V pátek, 19. července 2024, se CrowdStrike pokusil o aktualizaci „Falcon Sensor“ určené k lepší detekci hrozeb v reálném čase a ochraně koncových bodů. Tato aktualizace se bohužel nezdařila a způsobila havárii systému. Postiženo bylo 8,5 milionu zařízení Microsoft Windows a následkem bylo rozsáhlé narušení IT provozu po celém světě. Přestože tento incident nebyl způsoben kybernetickým útokem nebo malwarem, ukazuje na důležitost komplexní a spolehlivé strategie zálohování a obnovy po havárii jako prevence narušení obchodních operací. Společně se ve stručnosti podíváme, jak se z této situace poučit a posílit ochranu dat.
Havárie CrowdStrike měla okamžitý globální dopad
Výpadek byl poprvé zjištěn v Austrálii, odkud se „modrá obrazovka smrti“ na zařízeních Windows rozšířila po celém světě. To znamenalo výrazné narušení provozu běžných uživatelů, větších společností i poskytovatelů důležitých služeb. Odpoledne bylo v USA zrušeno přibližně 2 600 letů, celosvětově pak bylo postiženo více než 4 200 letů, které se podle Wall Street Journal musely uchýlit k ručnímu odbavení.
Jak dlouho RTO ovlivňují obchodní operace
CrowdStrike poskytl po zjištění incidentu technickou podporu a vydal patch, který měl pomoci obnovit chod systémů. Řada organizací ale svoje systémy nebyla schopna pomocí této aktualizace automaticky obnovit. V tom případě museli IT administrátoři ručně spustit zvlášť každé postižené zařízení v nouzovém režimu a odstranit problematické aktualizace od CrowdStrike.
Přestože Microsoft během následujícího dne představil řešení „minimalizující procesy“, které pomohlo automaticky odstranit vadné soubory, ruční spouštění jednotlivých zařízení do WinPE přes USB disk bylo stále pracné, což prodlužovalo proces obnovy dat. Prostoje vedly u mnoha firem k narušení provozu, ztrátě produktivity, dodatečným nákladům, nedodržování předpisů a v konečném důsledku k negativní zákaznické zkušenosti a pošramocení dobré pověsti.
Jak posílit ochranu dat pro nepřerušený provoz
Komplexní zálohování: Nasazení strategie zálohování, která pravidelně pokrývá všechny zdroje a zařízení bez izolovaných dat, je pro podniky zásadní. Zejména pro ty, které pracují na více platformách nebo nástrojích.
Pravidelné renovační cvičení: Selhání zařízení a systému nelze nikdy předvídat. Nepřetržité testování obnovitelnosti zálohovaných dat je zásadní pro ověření účinnosti a dostupnosti plánů obnovy po havárii.
Okamžité obnovení virtuálních počítačů: Virtualizujte služby a obnovte operace co nejrychleji, abyste zajistili snížení prostojů a kontinuitu podnikání.
Obnova mezi platformami: V případě CrowdStrike byla ovlivněna pouze jedna platforma. Podniky mohou minimalizovat riziko ztráty dat tím, že zajistí, aby všechna data, aplikace a systémy byla obnovitelná v různých prostředích.
Zálohování a obnova mimo pracoviště: Kromě zálohování dat na místě zmírňuje implementace zálohování mimo pracoviště rizika spojená se ztrátou dat. Pokud by společnost během události CloudStrike nasadila zálohu cloudu mimo lokalitu, mohla by snadno obnovit služby z uvedeného záložního místa mimo lokalitu.
Jak na ochranu dat? Klíčem jsou zálohy
Mít spolehlivý plán zálohování a obnovy po havárii je klíčovým prvkem v odolnosti dat. Také jde o zásadní krok pro každou organizaci, která provádí digitální transformaci. Incident CrowdStrike jasně zdůrazňuje důležitost vytvoření robustní strategie zálohování a pravidelného testování záloh. Díky tomu zachováte kontinuitu dat tváří v tvář nepředvídaným okolnostem.
Objevte, jak posílit ochranu dat pomocí řešení Synology Active Backup for Business.