19 Temmuz 2024’te CrowdStrike’ın gerçek zamanlı tehdit algılama ve uç nokta koruması için “Falcon Sensor” güncelleme girişimi, 8,5 milyon Microsoft Windows cihazını etkileyen bir sistem çökmesine yol açarak dünya çapında yaygın BT ve operasyonel kesintilere neden oldu. Bu olay bir siber saldırı veya kötü amaçlı yazılımdan kaynaklanmamış olsa da, iş operasyonlarında kesintileri önlemek için kapsamlı ve güvenilir bir yedekleme ve felaket kurtarma stratejisinin önemini vurgulamaktadır.
CrowdStrike anında küresel etkiye neden oluyor
Kesinti ilk olarak Avustralya’da tespit edildi ve “ölümün mavi ekranı” tüm dünyadaki Windows cihazlarına yayılarak kullanıcıları, şirketleri ve kritik hizmet sağlayıcıları önemli ölçüde kesintiye uğrattı. Wall Street Journal’a göre, öğleden sonra ABD’de yaklaşık 2.600 uçuş iptal edilirken, dünya genelinde 4.200’den fazla uçuş etkilendi ve manuel check-in işlemlerine başvurmak zorunda kaldı.
Uzun RTO’lar iş operasyonlarını nasıl etkiler?
Olayın ardından CrowdStrike teknik destek sağladı ve sistem işlemlerinin geri yüklenmesine yardımcı olmak için bir yama yayınladı. Ancak, kuruluşlar tarafından kullanılan birçok sistem bir onarım programı aracılığıyla otomatik olarak kurtarılamadı. Bu durumda BT yöneticilerinin etkilenen her cihazı manuel olarak güvenli moda geçirmesi ve sorunlu güncellemeleri CrowdStrike’tan silmesi gerekiyor.
Microsoft ertesi gün hatalı dosyaların otomatik olarak silinmesine yardımcı olan “süreci en aza indiren” bir çözüm sunmuş olsa da, cihazları bir USB sürücü aracılığıyla WinPE’ye manuel olarak önyüklemek hala zahmetliydi ve veri kurtarma sürecini uzatıyordu. Kesinti süreleri operasyonlarda aksamalara, üretkenlik kaybına, ek maliyetlere, artan uyumluluk risklerine ve nihayetinde olumsuz bir müşteri deneyimine ve zedelenen kurumsal itibara yol açar.
Süreklilik için güçlü bir veri koruma planı oluşturun
Kapsamlı yedeklemeler: İzole veri olmadan tüm kaynakları ve cihazları düzenli olarak kapsayan bir yedekleme stratejisi uygulamak, özellikle birden fazla platformda veya araçta faaliyet gösteren işletmeler için çok önemlidir.
Düzenli restorasyon tatbikatları: Ekipman ve sistem arızaları asla öngörülebilir değildir. Yedekleme verilerinin kurtarılabilirliğini sürekli olarak test etmek, kuruluşun felaket kurtarma planlarının etkinliğini ve kullanılabilirliğini doğrulamak için çok önemlidir.
Anında sanal makine kurtarma: Daha az kesinti süresi ve iş sürekliliği sağlamak için hizmetleri sanallaştırın ve işlemleri mümkün olan en kısa sürede geri yükleyin.
Platformlar arası geri yükleme: CrowdStrike’ın durumunda yalnızca bir platform etkilenmiştir. İşletmeler, tüm verilerin, uygulamaların ve sistemlerin birden fazla ortamda kurtarılabilmesini ve eski haline getirilebilmesini sağlayarak veri kaybı riskini en aza indirebilir.
Tesis dışı yedekleme ve kurtarma: Tesis içi verilerin yedeklenmesine ek olarak, tesis dışı bir yedeklemenin uygulanması veri kaybıyla ilişkili riskleri azaltır. CloudStrike olayı sırasında bir şirket tesis dışı bir bulut yedeklemesi kullanmış olsaydı, söz konusu tesis dışı yedekleme sitesinden hizmetlere kolayca devam edebilirdi.
Yedeklemeler veri esnekliğinin anahtarıdır
Güvenli bir yedekleme ve felaket kurtarma planına sahip olmak, veri esnekliğinin anahtarıdır ve dijital dönüşüm peşinde koşan her işletme için çok önemli bir adımdır. CrowdStrike olayı, öngörülemeyen durumlar karşısında sürekliliği korumak için sağlam bir yedekleme stratejisi oluşturmanın ve yedeklemeleri düzenli olarak test etmenin önemini sıkıca vurgulamaktadır.
Synology çözümleriyle veri korumasını nasıl güçlendireceğinizi öğrenmek için buraya tıklayın.