Official Blog
Synology 導入精準修復機制,有效縮短 RAID 降級時間、維持資料完整性
YC Chen - PR Manager
2024-07-23

Synology 導入精準修復機制,有效縮短 RAID 降級時間、維持資料完整性

隨著資料量日益增長,企業對資料的依賴性也逐漸提高,保護珍貴資料是當今組織最重要的議題之一。全球十大自然資源供應商 SK Shipping 就提到,以該公司的生產環境來說,資料的儲存和管理效率相當重要,因此非常重視儲存伺服器的穩定性,以及是否容易操作。

而提到穩定性和效率,Synology 認為存有關鍵資料的硬碟,能否持續穩定運行可說是箇中關鍵之一。畢竟當硬碟突然停止運作或發生故障時,不僅無法存取特定資料,更會造成營運中斷。

為了降低此風險,不少企業會選用 RAID(Redundant Array of Independent Disks,即獨立磁碟冗餘陣列)技術,便能有限地容錯硬碟故障。由於出現硬碟故障狀態時,會導致 RAID 降級並觸發修復資料,修復完畢後,原先的資料便可以再度安全且可靠地存取。

然而,修復過程中經常會出現一個問題:此時儲存空間處於保護降級狀態,會影響企業營運效能、增加資料毀損的風險。因此對於企業來說,建置 RAID 之後不代表能高枕無憂,還得設法縮短降級修復時間,才能確保資料完整性。

延伸了解 | SK Shipping 如何運用 Synology 方案簡化資料管理流程?

RAID 降級時間越長,資料遺失風險越高

首先要了解的是為什麼在 RAID 進入降級修復時,對企業來說會產生負面影響?

當儲存陣列中某顆硬碟故障時,整體 RAID 陣列就會轉為冗餘減少的狀態,儲存空間便進入所謂的降級模式。處於降級模式時,IT 人員便需更換故障硬碟,而替換與觸發修復過程時,同位元與其他正常運作的硬碟,會重新計算資料區塊,才有辦法在健康硬碟上建立資料以完成修復。

但硬碟更換和資料重建過程中,會密集執行讀寫作業並影響系統效能,存取其餘可用硬碟資料的時間便會因此延遲。當所需重建時間愈長,系統就復原得愈慢,更會間接拖累企業的其他服務。

另外,資料重建期間 RAID 陣列中其他完好硬碟,不可避免會承受更大的負載,萬一這段時間因負載增加、可用硬碟也跟著故障,並超過該 RAID 陣列容錯的硬碟顆數時,整個儲存空間就會毀損,無法完整復原資料。

想要減少降級時間帶來的風險,企業的應對策略之一是增加容錯硬碟的數量,卻得相應支付更多成本。為了解決安全性和預算的兩難,Synology 儲存伺服器便提供了精準修復(Precise Repair)的機制。

僅需不到一半時間,精準修復加速修復 RAID 降級

精準修復最大的效益,是能有效縮短 RAID 降級的時間。此技術核心在於僅修復有儲存資料的硬碟區塊,支援提供資料保護的 RAID 類型,並且適用於 BTRFS 和 EXT4 檔案系統。

由於 RAID 資料重建時間是根據硬碟容量的大小,而非儲存的資量容量,像是兩顆都為 4TB 的硬碟,前者已使用 80% 空間,後者僅存放不到 1GB,資料重建的時間就會相同。當使用精準修復時,受惠於系統先辨識該集區是否有儲存資料,並略過儲存集區中未使用的空間,就能大幅加速修復過程,盡快恢復 RAID 的保護作用。

以下圖為例,透過精準修復能得知當前檔案系統中未使用的資料區塊(A1、A2、A3、B3、D2) ,此時會判斷若該資料區段涵蓋的所有資料區塊皆未使用(A1、A2、A3),便會略過在新硬碟上 Pa 區塊的重建;反之,若該資料區段的資料區塊同時包含已使用(B2) 和未使用 (B3) 的資料區塊,則會執行 B1 區塊的重建。當然,為了確保資料完整性,未被重新計算與重建的資料區塊,在精準修復之後仍會再執行 Data Scrubbing,檢查和自動修正資料以防止潛在的資料毀損。

根據測試,以 4 TB 硬碟組成的 RAID 5 儲存空間1,當資料存量約為 50% 時,一般的 RAID 重建需要近 7 小時,使用精準修復技術後能縮短超過一半時間,僅花不到 3 小時就能完成修復,同時維持資料的完整性。

1 DS923+ 所有硬碟抽取盒均安裝 Synology HAT5300 系列 4 TB SATA HDD,在 DSM 7.2 環境中測試。

預防勝於治療,自動更換不健康硬碟

精準修復是在儲存集區已面臨降級時才會觸發,雖然能夠有效縮短降級時間,減少資料遺失的風險,但秉持預防勝於治療的精神,Synology 儲存伺服器還擁有 Hot Spare 自動更換(Auto Replacement) 功能。

舉例來說,當系統偵測到 SSD 硬碟狀態的耐用度耗盡,或是該硬碟因為嚴重錯誤,進入唯讀模式時,便會自動將硬碟中的資料重建到可用的 Hot Spare 硬碟。如此一來,用戶就不需擔心損壞的硬碟,會造成儲存集區降級。這意味著企業使用 Synology 解決方案建置資料架構時,能獲得多層次的資料完整性保障。

除此之外,企業亦可選用經過研發團隊縝密且高壓測試的 Synology 硬碟,確保高可靠性,並定期執行 Data Scrubbing 確保資料一致性,還能夠搭配 Synology 多種資料保護機制,例如涵蓋各種裝置、虛擬機與 SaaS 服務的備份服務,都能有效守護企業資料完整性。

從多方面確保資料伺服器的穩定性,也讓 Synology 獲得英國帝國戰爭博物館(Imperial War Museums)的肯定,將其原本存放於磁帶、累積到超過 1PB 的珍貴影像資料,都存放於 Synology PB 級解決方案 HD6500 中,不僅加快取用資料的效率,更讓他們為未來持續增長的資料做好萬全準備。

想要多了解 Synology 的儲存解決方案,如何強化企業資料可靠性與管理效率嗎?立刻填寫線上諮詢表單,我們將會有專人與您聯絡:https://sy.to/9cpjx