Official Blog
從發現問題到解決問題,Active Insight 如何讓企業 IT 管理更智慧?
Shamrock Ko
2021-09-28

從發現問題到解決問題,Active Insight 如何讓企業 IT 管理更智慧?

智慧維運(Artificial Intelligence for IT Operations,AIOps)是近期 IT 市場的熱門趨勢, 一個能夠直覺管理,並且能夠依據資料分析結果,主動給予提醒建議的系統,可以說能大幅提升 IT 管理上的便利性。

Synology 在 DSM 7.0 全新推出的 Active Insight 雲端智慧管理平台,正是為了回應企業日益提升的智慧維運需求。對於組織內部署多台 Synology 伺服器,以及有多點辦公室架構的企業來說,Active Insight 透過支援自動即時監控、資源分析、異常診斷,以及故障排除建議等功能,協助 IT 人員更好的掌握生產環境中 NAS 的系統狀態,快速完成多點的集中監控,更有效率地從「發現問題」、「預測問題」再到「解決問題」。

更快速的「發現問題」,把管理變主動

企業 IT 人員的工作內容多涵蓋機器的例行檢查,且不一定只有在機器遇到問題時,才需要去機器查看,即使機器沒問題,也可能需要安排週期性檢查,一台一台登入輪流檢查,無論在工作時間、人力的安排上都是一大負擔。因此,企業 IT 多半習慣在初次導入設備平台時,便預先設定好如 CPU、記憶體、硬碟 IO 等事件通知,並在遇到事件示警時登入查看。

儲存系統的管理當然也不例外,Active Insight 希望進一步提升 IT 人員例行管理檢查的便利性,更快速的發現系統問題。例如, 由於 IT 人員不可能時時刻刻盯著平台,這時候 Active Insight 能透過網頁端與行動裝置端,進行主動式通知的功能就相當實用,讓 IT 人員不必時時登入確認系統狀態,但仍能在系統遇到狀況時及時接收到異常通知,並在收到通知的時候,記得安排時間回頭處理異常事件即可。

此外,過去 IT 人員要登入系統找出問題要耗費許多時間,透過 Active Insight 集中且直覺的雲端總覽介面,能夠隨時掌握系統及儲存空間的健康狀態,並即時接收異常事件通知,大幅縮短「發現問題」的時間。而在發現問題後, Active Insight 也會直接判別問題並提供建議連結、引導使用者進行下一步處理。

(圖說:透過集中且直覺化的總覽介面,使用者能夠透過電腦與行動裝置,密切監控相同 Synology 帳戶下的所有 Synology NAS,隨時掌握系統及儲存空間的健康狀態並即時接收異常事件通知。)

更全面的事件示警,進一步引導「解決問題」

Active Insight 也整合更多的事件通知,能夠提供比原本 Synology NAS DSM 事件推播通知更加全面的事件示警,為硬體健康 (Performance & capacity) 把關,協助 IT 人員提升系統狀態整體的掌握度。

這是由於 Synology 觀察到,新手 IT 過去在首次使用 Synology NAS 時,在實作上有時會不太清楚要針對哪些事件啟用事件推播通知功能,或是有哪一些容易忽略的指標,可能會影響系統正常運作以及服務可用性。 Active Insight 希望透過基於過去 Synology 累積的經驗,以自定義的「警告」、「嚴重」等事件層級,提醒 IT 人員進行相關配置,並提供具體建議來快速解決問題。

(圖說:Active Insight 提供比原先 DSM 事件推播通知更加全面的事件預警。)

舉例來說, IT 人員都相當清楚部署環境的重要性,因此當系統溫度偏高或過熱,可能導致系統無預警關機時, Active Insight 即會提醒留意保持裝置通風良好並調節室溫;另一方面, Active Insight 也列入許多過去時常忽略的指標。例如,「SMB 連線數量達上限」其實就是個嚴重性高、但不太會被主動留意到的問題,當連線使用者超過支援的數量,可能導致部分使用者無法透過 SMB 連線至 Synology NAS, Active Insight 即將其列為嚴重層級的事件,並且提供說明步驟來引導解決問題。

更因為 Active Insight 是雲端架構平台,當使用者的機器遇到無法自行排除的狀況時,Synology 支援團隊也能透過雲端蒐集的資料快速掌握狀況。舉例來說,過去 Synology 在收到需要登入查看系統日誌(log)的客服案件中,可能僅有 30% 會在一開始就附上日誌供查驗,剩下的 70% 案件皆需要來回多一次的溝通,過程中可能因為雙方時間上的落差,導致數小時甚至數天才能得到反饋。

而 Active Insight 透過主動讓使用者能在提交支援單時附加系統日誌,節省中間反覆溝通的黃金時間差,也讓 Synology 支援團隊能更快協助確認事件本身影響原因,並提供更快更準確的支援服務品質

超前部署,透過資料分析「預測問題」

Active Insight 除了能在企業部署的 Synology NAS 中偵測到系統異常時,及時發出事件通知與示警,引導使用者解決問題之外,更重要的還有透過資料分析提供「資訊解讀」以及「預先示警」的功能。

截至目前, Synology 在全球已經銷售超過 850 萬台 Synology NAS,透過過去累積全球裝置的匿名資料,以及 Synology 多年技術支援服務的經驗,能夠分析與識別可能造成系統故障的因素,並篩選出有故障風險的裝置。

當企業所部署的 Synology NAS ,傳來的資料符合預設狀況的話,就會給予相應的通知,發送給類似生產環境下的使用者。例如,哪些特定廠牌的硬碟,在怎樣的部署環境下,在使用多少時數後會有極大的故障可能;企業應該在那些時機點更新韌體,裝置會有效維持在健康狀態等。

從快速的發現問題、提供指引協助解決問題,再到運用資料分析來預測問題, Active Insight 未來更將持續加強系統的自動化與資料分析功能,以更加貼近企業的使用情境。例如,目前 Active Insight 分析與解讀系統與硬體效能等健康數據,未來還會進一步加入安全性數據的分析,像是追蹤登入資訊與檔案存取資訊,分析是否有異常的檔案存取行為,追蹤升級與備份任務資訊,確保機器都有更新到安全的最新版,並確認備份任務都有正常執行等,為裝置的安全性做把關,協助企業 IT 人員超前部署,預先因應各種可能情況,也真正實踐智慧維運的精髓,讓 IT 維運過程更有效率。