NVIDIA 發表新款人工智慧平台 將超級運算資料中心的停機時間降到最低
NVIDIA Mellanox UFM Cyber-AI 平台能夠偵測安全威脅、預測網路故障等事件
以及指導進行預防性維護作業
NVIDIA (輝達) 今日宣布將推出 NVIDIA® Mellanox® UFM® Cyber-AI 平台,這款平台將利用搭載人工智慧 (AI) 的分析功能來偵測安全威脅和運作問題,以及預測網路故障等情況,進而將 InfiniBand 資料中心的停機時間降到最低。
過去使用 UFM 平台產品組合來管理 InfiniBand 系統,已有近十年的時間,而這款最新產品加入 AI 技術,運用即時與歷史遙測及作業負載資料,學習資料中心的運行節奏和網路工作量處理模式。此平台在這個基礎上追蹤系統健全及網路修改情況,以及偵測效能表現下降、使用情況和設定檔的變化情形。
新平台會提醒管理員系統與應用程式的異常行為,以及潛在的系統故障和威脅,並且執行修正。如果發現有駭客企圖進入系統,以運行不受歡迎的應用程式(例如加密貨幣挖礦等情況)等安全情況,也會通知管理員。如此便降低了資料中心的停機時間,ITIC 指出通常停機一小時的成本高達 30 萬美元(1)。
NVIDIA Mellanox 網路部門行銷資深副總裁 Gilad Shainer 表示:「UFM Cyber-AI 平台可以判斷資料中心獨特的生命徵象,用它們來辨識效能下降、零組件故障和異常使用模式。它讓系統管理員能夠快速偵測和因應潛在的安全威脅,解決即將出現的故障情況,進而節省成本與確保提供客戶一致的服務。」
商業生態體系的支持
長期在其資料中心中使用UFM平台的組織已對最新產品表示出濃厚的興趣。
澳洲國家計算基礎設施(NCI)副主任(服務和技術)Allan Williams說:「 NCI在國家研究領域中起著舉足輕重的作用。我們的超級運算基礎架構可為5,000名研究人員提供服務,服務重要的國家和全球活動。 UFM使我們能夠有效地管理超級電腦並優化效能。我們期待利用UFM Cyber-AI的新功能來進一步提高我們的超級運算利用率並提高投資回報率。」
美國俄亥俄州超級電腦中心副主任 Douglas Johnson 說:「我們的 InfiniBand 資料中心多年來一直在使用 UFM 平台,UFM 加上 Mellanox 網路團隊的專業長才是我們管理網路與維持網路穩定運作的基本要素。我們見到 UFM Cyber-AI 平台有著無比的優點。」
擴大 UFM 平台
UFM Cyber-AI 平台搭配 UFM Enterprise 平台運作,而 UFM Enterprise 平台提供網路監控、管理、效能優化、組態配置檢查和安全纜線管理等功能。
NVIDIA 今日還為 UFM 系列加入第三個成員,也就是 UFM Telemetry 平台。這款工具可以取得即時網路遙測資料,並且將這些資料引流到企業內部或雲端資料庫,以監控網路效能及驗證網路組態配置內容。
支援資源:
發表迴響