NVIDIA BlueField 刷新 DPU 效能的世界紀錄

NVIDIA BlueField 刷新 DPU 效能的世界紀錄

 

資料處理器在伺服器與儲存裝置間每秒進行超過 4,100 萬次的輸入/輸出作業,其為原紀錄保持的四倍以上

 

資料中心需要極快的速度存取儲存裝置,而沒有任何一款資料處理器 (DPU) 的速度能比得上 NVIDIA 的 BlueField-2。

 

NVIDIA 近期的測試結果顯示兩個 BlueField-2 DPU 的每秒輸入/輸出作業 (IOPS) 達到 4,150 萬次,相較其它 DPU 的 IOPS 高出四倍以上。

 

BlueField-2 DPU 使用標準網路通訊協定及開源軟體,創下破紀錄的效能表現。其達到超過 500 萬的 4KB IOPS,並在 NVMe over Fabrics (NVMe-oF) 方面達到從 700 萬到超過 2,000 萬的 512B IOPS,NVMe-oF 是常用於存取儲存媒體的方法,採用 TCP主要的網際網路協定之一。

 

為加速人工智慧 (AI)、大數據及高效能運算應用的速度,BlueField 採用熱門的 RoCE 網路傳輸協定,以提供更好的儲存裝置存取效能。

 

在此次測試中,BlueField 使用各類儲存裝置軟體庫及不同的作業負載,以模擬實際的儲存裝置配置,無論是作為啟動器和目標軟體,都有著極佳的效能表現。BlueField 亦支援透過 InfiniBand 來快速連接儲存裝置,InfiniBand 是許多高效能運算及 AI 應用程式的首選網路架構。

 

測試方法

BlueField 創下的 4,150 萬 IOPS 紀錄,是過去使用專用儲存裝置創下的 1,000 萬 IOPS 世界紀錄的四倍之多。此效能表現是透過連接兩台高速慧與科技 (Hewlett Packard Enterprise;HPE) Proliant DL380 Gen 10 Plus 伺服器,一台作為應用伺服器 (儲存裝置啟動器),另一台作為儲存裝置系統 (儲存裝置目標軟體)。

 

每台伺服器搭載兩顆時脈速度為 2.3 GHz 的 Intel「Ice Lake」Xeon Platinum 8380 CPU,且每台伺服器具備 160 個超執行緒核心、512GB 的 DRAM、120MB 的 L3 快取記憶體 (每個插槽為 60MB),以及一個 PCIe Gen4 匯流排。

 

為了加速網路和 NVMe-oF,每台伺服器皆搭載兩張 NVIDIA BlueField-2 P 系列 DPU,每張皆有兩個 100Gb 乙太網路埠,進而在啟動器和目標軟體間產生四個網路埠及 400Gb/s 的有線頻寬,並使用 NVIDIA LinkX 100GbE Direct-Attach Copper (DAC) 被動線纜進行背對背連接。兩台伺服器均搭載 Red Hat Enterprise Linux (RHEL) 8.3 版本。

 

儲存系統的軟體使用預設核心 4.18 及最新核心之一的 5.15,對 SPDK 與標準上游 Linux 核心目標進行了測試。針對 SPDK、標準核心儲存裝置啟動器和 SPDK 的 FIO 外掛程式,這三種不同的儲存裝置啟動器進行了基準測試。使用 FIO 和 SPDK 來產生與測量作業負載,以及使用 4KB 和 512B 來測試 I/O 的大小,4KB 和 512B 分別是常見的中型及小型儲存裝置 I/O 大小。

 

在網路傳輸層使用 TCP 和 RoCE 來測試 NVMe-oF 儲存裝置協定。每種配置皆以 100% 的讀取、100% 的寫入與 50/50 的讀/寫作業負載進行測試,達到完全雙向使用網路的程度。

 

我們的測試結果亦顯示 BlueField DPU 具備的以下效能特徵:

  • 使用較小的 512B I/O 大小進行測試,達到較高的 IOPS 數值及低於線速的處理量;使用 4KB I/O 大小達到較高的處理量及較低的 IOPS 數值。
  • 100% 的讀取及 100% 的寫入作業負載提供類似的 IOPS 和處理量,而 50/50 混合讀/寫作業負載同時使用雙向網路連接,以產生更高的效能。
  • 使用 SPDK 產生出較核心空間軟體更高的效能,但代價是可預期之更高的伺服器 CPU 使用率,因為 SPDK 在用戶空間中運行且不斷進行輪詢。
  • 由於 Linux 社群不斷改善儲存裝置,因此較新的 Linux 5.15 核心效能優於 4.18 核心。

 

創紀錄的 DPU 儲存裝置效能將確保儲存裝置效能的安全性

在當前的儲存裝置環境裡,絕大多數的雲端及企業部署都需透過乙太網路或 InfiniBand,以高速、分散式且連網的快閃記憶體進行存取。更高速的伺服器、GPU、網路及儲存媒體都需要伺服器 CPU 的速度可以跟上,而最好的方法就是部署能夠存取儲存裝置的 DPU。

 

BlueField-2 DPU 所展現出的絕佳儲存裝置存取效能,讓整個資料中心的應用伺服器及儲存裝置擁有更高的效能和效率。

 

BlueField 除了能高速存取儲存裝置,亦支援對乙太網路儲存裝置的流量和儲存媒體,進行硬體加速的加密和解密作業,有助於防止資料遭竊或外洩。

 

它以高達 100Gb/s 的速度卸載 IPsec 線上資料與高達 200Gb/s 的速度卸載 256 位元的 AES-XTS 靜態資料,進而降低對手侵入儲存裝置網路或實體儲存磁碟遭竊、出售或被不當處置的風險。

 

客戶與領先的安全軟體供應商使用 BlueField 日前更新的 NVIDIA DOCA 框架,在 DPU 上運行網路安全應用程式,像是分散式防火牆或是具微切分 (Micro-Segmentation) 架構的安全群組,以進一步提高運算伺服器上的應用程式和網路安全性,降低這些伺服器所連接之儲存裝置遭到不當存取,或是資料遭到修改的風險。

 

了解更多關於 NVIDIA BlueField-2 DPU 測試活動的詳細結果:

NVIDIA BlueField-2 DPU 測試在 TCP 上使用 NVMe-oF。各項測試結果顯示兩個 BlueField-2 DPU 的合併效能。
NVIDIA BlueField-2 DPU 測試使用 NVMe-oF RoCE。各項測試結果顯示兩個 BlueField-2 DPU 的合併效能。

數碼領域

思科最新調查:僅9% 港企充分把握人工智能潛在機遇

數碼領域
2024-11-16 0
思科最新調查:僅9% 港企充分把握人工智能潛在機遇 港企人工智能準備度不足  充分準備比率明顯低於去年數字(25%) 新聞概要: 亞太區企業人工智能準備度情況不理想,僅9% 香港企業充分把握人工智能潛在機遇,較去年的25% 大幅下降。 各企業正全力投資人工智能,近半(48%)香港企業將目前10% 至 ...

XTransfer 新加坡金融科技節舞台演講獲關注

數碼領域
2024-11-16 0
XTransfer 新加坡金融科技節舞台演講獲關注 展示金融風控技術、積極探討區內合作機會 XTransfer,全球領先及中國第一的B2B跨境貿易支付平台,上週於「新加坡金融科技節2024」(Singapore Fintech Festival 2024),現場獲得參與者極大關注,展位參觀人潮駱驛不 ...

Be the first to comment

發表迴響

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料