Xilinx 的 KCU116:經濟實惠的 100 Gbps 網路和儲存 FPGA 開發平台
2021-07-27
Xilinx® 的 Kintex® UltraScale+™ 系列被視為每瓦性價比最平衡的 FPGA 元件,並以 TSMC 16 nm FinFET 技術打造而成。此元件結合新的 UltraRAM 和新的互連最佳化技術 (SmartConnect),針對需要 100 Gbps 連接核心之高階能力收發器的應用,提供最符合成本效益的解決方案。此系列專為網路和儲存應用而設計,例如網路封包處理和無線 MIMO 技術、100 Gbps 有線網路、工業和資料中心網路加速,以及 NVMe SSD (固態硬碟) 儲存加速。本文將展示 100 Gbps TCP 卸載引擎網路和 NVMe SSD 解決方案,在 Xilinx 的 KCU116 評估套件上的實作情況,其中使用 Design Gateway 的 TOE100G-IP 核心和 NVMeG4-IP 核心;前者用於 CPU 解決方案,透過 100 GbE 介面提供 12 GB/s TCP 傳輸,後者可達到驚人的快速效能,各 SSD 大約 4 GB/s。
Kintex® UltraScale+ KCU116 評估套件簡介
KCU116 非常適合評估關鍵的 Kintex UltraScale+ 特點,尤其是 28 Gbps 收發器效能。此套件非常適合以 XCKU5P-2FFVB676E FPGA 元件為基礎進行快速原型開發。
板件上包含板載 1 GB 32 位元 DDR4-2666、用於 1 x M.2 NVMe SSD 的 FMC 擴充連接埠,以及用於最多 2 x M.2 NVMe SSD 介面的 PCIe Gen4 x8 線道。16 x 28 Gbps GTY 收發器可用於 PCIe Gen4 和 100 GbE 介面實作,並具有多種周邊裝置介面,及用於使用者客製化設計的 FPGA 邏輯。
圖 1:KCU116 評估套件。(圖片來源:Xilinx Inc.)
KCU116 與 Design Gateway 的 IP 核心,共同為開發最先進的 100 Gbps 網路和儲存解決方案提供所需的一切要素,且無需 MPSoC 支援。
100 Gbps 網路和儲存解決方案的實作
圖 2:KCU116 上 100 Gbps 網路和儲存解決方案。(圖片來源:Design Gateway)
儘管 Kintex UltraScale+ 元件沒有 Zynq UltraScale+ 之類的 MPSoC 技術,但利用 Design Gateway 的 IP 核心解決方案,無需處理器和作業系統,即可實作網路與 NVMe 儲存協定處理:
- TOE100G-IP:100 GbE 完整 TCP 協定堆疊 IP 核心 (無需 CPU)
- NVMeG4-IP:內建 PCIe Gen4 軟體 IP 的獨立 NVMe 主機控制器
TOE100G-IP 和 NVMeG4-IP 都不需要 CPU/作業系統/驅動程式,即可運作。Microblaze 的純硬體邏輯或裸機作業系統,能為具有這兩種 IP 的控制和資料路徑實作使用者邏輯,進而更快更輕鬆地開發高階應用程式和演算法,而無需擔心複雜的網路和 NVMe 協定。這為感測器資料擷取、板載運算和 AI 型邊緣運算裝置等先進系統級解決方案,開啟了新的機會。
Design Gateway 的 UltraScale+ 元件用 TOE100G-IP
圖 3:TOE100G-IP 系統。(圖片來源:Design Gateway)
TOE100G IP 核心可針對下層硬體,使用 Xilinx 的 100 Gb 乙太網路子系統模組實作 TCP/IP 堆疊 (固線邏輯) 連接。TOE100G IP 的使用者介面包含用於控制訊號的暫存器介面,以及用於數據訊號的 FIFO 介面。TOE100G IP 專用於和 100 Gb 乙太網路子系統連接,而此子系統使用 512 位元 AXI4-ST 連接到使用者介面。Xilinx 提供的乙太網路子系統包括 EMAC、PCS 和 PMA 功能。100 Gb 乙太網路子系統的使用者介面時脈頻率為 322.265625 MHz。
TOE100G-IP 的特點
- 完整 TCP/IP 堆疊實作
- 一個 TOE100G IP 支援一個工作階段 (可使用多個 TOE100G IP 來實作多個工作階段)
- 支援伺服器和用戶端模式 (被動/主動開啟和關閉)
- 支援巨大訊框
- 以標準 FIFO 介面提供簡易數據介面
- 以單埠 RAM 介面提供簡易控制介面
下方表 1 顯示 XCKU5P-2FFVB676E FPGA 元件上的 FPGA 資源使用情況。
|
表 1:Kintex Ultrascale+ 元件的實作統計資訊範例
如需更多詳情,請參閱 TOE100G-IP 的規格書,可從 Design Gateway 的網站下載。
Design Gateway 為 GTY 收發器提供的 NVMe PCIe Gen4 主機控制器
Kintex UltraScale+ 具有能夠支援 PCIe Gen4 介面的 GTY 收發器,但不提供 PCIe Gen4 整合式模塊與 ARM 處理器。
Design Gateway 以開發 NVMeG4-IP 核心的方式來解決這個問題,此核心能當作獨立的 NVMe 主機控制器運作,在單一核心中內建 PCIe 軟體 IP 和 PCIe 橋接器邏輯。促成 NVMe PCIe Gen4 SSD 存取功能,即可簡化使用者介面,並可導入標準特點設計,便能方便使用,亦無需瞭解 NVMe 協定。
圖 4:NVMeG4-IP 方塊圖。(圖片來源:Design Gateway)
NVMeG4-IP 的特點
- 無需 CPU 或外部 DDR 記憶體,即可實作應用層、交易層、數據鏈路層,以及實體層的某些部分,以存取 NVMe SSD
- 可搭配設定為 4 線道 PCIe Gen4 (256 位元匯流排介面) 的 Xilinx PCIe PHY IP 一同運作
- 包含 256 KB RAM 資料緩衝區
- 支援六個命令,即識別 (Identify)、關機 (Shutdown)、寫入 (Write)、讀取 (Read)、SMART 以及排清 (Flush) (可選配其他命令支援)
- 使用者時脈頻率必須大於或等於 PCIe 時脈 (Gen4 為 250 MHz)
下方表 2 顯示 XCKU5P-2FFVB676E FPGA 元件上的 FPGA 資源使用情況。
|
表 2:Kintex Ultrascale+ 元件的實作統計資訊範例。
如需更多詳情,請參閱 NVMeG4-IP 的規格書,可從 Design Gateway 的網站下載。
KCU116 上的 TOE100G-IP 實作和效能結果範例
在圖 5 中,可概覽以 KCU116 為基礎的公版設計,以示範 TOE100G-IP 的實作。示範系統包括裸機 OS Microblaze 系統、使用者邏輯,以及 Xilinx 的 100 Gb 乙太網路子系統。
圖 5:TOE100G-IP 示範系統方塊圖。(圖片來源:Design Gateway)
示範系統專用於評估 TOE100G-IP 在用戶端和伺服器模式下的運作。測試邏輯能以測試模式傳送和接收資料,盡可能在使用者介面端達到最快的資料速度。KCU116 的 100 GbE 介面需要 4 個 SFP+ 收發器 (25GBASE-R) 和光纖纜線,如圖 6 所示。
圖 6:KCU116 上的 TOE100G-IP 示範環境設置。(圖片來源:Design Gateway)
100G 與其他速度 (1G/10G/25G/40G) 比較下的測試結果範例,如圖 7 所示。
圖 7:KCU116 的 TOE100G-IP 在 1G/10G/25G/40G 下的效能比較。(圖片來源:Design Gateway)
測試結果顯示,TOE100G-IP 能夠達到約 12 GB/s TCP 的傳輸速度。
KCU116 上的 NVMeG4-IP 實作和效能結果範例
在圖 8 中,可概覽以 KCU116 為基礎的公版設計,以示範 1CH NVMeG4-IP 的實作。如果可從使用者客製化設計中獲得 FPGA 資源,則能實作多個 NVMeG4-IP 實例,達到更高的儲存效能。
如需進一步瞭解 NVMeG4-IP 公版設計,請參閱 Design Gateway 網站上的 NVMeG4-IP 公版設計文件。
圖 8:NVMeG4-IP 公版設計概覽。(圖片來源:Design Gateway)
示範系統可使用 KCU116 上的 NVMe SSD 寫入/驗證資料。使用者可透過序列控制台控制測試作業。為了讓 NVMe SSD 介接 KCU116,需要一個 AB18-PCIeX16 配接器板,如圖 9 所示。
圖 9:KCU116 上的 NVMeG4-IP 示範環境設置。(圖片來源:Design Gateway)
使用 512 GB Samsung 970 Pro 時,在 KCU116 上執行示範系統的範例測試結果,如圖 10 所示。
圖 10:使用 Samsung 970 PRO S 時,KCU116 上的 NVMe SSD 讀取/寫入效能。(圖片來源:Design Gateway)
結論
TOE100G-IP 和 NVMeG4-IP 核心所提供的解決方案,都可利用 KCU116 板上的 100 Gbps 連接能力,進行網路和 NVMe 儲存應用實作。一個 TOE100G-IP 能在 100 GbE 介面上進行大約 12 GB 的 TCP 傳輸。NVMeG4-IP 可以透過 NVMe PCIe Gen4 提供非常高的儲存效能,每個 SSD 大約為 4 GB/s。多個 NVMeG4-IP 實例可用來組成 RAID0 控制器,並可提高儲存效能以匹配 100 GbE 傳輸速度。
KCU116 評估套件和 Design Gateway 的網路和儲存 IP 解決方案,能以最低的 FPGA 資源使用量達到最高的效能目標,因而能達到以 Xilinx® Kintex UltraScale+® 元件為基礎,且成本效益極高的解決方案或產品。
如需進一步瞭解 TOE100G-IP 和 NVMeG4-IP,請參閱 Design Gateway 網站上的規格書、現有公版設計和示範環境設置:
聲明:各作者及/或論壇參與者於本網站所發表之意見、理念和觀點,概不反映 DigiKey 的意見、理念和觀點,亦非 DigiKey 的正式原則。