BLAZAR BE2-RMW/BE3-RMW 加速器引擎
Peraso 的 BLAZAR BE2-RMW/BE3-RMW 加速器引擎具有智慧型記憶體內 BURST 傳輸、RMW 運算和決策功能
Peraso's 的 BLAZAR 加速器引擎系列支援高頻寬、快速的隨機記憶體存取速率和嵌入式記憶體功能 (IMF),這些功能可以為遭遇記憶體瓶頸的應用解決關鍵記憶體存取挑戰,例如網路搜尋、統計、緩衝、安全性、防火牆、8k 視訊、異常偵測、基因體學、ML 隨機森林、圖表/樹/清單遍歷和流量監控。
頻寬引擎 2 RMW (BE2-RMW) 結合 576 Mb 的高速串列記憶體和記憶體中的頻寬功能,而頻寬引擎 3 RMW (BE3-RMW) 則提供高達 1.152 Gb 的頻寬。IMF 減少諸如 BURST 和 RMW 等記憶體指令的數量,這些指令支援 2、4 或 8 個順序讀取和寫入的單一記憶體指令,以進行數據移動並減少記憶體指令週期。頻寬引擎 RMW 非常適合可以使用較大的 SRAM 容量來提高效能、取代 QDR 以更少的設計心力來實現更高效能的任何系統。BE2 支援高達 320 Gbps 的頻寬,BE3 支援高達 380 Gbps 的頻寬,並提供 640 Gbps 版本。
示意圖
- 576 Mb (BE2) 和 1.152 Gb (BE3) 的高速 1 T 儲存:
- 取代 4 QDR 元件 (BE2) 和 8 QDR 元件 (BE3)
- 高存取速率 SRAM 級記憶體
- 高循環率記憶體
- 每秒高達 65 億筆交易
- 3.2 ns tRC
- 4 個分區/64 個儲存區 (BE3 高達 128 個) 並支援同時存取
- 兩個 8 通道獨立介面連接埠:
- 每個連接埠都是獨立的,允許雙連接埠操作
- 高頻寬、低引腳數串列介面
- 僅使用 32 個引腳連接到 FPGA 或 ASIC (最少可使用 8 個引腳)
- 透過 QDR 將 I/O 引腳減少多達 7 倍
- 板載訊號自動適應功能可簡化板件佈局和訊號完整性
- 所需的走線長度最小,可透過連接器工作
- BE2 的串列器/解串列器速率為 12.5 Gbps,BE3 的串列器/解串列器速率為 15.6 Gbps (更高頻寬提供 25 Gbps)
- I/O 引腳上每秒高達 33 億筆交易,而 BE3 每秒高達 65 億筆
- 管理功能:
- 元件上的排程器
- 8 個排程域 (可選)
- Peraso 提供的 RTL 記憶體控制器允許使用者定義記憶體字長
- 例如 x8、x16、x32、x36、x64、x72
- 記憶體內頻寬功能:
- BURST 順序讀取和寫入功能用於數據移動,頻寬可幾乎增加一倍
- 突衝長度:1、2、4、8 字
- 使用 IMF,效能勝過 QDR
- BE2 可同時執行 8 次讀取和 8 次寫入,而 BE3 可高達 16 次讀取/寫入
- BE2/BE3-ALU 提供 RMW (讀取/修改/寫入) 運算和決策功能
- 例如 ADD、SUB、INC、Compare 等功能
- 封裝:
- BE2 BURST 為 19 mm x 19 mm
- BE3 BURST 為 27 mm x 27 mm
- 效能:
- 單晶片頻寬
- BE2 為 320 Gbps 傳輸量
- BE3 為 380 Gbps (提供 640 Gbps 版本)
- 透過以下方式,使用 IMF 來獲得超越 QDR 的效能:
- 消除大量的系統記憶體指令
- 記憶體週期節省時間可提高應用效能
- 網路搜尋
- 統計
- 緩衝
- 安全性
- 防火牆
- 8k 視訊
- 異常偵測
- 基因體學
- ML 隨機森林
- 圖表/樹/清單遍歷
- 交通流量監測
BLAZAR BE2-RMW/BE3-RMW Accelerator Engines
圖片 | 製造商零件編號 | 說明 | 記憶體排列 | 存取時間 | 封裝/外殼 | 現有數量 | 價格 | 查看詳情 | |
---|---|---|---|---|---|---|---|---|---|
![]() | ![]() | MSR820AJC288-12 | IC SRAM 576MBIT PAR 324PBGA | 8M x 72 | 2.6 ns | 324-BGA | 0 - 即時供貨 | $3,657.39 | 查看詳情 |
![]() | ![]() | MSR830AGC-1512 | IC SRAM 1GBIT PAR 676BGA | 16M x 72 | 2.7 ns | 676-BGA | 0 - 即時供貨 | $5,161.74 | 查看詳情 |