Rebellions 宣布推出 REBEL-Quad,一款旨在處理 Peta 級專家混合(MoE)模型的新型 AI 推論產品。該公司強調其卓越的效能與能效,表示與 NVIDIA 的 H200 相比,其吞吐量提高了 1.6 倍,能效(TPS/瓦特)提高了 3.2 倍,同時功耗降低了約 50%。此次發表旨在為要求嚴苛的 AI 工作負載提供更具成本效益與可擴展性的解決方案。
Rebellions 推出 REBEL-Quad,為 AI 硬體市場提供了一個引人注目的替代方案,特別是對於那些利用大型 MoE 模型的組織而言。其聲稱的效率提升,可能大幅降低 AI 推論的營運成本,使先進 AI 更具可及性與永續性。這項發展可能影響未來的硬體設計選擇,並加速尖端 AI 技術的採用。
Rebellions发布REBEL-Quad,用于Peta级MoE AI推理。
REBEL-Quad相比H200在吞吐量和能效方面有所提升。
该产品旨在降低AI推理的功耗。
身為一家韓國公司,Rebellions 的產品發表對 AI 基礎設施產業具有全球性的影響,將影響全球的資料中心營運商與 AI 開發者。
该产品旨在降低AI推理的功耗。
其目标是支持大规模商业AI模型的部署。
Sign in to save notes on signals.
登录