CoreWeave 發布 SUNK,統一的 AI 訓練系統,整合 Slurm 和 Kubernetes,提供高輸送量、可觀測性和可靠性。
CoreWeave 開發 SUNK 的舉措,解決了對穩健且高效 AI 訓練基礎設施的關鍵需求。透過將 Slurm 的作業排程功能與 Kubernetes 的協調能力相結合,SUNK 為複雜 AI 模型開發提供了更精簡且更可靠的環境。這能顯著降低營運成本,並提高大規模訓練執行的成功率,從而加速 AI 創新步伐以及先進 AI 模型在各產業的部署。
SUNK整合Slurm和Kubernetes用于AI训练。
提供高吞吐量、可观测性和可靠性。
专为生产级、长时间运行的AI任务设计。
這項 AI 訓練基礎設施的進展具有全球相關性,影響著全球的 AI 研究與開發。作為 AI 研究領導者的北美地區,將是這項技術的關鍵市場。
提供高吞吐量、可观测性和可靠性。
专为生产级、长时间运行的AI任务设计。
Sign in to save notes on signals.
登录