CoreWeave宣布推出SUNK,一个整合Slurm和Kubernetes的统一系统,用于生产级AI训练,提供高吞吐量、可观测性和可靠性,适用于长时间运行的任务。
CoreWeave开发SUNK解决了对强大、高效AI训练基础设施的关键需求。通过整合Slurm的作业调度能力和Kubernetes的编排能力,SUNK为复杂的AI模型开发提供了更精简、更可靠的环境。这可以显著降低运营开销,提高大规模训练任务的成功率,从而加速AI创新步伐以及先进AI模型在各行业的部署。
SUNK整合Slurm和Kubernetes用于AI训练。
提供高吞吐量、可观测性和可靠性。
专为生产级、长时间运行的AI任务设计。
这项AI训练基础设施的进步具有全球相关性,影响着全球AI的研究与开发。作为AI研究领导者的北美将是该技术的一个关键市场。
提供高吞吐量、可观测性和可靠性。
专为生产级、长时间运行的AI任务设计。
登录后可保存信号笔记。
登录