Amazon Web Services(AWS)はCerebrasと提携し、Amazon Bedrock上で高速なAI推論を提供する。これによりAWSは、Cerebrasの分散型推論ソリューションを提供する初のクラウドプロバイダーとなる。この提携は、現在のソリューションを大幅に上回る推論速度を実現し、大規模生成AIアプリケーションの採用を加速させることを目指す。
この提携により、AWS顧客は高性能なAI推論ソリューションを利用できるようになる。これにより、従来のGPUベースの推論よりも高速かつ効率的な選択肢を提供し、大規模生成AIアプリケーションの採用を加速させる可能性がある。
AWSは、Cerebrasの分散型推論ソリューションを提供する初のクラウドプロバイダーとなる。
このソリューションは、AWSのTrainiumサーバーとCerebrasのCS-3システムを組み合わせ、プリフィルおよびデコードステージを最適化する。
この提携は、現在のソリューションを桁違いに上回る推論速度の提供を目指す。
この提携は、現在のソリューションを桁違いに上回る推論速度の提供を目指す。
AWSは年内に、オープンソースLLMおよびAmazon NovaもCerebrasハードウェア上で提供する予定。
Sign in to save notes on signals.
ログイン