Cerebras SystemsはAWSと提携し、Amazon Bedrock上でのAI推論を高速化する。本提携では、ディスアグリゲーテッド・アーキテクチャを活用し、高速なパフォーマンスを実現する。これにより、大規模生成AIアプリケーションの開発・展開のハードルが大幅に下がり、様々な産業におけるイノベーションを促進することが期待される。
CerebrasとAWSの今回の提携は、大規模生成AIアプリケーションの開発・展開における参入障壁を大幅に引き下げる可能性を秘めている。高スループット・低レイテンシの推論ソリューションを提供することで、創薬から金融モデリングまで、様々な産業におけるイノベーションを加速させることが期待できる。
CerebrasとAWSは、高速AI推論ソリューションで提携
本ソリューションは、AWS TrainiumによるプリフィルとCerebras CS-3によるデコードを組み合わせたディスアグリゲーテッド・アーキテクチャを採用
本サービスは今後数ヶ月以内にAmazon Bedrock限定で提供開始予定
本サービスは今後数ヶ月以内にAmazon Bedrock限定で提供開始予定
本提携は、現在のクラウドサービスと比較して1桁以上高速な推論性能を提供することを目指す
Sign in to save notes on signals.
ログイン