Cerebras Systems가 AWS와 협력하여 Amazon Bedrock에서의 AI 추론 속도를 높입니다. 분산 아키텍처를 활용하여 성능을 향상시키며, 대규모 생성형 AI 애플리케이션 개발 및 배포의 진입 장벽을 크게 낮추고 산업 전반의 혁신을 촉진할 것으로 기대됩니다.
Cerebras와 AWS의 이번 협력은 대규모 생성형 AI 애플리케이션 개발 및 배포의 진입 장벽을 크게 낮출 잠재력을 가지고 있습니다. 고처리량, 저지연 추론 솔루션을 제공함으로써 신약 개발부터 금융 모델링에 이르기까지 다양한 산업 분야의 혁신을 가속화할 수 있습니다.
Cerebras와 AWS가 고속 AI 추론 솔루션 개발을 위해 협력합니다.
해당 솔루션은 AWS Trainium을 이용한 prefill과 Cerebras CS-3를 이용한 decode를 포함하는 분산 아키텍처를 사용합니다.
이 서비스는 향후 몇 달 안에 Amazon Bedrock에서 독점적으로 제공될 예정입니다.
이 서비스는 향후 몇 달 안에 Amazon Bedrock에서 독점적으로 제공될 예정입니다.
이번 파트너십은 현재 클라우드 서비스 대비 추론 속도를 10배 이상 향상시키는 것을 목표로 합니다.
Sign in to save notes on signals.
로그인