Zhipu AI가 복잡한 엔지니어링 과제를 위해 설계된 744B 파라미터 모델인 GLM-5를 출시했습니다. 이 모델은 배포 비용 절감을 위한 DeepSeek Sparse Attention을 특징으로 합니다. API를 통해 이용 가능한 이 오픈소스 모델은 선도적인 AI 모델들과 경쟁하려는 전략적 움직임을 시사하며, 산업 분야에서의 채택을 가속화할 수 있습니다.
Zhipu AI의 GLM-5 출시는 막대한 파라미터 수와 에이전트 작업을 위한 특화된 아키텍처를 통해 선도적인 오픈소스 모델들과 경쟁하려는 전략적 움직임을 보여줍니다. 비용 관리를 위한 DeepSeek Sparse Attention 통합은 강력한 AI 배포의 진입 장벽을 낮출 수 있으며, 해당 분야 전반의 복잡한 산업 및 엔지니어링 애플리케이션 채택을 가속화할 잠재력이 있습니다.
Zhipu AI, 복잡한 엔지니어링용 744B 파라미터 모델 GLM-5 출시.
모델은 배포 비용 절감을 위한 DeepSeek Sparse Attention 기능 탑재.
GLM-5는 오픈소스로 API 통해 이용 가능하며, 고급 추론 및 에이전트 작업 목표.
GLM-5는 오픈소스로 API 통해 이용 가능하며, 고급 추론 및 에이전트 작업 목표.
사전 훈련 데이터셋은 28.5조 토큰으로 확장됨.
Sign in to save notes on signals.
로그인