DeepSeek 發布了其V3.2模型,該模型透過其稀疏注意力(Sparse Attention)技術在智慧體推理能力和高效長上下文處理方面取得了進展。這些開源模型透過提供相當或更優越的推理能力,挑戰了專有AI產品,有望促進先進AI技術的普及,並加速複雜AI智慧體的開發。
DeepSeek V3.2模型的發布,特別是高性能的V3.2-Speciale,對OpenAI和Google等公司的專有模型構成了挑戰。透過提供推理能力相當或更優越的開源模型,DeepSeek正在促進先進AI技術的普及。這可能加速各行業更複雜、更強大AI智慧體的開發。
DeepSeek稀疏注意力(DSA)技術,實現高效長上下文處理
可擴展強化學習框架,提升模型性能
大規模智慧體任務合成流水線,增強指令遵循能力
可擴展強化學習框架,提升模型性能
大規模智慧體任務合成流水線,增強指令遵循能力
Sign in to save notes on signals.
登录