DeepSeek发布了其V3.2模型,该模型通过其稀疏注意力(Sparse Attention)技术在智能体推理能力和高效长上下文处理方面取得了进展。这些开源模型通过提供相当或更优越的推理能力,挑战了专有AI产品,有望促进先进AI技术的普及,并加速复杂AI智能体的开发。
DeepSeek V3.2模型的发布,特别是高性能的V3.2-Speciale,对OpenAI和Google等公司的专有模型构成了挑战。通过提供推理能力相当或更优越的开源模型,DeepSeek正在促进先进AI技术的普及。这可能加速各行业更复杂、更强大AI智能体的开发。
DeepSeek稀疏注意力(DSA)技术,实现高效长上下文处理
可扩展强化学习框架,提升模型性能
大规模智能体任务合成流水线,增强指令遵循能力
可扩展强化学习框架,提升模型性能
大规模智能体任务合成流水线,增强指令遵循能力
登录后可保存信号笔记。
登录