近日,深度求索公司正式发布了全新版本的DeepSeek-V3.1模型。该模型已同步上线官方网站及移动应用,并向所有C端用户免费开放。
据称,DeepSeek-V3.1具备128K的超长上下文处理能力,并能够在同一模型内支持思维模式和非思维模式的混合推理架构。
新版模型较前代产品R1的回答速度明显提升,使其能在更短时间内提供解决方案。
通过后期训练优化,新版模型在工具使用和智能体任务中表现出色,智能体(Agent)功能显著增强。
在包括代码修复评估SWE、命令行终端复杂任务测试(Terminal-Bench)、多步推理的复杂搜索(browsecomp)以及跨学科专家难题测试(HLE)等多项测试中,DeepSeek-V3.1展现出了远超于DeepSeek-R1-0528的卓越表现。
V3.1的思考效率也有了显著提升,经过思维链压缩训练后,虽然输出token数量减少20%-50%,但其整体性能仍与R1-0528持平。
对于DeepSeek R2发布推迟的原因,主要由于在使用国产昇腾芯片进行深度训练时遇到了技术挑战。公司对于模型质量的严格要求也对发布进度有影响。此前关于8月发布的传闻如今已被否认,具体发布时间需等待官方进一步消息。






























