DeepSeek发布两款新模型,推理能力比肩GPT-5
目前,DeepSeek官方网页端、App和API均已更新为正式版DeepSeek-V3.2。Speciale版本目前仅以临时API服务形式开放,以供社区评测与研究。
2小时前
来源:中国电子报、电子信息产业网 陈存  

12月1日,DeepSeek正式发布两款新模型——DeepSeek-V3.2与DeepSeek-V3.2-Speciale,在多项智能体评测中均达到当前开源模型的最高水平,大幅缩小了开源模型与闭源模型的差距。

DeepSeek称,标准版DeepSeek-V3.2适合日常使用,例如问答和通用智能体任务场景。在公开的推理类基准测试中,其性能已达到GPT-5水平,仅略低于Gemini-3.0-Pro,同时输出长度显著缩短,降低了计算开销与用户等待时间。

值得注意的是,V3.2并没有针对这些测试集的工具进行特殊训练,这意味着V3.2在真实应用场景中能够展现出较强的泛化性。

不同于过往版本在思考模式下无法调用工具的局限,DeepSeek-V3.2还是首个将思考融入工具使用的模型,同时支持思考模式与非思考模式的工具调用。

长思考增强版DeepSeek-V3.2-Speciale进一步结合了DeepSeek-Math-V2的定理证明能力,具备指令跟随、数学证明与逻辑验证能力,在主流推理基准测试中的表现可媲美Gemini-3.0-Pro。

据悉,该模型还成功斩获IMO 2025(国际数学奥林匹克)、CMO 2025(中国数学奥林匹克)、ICPC World Finals 2025(国际大学生程序设计竞赛全球总决赛)及IOI 2025(国际信息学奥林匹克)金牌。其中,ICPC与IOI成绩分别达到了人类选手第二名与第十名的水平。

目前,DeepSeek官方网页端、App和API均已更新为正式版DeepSeek-V3.2。Speciale版本目前仅以临时API服务形式开放,以供社区评测与研究。

最新文章
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512