DeepSeek发布两款新模型,推理能力比肩GPT-5
目前,DeepSeek官方网页端、App和API均已更新为正式版DeepSeek-V3.2。Speciale版本目前仅以临时API服务形式开放,以供社区评测与研究。
2025-12-04 08:40:43
来源:中国电子报、电子信息产业网 陈存  

12月1日,DeepSeek正式发布两款新模型——DeepSeek-V3.2与DeepSeek-V3.2-Speciale,在多项智能体评测中均达到当前开源模型的最高水平,大幅缩小了开源模型与闭源模型的差距。

DeepSeek称,标准版DeepSeek-V3.2适合日常使用,例如问答和通用智能体任务场景。在公开的推理类基准测试中,其性能已达到GPT-5水平,仅略低于Gemini-3.0-Pro,同时输出长度显著缩短,降低了计算开销与用户等待时间。

值得注意的是,V3.2并没有针对这些测试集的工具进行特殊训练,这意味着V3.2在真实应用场景中能够展现出较强的泛化性。

不同于过往版本在思考模式下无法调用工具的局限,DeepSeek-V3.2还是首个将思考融入工具使用的模型,同时支持思考模式与非思考模式的工具调用。

长思考增强版DeepSeek-V3.2-Speciale进一步结合了DeepSeek-Math-V2的定理证明能力,具备指令跟随、数学证明与逻辑验证能力,在主流推理基准测试中的表现可媲美Gemini-3.0-Pro。

据悉,该模型还成功斩获IMO 2025(国际数学奥林匹克)、CMO 2025(中国数学奥林匹克)、ICPC World Finals 2025(国际大学生程序设计竞赛全球总决赛)及IOI 2025(国际信息学奥林匹克)金牌。其中,ICPC与IOI成绩分别达到了人类选手第二名与第十名的水平。

目前,DeepSeek官方网页端、App和API均已更新为正式版DeepSeek-V3.2。Speciale版本目前仅以临时API服务形式开放,以供社区评测与研究。

最新文章
1
华为全场景亮相AWE 2026:华为鸿蒙智家 智慧全生态重塑未来家
2
松下参展AWE发布中国事业战略,迈向“在中国,为全球”
3
索尼真彩RGB电视AWE 2026全球画质首秀 廿载技术深耕铸就画质新标杆
4
索尼亮相AWE 2026:以真彩RGB技术开启画质新纪元,构建索尼真彩娱乐世界
5
鸿蒙世界,日新月异:华为鸿蒙智家“1+3+N”解决方案焕新,即将亮相AWE
6
AWE2026开幕:聚焦AI科技,呈现产业升级新成果
7
AWE2026:行业首款“光色场同控”RGB MiniLED诞生
8
实至名归!海信全家筒·棉花糖U7S斩获2026 AWE艾普兰创新奖,彰显中国家电智造实力
9
斩获艾普兰创新奖!海信全家筒·棉花糖U7S亮相AWE2026,以中国智造重构全场景洗护
10
代表通道点赞的显示“科技尖货”,在AWE2026 海信现场见证
11
将场景思维写入AI创新基因,长虹AI家电春季新品齐登AWE舞台
12
追觅AURORA手机全球首秀 重磅布局冲击全球高端市场
13
五大技术首发!追觅智显INNIX高端影音新品齐聚AWE2026
14
AWE2026:新一代AI智能空调!海信2026世界杯定制空调全阵容亮相!
15
领跑彩色光源时代!海信携三大硬核技术亮相AWE2026
16
能用眼镜做饭?老板电器发布全球首款AI烹饪眼镜
17
乐享科技旗下具身智能品牌ZEROTH元点智能AWE首秀:全栈技术积累带来产品涌现
18
海尔智家:不止“让家庭更智能”,还要“让生活更智慧”
19
BOE(京东方)携手创维发布A10H系列 定义超旗舰电视新标杆
20
AWE2026开幕即引爆!海信全家筒新品棉花糖U7S惊艳亮相,引现场围观
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512