DeepSeek发布两款新模型,推理能力比肩GPT-5
目前,DeepSeek官方网页端、App和API均已更新为正式版DeepSeek-V3.2。Speciale版本目前仅以临时API服务形式开放,以供社区评测与研究。
2025-12-04 08:40:43
来源:中国电子报、电子信息产业网 陈存  

12月1日,DeepSeek正式发布两款新模型——DeepSeek-V3.2与DeepSeek-V3.2-Speciale,在多项智能体评测中均达到当前开源模型的最高水平,大幅缩小了开源模型与闭源模型的差距。

DeepSeek称,标准版DeepSeek-V3.2适合日常使用,例如问答和通用智能体任务场景。在公开的推理类基准测试中,其性能已达到GPT-5水平,仅略低于Gemini-3.0-Pro,同时输出长度显著缩短,降低了计算开销与用户等待时间。

值得注意的是,V3.2并没有针对这些测试集的工具进行特殊训练,这意味着V3.2在真实应用场景中能够展现出较强的泛化性。

不同于过往版本在思考模式下无法调用工具的局限,DeepSeek-V3.2还是首个将思考融入工具使用的模型,同时支持思考模式与非思考模式的工具调用。

长思考增强版DeepSeek-V3.2-Speciale进一步结合了DeepSeek-Math-V2的定理证明能力,具备指令跟随、数学证明与逻辑验证能力,在主流推理基准测试中的表现可媲美Gemini-3.0-Pro。

据悉,该模型还成功斩获IMO 2025(国际数学奥林匹克)、CMO 2025(中国数学奥林匹克)、ICPC World Finals 2025(国际大学生程序设计竞赛全球总决赛)及IOI 2025(国际信息学奥林匹克)金牌。其中,ICPC与IOI成绩分别达到了人类选手第二名与第十名的水平。

目前,DeepSeek官方网页端、App和API均已更新为正式版DeepSeek-V3.2。Speciale版本目前仅以临时API服务形式开放,以供社区评测与研究。

最新文章
1
中国代工企业或无缘美国最大规模退税,海尔为何受益?
2
快手电商举办618商家大会 千亿流量扶持优质供给
3
全球南方成为出海热土,AI视频生成技术正为全球视听产业注入新动能
4
"赢战2026"快手电商超级双选会启动,超千位商家达人齐聚杭州
5
快手15位主播获得中国演出行业协会优质主播称号
6
宝石Gem、李斯丹妮尝试簪花造型,快手联合美团将春日会员营销玩出“花”
7
2026 北京车展 | 奕斯伟计算携车载芯片方案亮相 自研RISC-V内核构筑车规级安全底座
8
对话陈靖可:有了海信冰箱这台“制冰神机”,深夜看世界杯终于有了最佳“搭子”
9
进化·跨界·出海——2026中国Ai机器人产业领袖峰会暨第六届清洁电器产业升级与评测峰会圆满落幕
10
政策东风与情绪需求共振,热水器行业如何借势破局?
11
超级直播神器登场!华为随行WiFi X户外直播从此告别卡顿
12
直指电竞旗舰定位,一加 Ace 6 至尊版官宣搭载165Hz高刷屏
13
智能体:重塑ICT产业生态
14
2026年第一季度面板出货同比下降2.7%,超大尺寸增长明显
15
日立本土白电业务将易主 日本家电巨头集体“转向”
16
中国显示器线上销量排名出炉:AOC夺冠 HKC、小米进前三
17
OpenAI正式发布GPT-5.5:运算速度更快 Token成本大降
18
空调铝强化研究工作组发“说明”,释出三个信号
19
CCBN2026观察:GPMI电视已近百万,中国“超级接口”加速扩张
20
5月空调内销再降8.6%,冰封之下如何破局?
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512