DeepSeek发布两款新模型,推理能力比肩GPT-5
目前,DeepSeek官方网页端、App和API均已更新为正式版DeepSeek-V3.2。Speciale版本目前仅以临时API服务形式开放,以供社区评测与研究。
2025-12-04 08:40:43
来源:中国电子报、电子信息产业网 陈存  

12月1日,DeepSeek正式发布两款新模型——DeepSeek-V3.2与DeepSeek-V3.2-Speciale,在多项智能体评测中均达到当前开源模型的最高水平,大幅缩小了开源模型与闭源模型的差距。

DeepSeek称,标准版DeepSeek-V3.2适合日常使用,例如问答和通用智能体任务场景。在公开的推理类基准测试中,其性能已达到GPT-5水平,仅略低于Gemini-3.0-Pro,同时输出长度显著缩短,降低了计算开销与用户等待时间。

值得注意的是,V3.2并没有针对这些测试集的工具进行特殊训练,这意味着V3.2在真实应用场景中能够展现出较强的泛化性。

不同于过往版本在思考模式下无法调用工具的局限,DeepSeek-V3.2还是首个将思考融入工具使用的模型,同时支持思考模式与非思考模式的工具调用。

长思考增强版DeepSeek-V3.2-Speciale进一步结合了DeepSeek-Math-V2的定理证明能力,具备指令跟随、数学证明与逻辑验证能力,在主流推理基准测试中的表现可媲美Gemini-3.0-Pro。

据悉,该模型还成功斩获IMO 2025(国际数学奥林匹克)、CMO 2025(中国数学奥林匹克)、ICPC World Finals 2025(国际大学生程序设计竞赛全球总决赛)及IOI 2025(国际信息学奥林匹克)金牌。其中,ICPC与IOI成绩分别达到了人类选手第二名与第十名的水平。

目前,DeepSeek官方网页端、App和API均已更新为正式版DeepSeek-V3.2。Speciale版本目前仅以临时API服务形式开放,以供社区评测与研究。

最新文章
1
2026年稳了!开售一个月,海信大力神空调强势入围畅销榜TOP20
2
星穹之下,自然入画:爱普生Lifestudio Flex黑金限定款上市,悦启家居美学新体验
3
索尼 TCL拟成立合资公司,承接索尼家庭娱乐业务,预计2027年4月运营
4
达沃斯高光时刻!海信电视斩获全球电视行业唯一“灯塔工厂”奖杯
5
高端电视竞逐赛,中国市场静待索尼True RGB的到来
6
 思路定了,“围绕核心增长”!2026年方洪波要带领美的这么干
7
车用固态电池国标将至,行业有了新标尺
8
又有国际并购案落地!厨电热水巨头加码全球化资源整合
9
小家电行业的“黄金时代”成为过去式,品质时代已来临
10
中国手机市场:2025华为力压苹果登顶,2026成本与AI成关键变量
11
杉川接盘iRobot,昔日鼻祖能否止血重生?
12
主摄光圈升级至 f/1.4,三星 Galaxy S26 Ultra 影像细节曝光
13
小米18 Pro首发!高通骁龙8 Elite Gen6 Pro成本突破300美元
14
让用户建议成为创新动力,Leader开启用户共创分享会
15
CES 2026,TCL 联合德国莱茵TÜV共同发布显示产品感知立体色域白皮书,推动色彩评价标准再升级
16
动力电池将迎来“数字身份证”,新能源车废旧动力电池回收利用新规来了
17
展望2026丨半导体产业十大看点
18
电视消费趋势观察:百寸大屏加速渗透,游戏电视引领场景
19
2026年空调行业的四大看点
20
2026年,中国家电零售市场的“内需答卷”如何写就?
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512