DeepSeek发布两款新模型，推理能力比肩GPT-5--丁科技网

首页家居家电手机数码 IT互联网电商零售汽车出行游戏娱乐半导体新基建酷品评测

2025-12-04 08:40:43

来源：中国电子报、电子信息产业网陈存

12月1日，DeepSeek正式发布两款新模型——DeepSeek-V3.2与DeepSeek-V3.2-Speciale，在多项智能体评测中均达到当前开源模型的最高水平，大幅缩小了开源模型与闭源模型的差距。

DeepSeek称，标准版DeepSeek-V3.2适合日常使用，例如问答和通用智能体任务场景。在公开的推理类基准测试中，其性能已达到GPT-5水平，仅略低于Gemini-3.0-Pro，同时输出长度显著缩短，降低了计算开销与用户等待时间。

值得注意的是，V3.2并没有针对这些测试集的工具进行特殊训练，这意味着V3.2在真实应用场景中能够展现出较强的泛化性。

不同于过往版本在思考模式下无法调用工具的局限，DeepSeek-V3.2还是首个将思考融入工具使用的模型，同时支持思考模式与非思考模式的工具调用。

长思考增强版DeepSeek-V3.2-Speciale进一步结合了DeepSeek-Math-V2的定理证明能力，具备指令跟随、数学证明与逻辑验证能力，在主流推理基准测试中的表现可媲美Gemini-3.0-Pro。

据悉，该模型还成功斩获IMO 2025（国际数学奥林匹克）、CMO 2025（中国数学奥林匹克）、ICPC World Finals 2025（国际大学生程序设计竞赛全球总决赛）及IOI 2025（国际信息学奥林匹克）金牌。其中，ICPC与IOI成绩分别达到了人类选手第二名与第十名的水平。

目前，DeepSeek官方网页端、App和API均已更新为正式版DeepSeek-V3.2。Speciale版本目前仅以临时API服务形式开放，以供社区评测与研究。

原创文章

1

惠科40亿干芯片封测、月产能2000万颗，面板巨头热衷第二曲线？

2

6月彩电新零售：海信TCL创维长虹合计份额超90%，85寸爆品最多

3

6月冰箱新零售：海尔美的容声美菱总份额超95%，十字4门最火

4

6月空调新零售：TOP3份额近90%，前十机型被美的海尔“包圆”

5

上半年电竞显示器卖不动？TOP4合计份额下降，OLED开启暴走模式

6

西班牙夺冠，谁是本届世界杯营销的最大赢家？

7

巨头冷年不开盘，渠道压货模式失灵，空调业开启DTC转型浪潮？

8

再变阵！控股空调公司，拥有强势电视业务的TCL电子有多强？

最新文章

1

百年蒸烤，创新未止——西门子家电以德系精工开启智能厨房新篇章

2

奕斯伟计算：从算力底座到生态共建，擘画“RISC-V+AI”新版图

3

深耕34年遗憾退场！LG中国首家工厂被曝10月停产

4

射频美容仪“持证上岗”背后：巨额成本与三年周期，谁被拒之门外？

5

重金押注！OpenAI计划与AMD合作开发MI500系列AI芯片

6

中国扫地机器人销量榜：科沃斯、石头、追觅包揽前三

7

惠科40亿干芯片封测、月产能2000万颗，面板巨头热衷第二曲线？

8

创维AI闺蜜机F3系列惊艳亮相，全场景强适配贴心陪伴全家

9

真金工艺、硬核净剃！新一代创维金砖剃须刀惊艳发布

10

聚焦睡眠舒适体验创维空调以全龄 AI 科技赋能高品质居家生活

11

工商业电费成本管控新选择：创维光伏"E企省"模式的解题思路

12

K影一体、语音点唱！创维K影机重磅登场

13

双引擎驱动，全场景共生！创维2026全场景新品发布会圆满举行

14

从单屏到全域，创维壁纸电视重新定义家庭大屏生态

15

科技向善，长期同行——西门子家电以持续公益行动创造社会价值

16

682亿曝光、 4660万人共创，快手以「老铁上场」打造全民体育主场

17

奕斯伟计算推出RISC-V AI NAS主控方案助力极空间打造全球首款消费级RISC-V AI NAS新品

18

iPhone Air 2确认继续研发，预计2027年春季发布

19

2026半年报 | 厨卫市场的深调、重构与韧性生长

20

2026年上半年空调零售量、零售额均跌，出口同比也下滑

家庭互联网标签库

关于我们

微信扫一扫，加关注

商务合作

QQ:61149512