碾压GPT4！DeepSeek V3.1 用1/10 成本实现128K超长文--丁科技网

首页家居家电手机数码 IT互联网电商零售汽车出行游戏娱乐半导体新基建酷品评测

4小时前

来源：通信世界网梅雅鑫

通信世界网消息（CWW）8月21日，DeepSeek在其官方公众号上正式宣布DeepSeek-V3.1发布。这一消息瞬间在AI领域掀起波澜，究竟这次升级带来了哪些变化？让我们一探究竟！

官方表示，本次升级包含以下主要变化：

混合推理架构：一个模型同时支持思考模式与非思考模式；

更高的思考效率：相比 DeepSeek-R1-0528，DeepSeek-V3.1-Think 能在更短时间内给出答案；

更强的 Agent 能力：通过 Post-Training 优化，新模型在工具使用与智能体任务中的表现有较大提升。

三大升级：更快、更高、更强

当前，AI要么答得快没深度、要么分析细等半天。DeepSeek-V3.1 创新性地引入混合推理架构，实现了一个模型同时支持思考模式与非思考模式的重大突破。这意味着什么呢？

简单来说，用户在使用过程中，能够根据实际需求，通过 “深度思考” 按钮，自由穿梭于两种模式之间。当你需要快速获取信息时，非思考模式可以迅速给出结果；而遇到复杂问题需要深入分析时，思考模式便能大显身手，为你抽丝剥茧，提供更具深度和逻辑性的答案。

而且，与 DeepSeek-R1-0528 相比，DeepSeek-V3.1-Think 在思考效率上实现了质的飞跃。面对同样复杂的问题，它能够在更短的时间内给出答案。想象一下，以往可能需要等待数秒甚至数十秒才能得到的分析结果，现在转瞬之间便呈现在眼前，大大提升了用户的使用体验和工作效率。无论是学术研究中的资料分析，还是商业决策中的数据解读，DeepSeek-V3.1-Think 都能成为你的得力助手，让思维的速度跟上你前进的步伐。

测试结果显示，经过思维链压缩训练后，V3.1-Think 在输出 token 数减少 20%-50% 的情况下，各项任务的平均表现与 R1-0528 持平。

在各项评测指标得分基本持平的情况下（AIME 2025: 87.5/88.4， GPQA: 81/80.1， liveCodeBench: 73.3/74.8），R1-0528 与 V3.1-Think 的 token 消耗量对比图

AI做复杂任务不靠谱？通过 Post-Training 优化，DeepSeek-V3.1 在工具使用与智能体任务中的表现有了显著提升。新模型在面对各种复杂的智能体任务时，能够更加灵活、高效地运用工具，完成任务的质量和准确性都有了大幅提高。

在智能办公场景中，它可以更好地协同各类办公软件，自动完成文档整理、数据分析等繁琐任务；在智能客服领域，能够更精准地理解用户需求，提供更贴心、高效的服务。

官方平台+API同步焕新，价格有变化！

随着DeepSeek-V3.1的发布，官方App与网页端模型已同步完成升级。用户无需复杂操作，即可在熟悉的平台上体验全新版本带来的强大功能。

同时，DeepSeek API也迎来了全面升级。其中，deepseek-chat对应非思考模式，deepseek-reasoner对应思考模式，且上下文均已扩展至128K，这使得模型在处理长文本和复杂对话时更加得心应手。

DeepSeek-V3.1的发布，无疑为AI领域注入了新的活力。其在模型性能、功能模式以及API服务等多方面的升级，为用户和开发者带来了更多的便利和可能性。

最后划重点！DeepSeek官宣：北京时间2025年9月6日凌晨起，API调用价格要调整！不仅要执行新版价格表，夜间时段优惠也没了！但好消息是，9月6日前还按原价算，想省成本的开发者、企业，这段时间赶紧冲，错过可就没这低价了，记得提前规划好用量！

即将到来的API价格调整，将促使行业各方重新审视成本与效益的关系。在这个快速发展的AI时代，DeepSeek能否凭借此次升级在激烈的市场竞争中脱颖而出？让我们拭目以待！

原创文章

鸿蒙智选MEIPONT智能空调“风神之眼”破界登场，人感智能风暴来袭