碾压GPT4!DeepSeek V3.1 用1/10 成本实现128K超长文
8月21日,DeepSeek在其官方公众号上正式宣布DeepSeek-V3.1发布。这一消息瞬间在AI领域掀起波澜,究竟这次升级带来了哪些变化?让我们一探究竟!
4小时前
来源:通信世界网 梅雅鑫  

通信世界网消息(CWW)8月21日,DeepSeek在其官方公众号上正式宣布DeepSeek-V3.1发布。这一消息瞬间在AI领域掀起波澜,究竟这次升级带来了哪些变化?让我们一探究竟!

官方表示,本次升级包含以下主要变化:

混合推理架构:一个模型同时支持思考模式与非思考模式;

更高的思考效率:相比 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短时间内给出答案;

更强的 Agent 能力:通过 Post-Training 优化,新模型在工具使用与智能体任务中的表现有较大提升。

三大升级:更快、更高、更强

当前,AI要么答得快没深度、要么分析细等半天。DeepSeek-V3.1 创新性地引入混合推理架构,实现了一个模型同时支持思考模式与非思考模式的重大突破。这意味着什么呢?

简单来说,用户在使用过程中,能够根据实际需求,通过 “深度思考” 按钮,自由穿梭于两种模式之间。当你需要快速获取信息时,非思考模式可以迅速给出结果;而遇到复杂问题需要深入分析时,思考模式便能大显身手,为你抽丝剥茧,提供更具深度和逻辑性的答案。

而且,与 DeepSeek-R1-0528 相比,DeepSeek-V3.1-Think 在思考效率上实现了质的飞跃。面对同样复杂的问题,它能够在更短的时间内给出答案。想象一下,以往可能需要等待数秒甚至数十秒才能得到的分析结果,现在转瞬之间便呈现在眼前,大大提升了用户的使用体验和工作效率。无论是学术研究中的资料分析,还是商业决策中的数据解读,DeepSeek-V3.1-Think 都能成为你的得力助手,让思维的速度跟上你前进的步伐。

测试结果显示,经过思维链压缩训练后,V3.1-Think 在输出 token 数减少 20%-50% 的情况下,各项任务的平均表现与 R1-0528 持平。

在各项评测指标得分基本持平的情况下(AIME 2025: 87.5/88.4, GPQA: 81/80.1, liveCodeBench: 73.3/74.8),R1-0528 与 V3.1-Think 的 token 消耗量对比图

AI做复杂任务不靠谱?通过 Post-Training 优化,DeepSeek-V3.1 在工具使用与智能体任务中的表现有了显著提升。新模型在面对各种复杂的智能体任务时,能够更加灵活、高效地运用工具,完成任务的质量和准确性都有了大幅提高。

在智能办公场景中,它可以更好地协同各类办公软件,自动完成文档整理、数据分析等繁琐任务;在智能客服领域,能够更精准地理解用户需求,提供更贴心、高效的服务。

官方平台+API同步焕新,价格有变化!

随着DeepSeek-V3.1的发布,官方App与网页端模型已同步完成升级。用户无需复杂操作,即可在熟悉的平台上体验全新版本带来的强大功能。

同时,DeepSeek API也迎来了全面升级。其中,deepseek-chat对应非思考模式,deepseek-reasoner对应思考模式,且上下文均已扩展至128K,这使得模型在处理长文本和复杂对话时更加得心应手。

DeepSeek-V3.1的发布,无疑为AI领域注入了新的活力。其在模型性能、功能模式以及API服务等多方面的升级,为用户和开发者带来了更多的便利和可能性。

最后划重点!DeepSeek官宣:北京时间2025年9月6日凌晨起,API调用价格要调整!不仅要执行新版价格表,夜间时段优惠也没了!但好消息是,9月6日前还按原价算,想省成本的开发者、企业,这段时间赶紧冲,错过可就没这低价了,记得提前规划好用量!

即将到来的API价格调整,将促使行业各方重新审视成本与效益的关系。在这个快速发展的AI时代,DeepSeek能否凭借此次升级在激烈的市场竞争中脱颖而出?让我们拭目以待!

最新文章
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512