通信世界网消息(CWW)在人工智能技术高速演进的2025年,大模型领域的竞争已从单一的语言处理能力比拼,转向多模态融合、场景化落地与生态整合的全面较量。北京时间8日凌晨1点,OpenAI公司举办发布会,正式推出GPT-5模型。该公司首席执行官山姆・奥特曼表示,GPT-5的推出是迈向通用人工智能(AGI)的重要一步,与该模型交流如同与人类专家“对话”。
GPT-5系列包含GPT-5、GPT-5 mini及GPT-5 nano三款模型,上下文长度均达400K,最大输出为128K tokens。功能方面,GPT-5解释Bernoulli效果等任务时反应迅速,而创建视觉效果等复杂任务则需稍长时间。用户可在提示中要求模型“深入思考”或“更精确”,还能直观看到其思维过程。
技术架构维度,GPT-5采用1.8万亿参数的MoE架构,借助动态路由机制仅激活1/5参数参与推理,使单次查询能耗降低40%。这种设计在数学推理(GSM8K准确率98.7%)和复杂逻辑任务中表现突出,但需数千GPU集群支撑训练。在联网搜索时,GPT-5的回答出现事实错误的概率比GPT-4o低了45%。
在实用功能上,ChatGPT的记忆功能现支持Pro、Plus及Teams订阅用户连接谷歌账号访问日历,联动Gmail与Google Calendar,使模型能依据用户行程获取更多情境信息。此外,提醒用户回复未回邮件的功能将于下周先向Pro用户开放,随后扩展至Plus和Teams用户。
大模型测评网站Artificial Analysis数据显示,目前GPT-5已经超过Grok4排在第一,排在前列的国产大模型只有阿里的通义千问和DeepSeek。而在开源模型榜中,目前排名前十的有六个是国产大模型。相比之下,国内厂商聚焦行业痛点深耕专用模型:字节跳动豆包大模型采用稀疏MoE架构,将推理成本压降至GPT-4o的1/50,在电商场景中实现商品描述生成98%的准确率;华为盘古3.0的万亿级气象预测模型将台风路径误差控制在20公里内,较传统方法提升60%,但多模态生成能力仍弱于GPT-5。开源阵营中,DeepSeek-R1以6710亿参数实现接近GPT-4的推理性能,其开源策略推动企业私有化部署量增长 。
阿里云Qwen2.5-VL通过动态分辨率采样技术直接处理原生尺寸视频,在工业质检场景中实现99.2%的缺陷检测准确率,显存占用显著降低。腾讯混元大模型采用分层架构,支持从3B到750B参数的弹性扩展,使社交娱乐创作效率提升200%,但通用推理能力仍不及GPT-5。硬件协同方面,华为昇腾384超节点通过总线技术实现384个NPU互联,突破集群通信瓶颈,将万亿参数模型训练效率提升3倍,部署成本降至GPT-4的20%。
在发布会上,OpenAI首席执行官萨姆·奥尔特曼称,GPT-5是“世界上最好的模型”,代表着OpenAI在开发通用人工智能 (AGI) 道路上迈出了“重要一步”,但GPT-5在“持久记忆、自主性和跨任务适应性等领域仍然存在关键限制”。这场AI大模型的“进化赛”,远比想象中漫长。
- QQ:61149512