低精度计算能否实现智算中心“轻装上阵”?
低精度计算应用于智算中心说到底还是为了突破算力瓶颈,解决算力应用难题,其虽然并非最优解,但已经成为一块“关键拼图”。
2025-04-24 10:38:27
来源:通信世界网 包建羽  

通信世界网消息(CWW)今年初,低成本、高性能的DeepSeek掀起了大模型狂潮,其在预训练中采用FP8(8位浮点数)与FP32(32位浮点数)混合精度技术也成为一项重大技术创新,前者可以大幅减少算力消耗,提高计算速度;后者则针对数据精度关键环节保证了模型的准确性。两者相结合,在不影响模型性能的前提下,实现了算力资源的高效利用。

类似的思路也被用于智算中心建设,不再像去年卷“万卡集群”那样,智算中心从建到用更为注重性价比,低精度计算应势而起,正推动智算中心从“大力出奇迹”转向“四两拨千斤”的进化路径。

所谓低精度计算是指采用FP8、FP6(6位浮点数)甚至FP4(4位浮点数)等低比特数值格式进行运算的技术体系。相较于传统FP32计算,其数据存储空间更小、计算能耗更低,不仅能够破解大模型训练和推理的算力难题,也有助于化解智算中心的能效比困境。

就行业发展来看,智算需求的爆发直接促使低精度计算的崛起。近年来,大模型和生成式人工智能推高算力需求,全球智能算力需求呈指数级增长。《2025年中国人工智能计算力发展评估报告》指出,未来两年,中国智能算力规模将保持高速增长。2023年至2028年期间,中国智能算力规模的五年年复合增长率预计达46.2%。然而,传统通用算力中心难以满足AI模型训练的高密度、低时延需求,智算中心作为专用基础设施的重要性得以凸显。

在低精度计算的作用下,智算中心架构层的芯片技术变革最为明显。在GTC 2025年大会上,英伟达发布的Blackwell Ultra/Rubin系列芯片展现了算力精度下移的趋势。例如Blackwell Ultra在FP4精度下的算力达到15PetaFlops,在特定推理场景中效率提升40倍。作为同类竞品的AMD MI350X芯片则创新性引入动态精度切换技术。通过支持FP4和FP6,推理性能较前代提升35倍,FP8算力突破4.6 PetaFlops。不仅如此,当前Meta、微软、AWS等巨头早已将低精度GPU列为采购核心指标。

低精度计算应用于智算中心说到底还是为了突破算力瓶颈,解决算力应用难题,其虽然并非最优解,但已经成为一块“关键拼图”。面向智算中心的未来发展,业界探索出了两条关键路径。

一是异构计算架构,不同于传统方案强调双精度浮动运算性能的超级计算,异构智算更多使用半精度浮动运算、整数运算,甚至更低精度的浮点运算,动态适配不同精度需求。在传统算力的局限与旺盛的市场需求共同作用下,通用算力、智算算力、超算算力、边缘算力等不同类型算力中心的融合发展将成为大势所趋。

二是“超智融合”,作为异构智算的一种表现形式,“超智融合”即整合超算的高性能并行计算能力与智算的低功耗优化优势,通过软硬件协同提升算力效率。业内专家认为,随着AI应用场景越来越复杂,通过单一芯片平台提供全精度和混合精度计算,已成为“超智融合”背景下的算力基础设施发展趋势。

技术路径找准之余,要想让智算中心“轻装上阵”,生态建设又是另一核心命题。与低精度计算相适配,国内仍需构建自主可控的开源框架,解决编程接口不统一、算子库适配难等问题。因此,智算中心的未来不是一道高精度或低精度的选择题,而是一道如何“恰到好处”协调适配各个环节的思考题。

可以预见,智算中心走向应用的“下半场”,一定不再是 单纯追求数值的堆砌,而是如何在有限资源里找到最优解。 面向未来,笔者认为智算中心有三大趋势值得关注。一是全精度覆盖,兼顾低精度推理与高精度训练,满足差异化需求;二是超智算一体化,通过全国一体化算力网实现跨区域资源共享;三是AI原生设计,将AI技术深度融入基础设施建设与管理,实现自动化运维与动态优化。

最新文章
1
“用镜头交换生活,用AI看见世界”,快手公益基金会“影像共创体验课”助力乡村学子勇敢逐梦
2
可灵AI出海 “三重奏”:外媒密集报道背后,中国AI正改写全球影视创作版图
3
自播达播联动、差异化货盘加持,紫金黄金在快手撬动生意新增量
4
快手跨境进博会“开播” 多位达人现场引进全球好物
5
快手科技高级副总裁马宏彬:全面拓展AI应用,助力千行百业数智化升级
6
快手联合创始人杨远熙:以创新驱动,驶向AI浪潮的星辰大海
7
《2025天猫耳机品类年度白皮书》重磅发布
8
低空+发展研究报告(2025年)
9
阳光、年轻、积极三重buff!吴磊代言创维剃须刀,科技美学+年轻力激活品牌年轻力
10
创维剃须刀官宣全球品牌代言人吴磊,高颜值实力派共赴科技美学新境
11
SUSE Linux Enterprise Server (SLES) 16全新发布:AI赋能,智领企业管理
12
亮相“国家橱窗”,影目INMO成唯一入驻中国馆的AI眼镜企业
13
OPPO Reno15真机首次亮相:iPhone同款冷雕工艺、2亿像素主摄
14
苹果新一代Siri将于明年春季登场:融入谷歌Gemini大模型,智能水平全面跃升
15
vivo S50系列入网:搭载骁龙8 Gen5与潜望长焦,标配90W快充
16
苹果 iPhone 18 Air 新增48Mp超广角镜头
17
在线视频火热,2030年全球电视与视频市场预计突破1万亿美元
18
铜价飙升、巨头降价空调小品牌还能活几年?
19
康佳R10易AI电视:三体遥控终结多设备混战,观影终于从容了
20
线上量减价跌、线下稳健升级,高端化与性价比重塑冰箱格局?
关于我们

微信扫一扫,加关注

商务合作
  • QQ:61149512