半导体商圈,像是一个巨大的赌局。一次选择的失误,就可能意味着失去“上桌”的权利。而一次成功的抉择,却没有很长的保质期。带领AMD从至暗时刻走出的苏姿丰,怕是深谙这句话背后的道理。经历了三起三落的苏姿丰,在AI时代,再次选择了“all in”。
一年投资十几家AI公司
美国加利福尼亚时间7月10日,AMD官网发布了这样一条消息:以全现金交易收购欧洲最大的私人人工智能实验室 Silo AI,价值约为 6.65 亿美元。
这条消息经由AMD董事长兼CEO苏姿丰个人社交媒体X转发,引起了业界的广泛关注。一众媒体开始挖掘这家公司的创始人以及被冠以“豪华”名号的团队。然而,很少有人注意到,在AMD发布的这则声明中还有这样一句话:在过去的 12 个月里,AMD 向十几家 AI 公司投资了超过 1.25 亿美元,还收购了 Mipsology 和 Nod.ai,以扩展 AMD AI 生态系统、支持合作伙伴并提升 AMD 计算平台的领导地位。
苏姿丰在社交平台X转发了AMD收购Solo AI的消息
关于收购AI团队对AMD自身业务的影响,Counterpoint研究副总监Mohit Agrawal在接受《中国电子报》记者采访时给出了这样的回复:
通过收购Silo AI,AMD得以增强软件功能。借助 Silo AI 的 SiloOS 和 MLOps(机器学习运维) 功能,AMD 现在可以为客户提供更全面的端到端 AI 解决方案,包括允许定制 AI 解决方案的高级工具和模块化软件组件,以及用于大规模部署、优化和操作 AI 模型的功能。收购Silo AI也使AMD服务层能力也得以增长。
此外,Mohit Agrawal还回应称:Nod.ai 增强了 AMD 的 AI 软件生态系统,为开发人员提供了必要的工具、库和模型。Mipsology 为 AMD 硬件带来了量身定制的复杂 AI 推理和优化解决方案,支持公司的统一 AI 堆栈,用于跨边缘和云环境的训练和推理。
简单总结一下,收购一众AI团队,使AMD服务AI客户的软件能力增强了,这将极大地提升提升其AI解决方案供应能力。
当前,在AI芯片的竞争格局中,软件对于硬件性能的发挥尤其重要。在接受《中国电子报》记者采访时,半导体业内人士李国强打了个比方:“就像一辆车,高质量的马达加上卓越的调校才能跑得更快更丝滑。”对于AI芯片公司来说,好的软件,就像是帮客户把一辆跑车全面融合协调起来的强力引擎。软件和硬件适配得好,AI芯片这个算力巨兽,才能跑得更快。
而AI芯片行业领军企业英伟达,有超过70%的研发人员是软件工程师,他们所做的工作,有一个重要的目标:帮助客户把英伟达的硬件性能发挥得更好。相较于英伟达,软件工具和服务能力是AMD一大短板。
无疑,AI公司的收购将帮助AMD缩小其与英伟达之间的软件能力差距。
AI全家桶
6月3日,苏姿丰带着标志性的笑容和几乎覆盖所有产品线的更新,来到2024台北电脑展,进行了一场为期一个多小时的演讲。
在这场演讲中,AI是她说的最多的一个词。
从产品类型来看,AMD的业务范围涵盖CPU、GPU、FPGA三大类产品线。
从应用场景来看,AMD将其业务划分为云、高性能计算、企业、嵌入式和PC五大类型。
苏姿丰在2024台北电脑展围绕AI展示其全系新品
而“AI” 这一关键词,贯穿三大产品线、五大应用场景业务。用苏姿丰本人的话来说,AMD正在“为端到端AI基础设施提供推动力”。从硬件上来看,AMD的全线产品更新,都是为人工智能训练和推理提供更高性能的计算引擎,这包括CPU、GPU、NPU。从软件上来看,AMD正在试图搭建开放、经过验证且对开发人员友好的AI框架库和模型,构建与AMD硬件完全适配的生态系统。
公布竞品比分是AMD最擅长的经营策略。AMD也曾凭此方法实现了对竞品市场份额的争夺。2011年,AMD推出企业级芯片霄龙,对标当时市场上认可度最高的Intel至强处理器,并在官网上直接提供霄龙与至强的TCO对比工具,凸显霄龙耗电低的优势,一举拉高了霄龙在服务器CPU市场的采购比例。
在台北电脑展上,苏姿丰再次采用这一战略,全方位“碰瓷”竞争对手。且对比项集中于AI模型运算适配度。
当介绍第三代Ryzen时,苏姿丰着重强调了其NPU的AI处理能力,称在处理8位浮点数据类型时,第三代Ryzen AI性能优于高通骁龙X Elite、英特尔Lunar Lake、Apple M4等竞争对手。
当介绍Ryzen AI300时,苏姿丰强调其与所有x86和Arm CPU相比的单线程相应能力、多任务处理能力更优。
转向服务器领域,苏姿丰又将老对手Intel拉上了PK台,苏姿丰声称其代号为“Turin”的第五代128核EPYC产品与Intel Xeon 64核8592相比,在运行计算密集型科学软件NAMD、虚拟运行Llama 2-7B大模型以应对常见企业场景时具有更高的性能表现。
AMD展示Turin与英特尔8592在运行NAMD软件时的性能表现
不仅如此,苏姿丰还展示了将于2025年推出的Instinct MI350服务器端产品与英伟达B200的性能对比,宣称MI350支持内存为B200的1.5倍,人工计算性能为B200的 1.2倍。
在软件方面,苏姿丰展示了AMD开放式软件栈ROCm对AI硬件和操作系统的支持力度,并把主要竞争对手英伟达的H100与自家Instinct MI300X拉上了PK台,对比了在ROCm助力下,二者对Meta Llama-3 70B大模型、Mistral 7B大模型的推理性能,结果是Instinct 300X分别以1.3倍于H100和1.2倍于H100的比分胜出。
对于AMD而言,在发布会上公开与竞品的性能对比数据,无疑像是一场田忌赛马,对比项限定的场景必然都是精挑细选的,既能突出自身优势,又得压对手一头。综合来看,AMD林林总总的对比传递出两大信号:
其一,在许多特定场景中,AMD的产品性能的确达到了相当的水平,且与诸多人工智能模型适配。一如Stable Diffusion联合CEO兼CTO Christian Laforte所展示的那样,当使用模型文生图功能时,应用英伟达H100生成的图像为32MP,而采用AMD的Instinct MI300X生成的图像为100MP,图片清晰度得以大幅提升,且AMD可实现“开箱即用”。
其二,AMD与英伟达的产品性能仍存在不小的差距。AMD展示了Instinct与英伟达产品的两组对比数据,一组是MI300X和H100,其中英伟达的H100是2022年3月推出的,MI300X是2023年12月推出的,二者发布时间间隔了近2年的时间。且根据苏姿丰展示的数据来看,MI300X相较于 H100的性能优势有限,约为H100的1.2~1.3倍。另一组对比是AMD将在2025年发布的MI350X和英伟达2024年3月发布的B200,二者之间同样存在1年多的时间差。
开放、开源、定制化
AI时代,具有大规模运算需求的客户资源有限,入局速度决定着AI芯片企业未来在该领域的话语权。为了全方位应对与英伟达在AI时代的竞争,苏姿丰找到了一条差异化的发展路径:开放、开源、定制化。
NVLink是英伟达既CUDA之后的又一制胜法宝。依托这一技术,英伟达得以实现大规模AI处理器的高效互联,以应对大模型训练带来的超高算力需求。
针对竞争对手的这一利器,苏姿丰宣布,将联合Intel、Meta、Google、微软等一众合作伙伴开发能够连接数百个加速器的UALink(Ultra Accelerator Link)。
而与英伟达的“自建生态”相区别,苏姿丰将“开放”作为UALink的最大卖点。
“我们相信,人工智能网络的未来必须是开放的,得以允许行业中的每个人共同创新并推动最佳解决方案。”苏姿丰在演讲中说。
而且这一链接标准,将不仅仅是针对GPU,而是所有类型的加速器。苏姿丰补充道:“UALink将成为专有协议的绝佳替代方案。”这里的“专有”二字,显然暗指竞争对手——英伟达。
不仅如此,AMD还打通了专注于通信交换领域的一众头部企业生态链,称UALink提供来自博通、思科和Marvel等领先供应商的最新交换技术。
AMD的这套组合拳,无疑为英伟达现有的客户,提供了一个具有吸引力的替代方案。
“开源”,也是AMD扩展生态伙伴的一大举措。
今年5月,AMD在GPUOpen.com上发布了涉及RDNA 3架构的MES(Micro Engine Scheduler)固件完整文档。
此前,2023年12月,AMD曾宣布开源AMD FidelityFX Super Resolution 3 (FSR 3) ,作为 AMD FidelityFX SDK 的一部分提供给所有开发者下载,同时还提供了适用于 Unreal Engine 5 的插件。FSR 3 支持 DirectX 12 以及虚幻引擎 5,符合条件的开发者现可通过 GPUOpen 获取 FSR 3 完整源码。
最后,是定制化的能力。
英伟达极高的市占率,除了其硬件产品之外,很大程度上是由软件(CUDA)和服务(NGC与MLOps,TAO等)驱动的。而AMD一系列的AI公司收购举措,在Mohit Agrawal看来,将大大增强AMD提供端到端解决方案的能力,换句话说,这将帮助AMD吸引、留住AI客户。比如,收购 Silo AI帮助AMD 获得 MLOP(机器学习运维)能力,可以为客户提供从 AI 实验到可扩展生产模型的简化路径。
综合AMD近期的系列动作,似乎不难看出苏姿丰在AI这波时代红利下的布局战略:
第一步,打造出性能过关的硬件产品,并与业内数主流的大模型公司做功能适配。
第二步,聚拢一波使用AMD硬件的AI公司,一边利用这些公司的既有客户拓展市场,一边把这些案例打造成能讲出成功故事的“样板间”。在此过程中培养为客户提供定制化方案的能力。
第三步,争取到重点区域的稳定客户。例如AMD近期收购的Silo AI是一家欧洲公司,AMD便有机会借由其在欧洲的影响力实现一定区域内的市场拓展。
第四步,逐渐将产品影响力拓展到更多地区。
英伟达固然是一个强大的竞争对手。但对于客户来说,也不见得总要拼性能最顶的产品,毕竟,除了性能,价格也是非常关键的参考要素。
责任编辑:姬晓婷
- QQ:61149512