AMD能否与英伟达竞争?这个论题有着激烈的讨论。而国外投资者就苏妈电话会议上的字眼进行展开,让我们看看,他解读的角度。
作者:Joe Albano
在人工智能(AI)领域,特别是在数据中心领域,关于AMD能否与英伟达竞争存在激烈的争论。争论的一方总说:AMD追逐英伟达,因为它没有一款受客户欢迎的竞争产品,至少目前还没有。
就在上周,AMD的首席执行官苏姿丰在描述这种追逐时使用了一个有趣的词:"engagements(接触互动)"。在商界,"engagements" 是一个具有特定含义的词。但英伟达并没有用这个词来描述其H100 AI 加速器业务,然而它将在几周内发布一份大幅增长的数据中心收入报告,并提供发票,是那种实实在在的收入。所以苏姿丰这个文字游戏是怎么回事呢?
AMD的人工智能雄心的顶峰在于其MI300加速器产品。它被市场营销为AMD对英伟达快速被广泛采用的H100加速器的直接挑战,后者在此时已经投入使用约九个月。MI300被认为是AMD抢夺AI数据中心市场份额的答案。问题是,它仍处于预生产阶段,计划于今年第四季度推出和逐步生产。这意味着这款直接竞争的产品最快也要比英伟达晚一年面世。
现在,英伟达仅仅在产品方面占据先机,并不意味着AMD不能进入市场,从英伟达手中赢得一些胜利并成为焦点。这当然是有可能的,不过后续我会讨论其中的软件因素。
问题是在这个阶段,我们无法真正知道“engagements”的意义,而且"engagements"与从海洋取水一样廉价。
那么,到底什么是"engagements"?
概述AMD现状
由于多个客户启动或扩大相关项目,这些项目可支持大规模部署Instinct MI250和MI300软硬件,因此上个季度,客户与AMD人工智能产品的“接触互动”(AI customer engagements)增加了7倍以上。
——苏姿丰, AMD 23年第二季度财报电话会议
生意场上,这是与潜在的供应商或客户合作的最初阶段(取决于从哪个角度看待)。与供应商“接触”意味着获得更多关于其所能提供的信息,甚至达到获取其产品以进行概念验证的程度。在做出任何商业决策之前,概念的验证可能需要一个月到六个月甚至更长时间,这完全取决于被证明事物的复杂性。
一年多前,当英伟达开始对其H100加速器进行采样时,就不得不进行这些合作。然而,这些“engagements”已经变成了发票。但在深入探讨之前,我们先了解一下AMD目前在时间线上的位置。
由于MI300要到第四季度才开始生产,因此产量增长将持续到2024年。因此,虽然该产品开始大规模生产,但直到几个月后开始生产后,它才会有足够的库存来销售。然后是交付给客户以及之后的安装和设置。如果AMD现在刚刚进行了概念验证,那么这些公司至少需要三到六个月的时间才能决定购买。此外,AMD只向其主要客户提供“早期系统访问权限”,而不是所有客户。
与顶级云提供商、大型企业和众多领先人工智能公司的合作在本季度显著扩大。我们现在正在为我们的主要AI, HPC和云客户提供早期系统访问和样品产品……
——苏姿丰, AMD 23年第二季度财报电话会议
因此,即使是与主要客户的合作也只能变成对概念的验证。这些主要客户可能会对他们的概念验证进行最严格的审查。然而,如果他们同意,剩下的客户可能会对他们的概念证明更满意。但对于人工智能而言,产品必须为每个客户量身定制,因此在评估方面几乎没有捷径可走。
但更重要的是,如果只有最初的潜在客户在评估,那么在第四季度排队订购的客户数量将会减少。此外,这使得购买决定推迟到了第四季度。一旦批量生产允许发货,交付和安装可能要到24年第一季度才会发生。从那时起,广泛的可用性可能要到24年第二季度才能实现。
科技领域的其他分析师也证实了这一点:
“...该芯片将在第三季度开始向主要云和数据中心提供商提供样品,并在第四季度开始生产。一些分析人士认为,这意味着MI300要到2024年年中才能广泛上市;这将使它落后英伟达的H100大约18个月,后者于2022年底和2023年初开始批量出货。”
由于概念验证只是现在才开始,至少在未来两个季度内不会产生收入,第三季度开始显示一些收入。因此,AMD将合作转化为发票的过程远未达到市场的预期。对于MI300来说,数据中心领域的逐步增收最早也要等到2024年第一季度。"
接触不一定会带来发票,但软件会
从更多的投机的角度来看,这些“engagements”可能完全是一个误导。在上面的评估中,分析师给了AMD将看到这些“engagements”转化为发票的机会。但它们可能实际上是云和人工智能客户试图找到其他解决方案,以弥补他们无法订购足够的H100来满足AI需求的问题。毕竟,英伟达承认在2023年下半年推高了产量,以满足需求。因此,这些客户与领域中唯一的另一家供应商进行初步试验,看看他们是否有东西可以补充他们的AI需求。
最终,这些客户可能会发现他们在概念验证中的备选解决方案不可行或成本过高。你可能会想,“为什么成本会太高呢?英伟达的H100是云提供商目前可以购买的最昂贵的东西。”虽然这是事实,但这就是软件的作用。另一种解决方案可能需要更多的软件集成和几个新的软件组件,可能需要更多的开发时间来实现可行的解决方案。这就是TCO(总体拥有成本)。
使用英伟达的加速器,客户将获得其专有的软件包。有些人可能会说,这正是问题所在。然而,这也是一个支持的解决方案,英伟达被激励与客户一起调整软件,因为它可以提供最多的专业知识,并且它的客户变得根深蒂固。AMD正致力于开源软件解决方案。虽然这听起来是免费的,并且得到了广泛的社区支持,但它也需要进行大量的定制以适应客户的需求。而这很大程度上取决于客户自己的判断。
即使抛开我的怀疑,AMD也承认它的软件之路还很长。
AMD补充说,它已经开发了自己的开源软件堆栈ROCm,但也承认在软件方面还有很长的路要走。
AMD是开源的,因为它不能单独在内部开发软件,要么是因为缺乏人才,要么是因为缺乏专门的资源,或者两者都没有。
英伟达已经用CUDA开发了超过16年的软件,而它的人工智能软件包可以说自2017年以来一直存在。这使得英伟达成为软件巨头,而不仅仅是一家硬件工程公司。AMD对开源软件的依赖是全新的,这要求它在与开源社区打交道的同时,也要取得同样的进展,以推动软件的发展。开源软件当然有优势,我每天都使用它们。但对于世界上最大的客户来说,一个经过验证的、最小配置密集型的解决方案才是推动业务发展的关键。在软件领域,AMD一直是追随者,而英伟达一直是领导者,这仍然是两者之间的区别。
接触不值得投资
光有"接触"是远远不足以成为投资的理由,尤其在没有经过验证的产品的情况下。当然,偶尔的一些基准测试可能会显示出AMD的MI300在某些方面和某些测试中击败了H100,尤其是在内存方面。然而,纯硬件性能本身并没有软件支持的话,它只不过是一堆昂贵的废物。而且,英伟达在GPU和AI计算领域的软件方面保持着显著的领先地位。
另外,这也没有解决英伟达在AMD正处于全面产能阶段时准备推出其下一代产品的问题。这将在硬件领域再次将AMD甩在后面,还没有开始就已经输了。
明年3月,Hopper-Next将推出。毫无疑问,这将使英伟达重新回到硬件领域的顶端。分析师预计英伟达将提升其内存技术,并采购美光的HBM3 Gen2,这将消除人们对英伟达加速器在内存带宽瓶颈游戏中的能力的质疑。美光的产品发布时间与Hopper-Next 24年第四季度/ 25年第一季度的发布时间一致。
“生成式人工智能的核心是加速计算,这得益于HBM高带宽和能效。”英伟达超大规模和高性能计算副总裁伊恩·巴克表示:“我们与美光在广泛的产品上有着悠久的合作历史,并渴望与他们在HBM3 Gen2上合作,以推动人工智能创新。”
总的来说,分析师不会对AMD的人工智能数据中心前景感到太过兴奋。其MI300仅处于销售周期的参与阶段,而英伟达正在完成其Hopper-Next加速器架构。一旦AMD克服了在软件方面的“长途跋涉”,将会是另外一个故事。在那之前,AMD的收入可能会随着数据中心的整体恢复而增加——如果它能恢复到原来的水平,我对此表示怀疑——因为GPU开始接管数据中心架构,在未来几年拉低AMD和英特尔的CPU需求。
$英伟达(NVDA)$ $美国超微公司(AMD)$