英伟达Blackwell系列芯片推迟发布及其影响内容导读
英伟达芯片推迟发布
据The Information援引知情人士称,英伟达即将推出的人工智能芯片因设计缺陷而推迟三个月或更长时间,Blackwell大量生产或延迟至明年Q1。这可能会影响Meta Platforms、谷歌和Microsoft等客户,这些公司集体订购了价值数百亿美元的芯片。英伟达方面目前不愿就延迟声明发表评论,但表示客户正在测试Blackwell芯片的样品,并且今年晚些时候“产量有望提高”。
生产问题及解决方案
在大规模生产之前发现重大设计缺陷并不常见。The Information援引参与Blackwell芯片制作人士称,最近几周出现了Blackwell设计问题,因为台积电的工程师在准备大规模生产时发现了缺陷。GB200芯片包含两个连接的Blackwell GPU和一个Grace中央处理单元。该缺陷问题涉及一个处理器芯片,这一障碍降低了台积电能够为英伟达生产的芯片产量,甚至有可能使公司停止生产。英伟达正在与其芯片制造商台积电进行新的试生产运行。
摩根士丹利观点
摩根士丹利分析师Charlie Chan在报告中表示,此次是对于Blackwell的一些改进工作,并非延迟。据了解,原始Blackwell设计的生产已于2024年第二季度末开始生产,任何与原始设计有关的技术问题仍可以通过软件系统解决。英伟达希望通过更换一些光罩,即“重新设计”,进一步提高Blackwell的稳定性。Blackwell的重新设计已经在台积电完成,并将在2024年第四季度成为更大批量生产的版本。
客户反应及影响
Blackwell可谓是科技公司们心目中的“白月光”,承载着巨头们的厚望。如果即将推出的B100、B200和GB200等AI芯片推迟三个月或更长时间,英伟达的客户们真的会“愁上心头”。这些客户包括Microsoft、Meta和OpenAI等,他们对英伟达AI芯片抱以极大期待,计划使用英伟达开发的“超级计算机”生产出未来几代大型语言模型、Meta AI助手和其他自动化功能等。Meta定下价值至少100亿美元的订单,而Microsoft最近几周将其订单规模增加了20%,计划在2025年第一季度之前为OpenAI准备好55000-65000个GB200芯片。
服务器机架受影响
设计缺陷还将影响Nvidia NVLink服务器机架的生产和交付,因为从事服务器工作的公司必须等待新的芯片样品,然后才能最终确定服务器机架设计。GB200 NVL36的算力优势无庸置疑,但也面临许多前所未见的设计与生产挑战,能否确保如期大量出货,答案存疑。GB200 NVL36的每个机柜耗电约80kW,而根据AMAX今年四月的调查,目前全球少于5%的数据中心可以支持每机柜50kW服务器。购买GB200 NVL36前,需先确保有没有足够空间安装。GB200 NVL72的单一机柜版本每机柜耗电130kW,短期内无法量产。
来源:今日美股网