英伟达变招:Feynman GPU改用“混合工艺”,应对A16产能瓶颈
发布时间:
在全球AI军备竞赛愈发激烈的背景下,作为算力核心引擎的GPU芯片正面临前所未有的制造瓶颈。
3月23日消息,全球晶圆代工龙头台积电的首代SPR(超级电轨)工艺——A16节点,目前正遭遇严重的产能紧缺问题。受此影响,其最大客户英伟达(NVIDIA)不得不紧急调整原定于2028年推出的下一代AI GPU新品"Feynman"的设计方案,计划仅在关键的计算裸片(Die)上采用先进的A16工艺,而将部分其他模块改用产能更为充沛的N3P工艺。
Feynman芯片原本是英伟达CEO黄仁勋口中“改写历史”的产品。在此前预告中,黄仁勋曾宣布,Feynman将是全球首款导入台积电1.6纳米A16先进制程的AI芯片,预计于2028年正式投入市场。该产品将衔接已量产的Blackwell架构以及预计于2026年问世的Rubin架构,成为英伟达下一代数据中心的旗舰担当。
为了克服先进制程的物理限制,Feynman原本规划全面采用“超级电轨”(SPR)技术。该技术通过将供电线路移至晶圆背面,不仅解决了长期困扰半导体行业的SRAM压缩瓶颈,释放出更多空间堆叠算力,还大幅降低了功耗。此外,市场盛传Feynman还可能整合类LPU(语言处理单元)技术。考虑到英伟达近期收购了Groq,这一整合有望为大型语言模型(LLM)与生成式AI推理任务带来革命性的性能提升。
台积电官方数据显示,相较于前代技术,A16在相同工作电压下速度可提升8%~10%,或在相同速度下功耗降低15%~20%,同时芯片密度提升至多10%。这些特性使其特别适用于对能效和密度要求极高的高性能计算(HPC)产品。该节点原计划于2026年下半年正式量产。
然而,业界分析指出,A16工艺的产能爬坡速度远不及预期。据估算,到2027年底,A16的月产能规模仅能达到约2万片晶圆,即便到2028年底,也仅有望挑战4万片的关口。相比之下,届时台积电2nm家族的整体产能将达到20万片。面对AI芯片需求的爆炸式增长,区区数万片的A16产能显得捉襟见肘。
在此背景下,英伟达做出了务实的调整。原本计划全面采用A16工艺的Feynman GPU,如今将采取“混合架构”策略:仅在最核心、对性能最敏感的逻辑计算单元(Compute Die)上使用稀缺的A16工艺,以确保持续的算力领先;而对于缓存或其他辅助模块,则转而使用技术更成熟、产能更充足的N3P工艺。
尽管设计方案的调整有助于缓解产能压力,但Feynman的量产之路依然充满挑战。由于先进制程的高度复杂性,客户端的终端交付时间可能从原计划的2028年延后至2029甚至2030年。
面对台积电产能的紧绷,英伟达也在积极寻求多元化的供应链布局。有消息透露,英伟达已开始接触英特尔代工服务(Intel Foundry),试图分散风险。虽然目前英伟达仍持有A16的独家量产权,且台积电正全力为16A(即A16)制程扩充产能,但在AI算力需求呈指数级增长的当下,单一供应商的风险日益凸显。
