暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

对话AMD CEO Lisa Su:解决难题

Andy730 2024-06-08
96

核心观点

  1. 完成一个产品的最后5%可能是最难的,也是最关键的。
  2. 对比生产百万个与仅几个的产品,两者在处理问题的思路和方法上存在显著的差异。
  3. 产品的成功不仅需要优秀的技术,还需要正确的商业战略
  4. Chiplet并非仅仅是“把芯片粘在一起”,而是实现高性能、更多核心,并优化成本的创新,以及巨大的灵活性
  5. ChatGPT的出现带来了明确的信号,它体现了AI的核心意义。
  6. 我们坚信硬件与软件之间的联系至关重要。关键在于,软件使客户真正利用芯片中的全部功能。
  7. 对我们来说,确保客户真正提升他们的工作负载非常重要。
  8. 五年后的市场必然有多种解决方案。不会是一种解决方案适用于所有场景。
  9. 从郭士纳那里,我学到了如何分配时间,如何制定战略,以及如何领导团队


Lisa Su
CEO

AMD

从IBM学到的经验

Ben Thompson:Lisa Su博士,欢迎您来到Stratechery。

Lisa Su:谢谢,我很高兴来到这里。

Ben Thompson:我非常荣幸能邀请到您。我有幸与许多半导体领域的同仁进行过交流,而且每次交流后,我的订阅者们都会不约而同地问到同一个问题:“你什么时候会采访Lisa Su?”感谢您让我能避免再收到这些邮件。

Lisa Su:谢谢,我很高兴有这个机会与您交流。

Ben Thompson:我知道您可能不想过多谈论自己,但我需要核实一些事实。在我们开始之前,我听说您出生于台湾,小时候移民到美国,并最终进入了MIT。据说您在MIT时,在计算机科学和电气工程之间做选择,最终选择了电气工程,因为它更具挑战性。这是真的吗?

Lisa Su:确实如此。我一直对数学和科学很感兴趣,我的父母也总是说:“你必须做这些有挑战的事情。” 进入MIT时,我需要在电气工程和计算机科学之间做出选择。计算机科学主要关注编写软件程序,而电气工程则需要构建实际的东西。我更倾向于构建实际的东西。

Ben Thompson:这些构建的东西还必须要真正起作用,对吧?

Lisa Su:是的,没错。

Ben Thompson:您的博士研究专注于绝缘体上硅技术,之后您加入了IBM——您开创了芯片上的铜互连技术。我有三个关于您在IBM的经历和您可能学到的教训的问题。第一个是,关于铜互连技术,您曾对MIT Review表示,您原本准备尝试一些新事物,但您的上司希望您留下,您认为在那段时间里积累的经验是最具影响力的。这些经验具体是什么呢?

Lisa Su:在IBM的那段时间,我确实学到了很多,那是我职业生涯的早期阶段。当还在学校并获得博士学位时,觉得最吸引人的是所做的研究和所写的论文。但当真正加入一家公司并参与一个项目时,这些项目通常需要数年才能完成。而最“吸引人”的部分,其实是在提出新想法并看到它们逐步变为现实的时候。

实际上,我学到的教训是,我参与的第一个产品是带有铜互连的微处理器。我发现,完成一个产品的最后5%可能是最难的,也是最关键的。如果你学会了如何攻克这一部分,那么坦白说——

Ben Thompson:所有的软件工程师都会说,“嘿,这对我们来说也是一样的。你不知道吗?”

Lisa Su:这可能确实如此。但我们都有对“秘密武器”的看法,这包括良率、可靠性,以及当出现问题时的处理方法。当试图生产数百万个产品而不是几个时,就会学到很多,我在IBM就学到了这些。

是的,作为一个年轻的研究人员,可能会想:“嘿,我准备好进入下一个阶段了。” 但当看到自己的产品真正上市并可以走进Best Buy购买时,那种成就感是无法言喻的。这是我在IBM学到的东西。

Ben Thompson:即使在今天,您是如何在展望未来的研发与实际执行的承诺之间平衡您的时间和注意力的呢?

Lisa Su:当然,现在我个人花费了大量时间在未来的技术路线图上。

Ben Thompson:您只是对公司其他部分在努力出货时更加耐心。

Lisa Su:确实如此。坦白说,我投入了大量的时间关注客户和市场的动态,以及我们应该投资的方向。

Ben Thompson:出于我个人的好奇,作为无晶圆厂公司(fabless),您需要在多大程度上深度参与到最终产品的实现中?例如,与TSMC或封装合作伙伴的互动程度如何,以确保产品的高良率和顺利出货?

Lisa Su:作为一家无晶圆厂设计公司,这对我们来说至关重要。我们实际上在进行端到端的开发,从产品概念的第一天开始——甚至在那之前,我们就在考虑哪些技术将会成熟,哪些是我们应该押注的下一个大趋势。这整个过程有时可能需要五年甚至更长时间才能看到技术的实际成果。我们始终确保产品以高质量、适当的良率、合理的成本结构和高产量出货。

所以,这确实是端到端的开发,但不同之处在于,它并非全由一家公司完成,而是在合作伙伴之间协作完成。我们发现这种方式非常有效,因为集合了各方面的专家共同合作。

Ben Thompson:我对IBM的第二个教训很感兴趣,您曾参与了PlayStation 3的Cell处理器开发。那颗芯片在技术上是一个奇迹,但PlayStation 3被认为是最不成功的PlayStation,这促使索尼做出了从硬件差异化转向独占游戏策略的重大转变。我想这个问题有两个方面:一方面,您从那次经历中学到了什么?另一方面,这对您后来的游戏业务经验有多大影响?显然,游戏业务经验是显而易见的。我更关心的是,从您在Cell处理器上付出的所有努力以及它在市场上的实际表现中,您有没有获得什么管理方面的教训?

Lisa Su:你提到这一点非常有趣。我在PlayStation上工作了很长时间,想想看,PlayStation 3、4、5……

Ben Thompson:这贯穿了您的职业生涯。

Lisa Su:跨越多家公司,是的。坦率地说,我认为这些更多的是关于架构决策的决定。从这个角度来看,无论是谈论任何一款PlayStation主机,还是我们在合作伙伴关系中所做的一些其他工作——我们指的是AMD,但在IBM期间也是如此——这实际上是与客户或合作伙伴紧密合作,了解他们想要实现的目标。

Cell处理器在当时是非常有野心的,考虑到它试图实现的并行性。从商业角度来看,它确实是成功的。随着时间的推移,我认为历史会给出不同的评价。

Ben Thompson:我的观点是,主机时代经历了不同的阶段,PlayStation 1和PlayStation 2时期,他们做出了明智的硬件决策,这与任天堂的做法有所不同。但一旦进入高清时代,资产创建成本大幅增加,开发者强烈倾向于支持多处理器,游戏引擎逐渐成熟。突然间,没有人愿意承担在Cell上进行差异化的负担,他们只想在Cell上运行游戏。

Lisa Su:也许可以说,回头来看,可编程性是非常重要的。

Ben Thompson:没错。

Lisa Su:要在任何事情的初期就取得真正的商业成功,我们必须同时考虑硬件和软件。正如我们所见,我非常自豪的是,在过去十多年里,AMD在PlayStation 4和PlayStation 5上的工作,我们总是在硬件上取得新的突破。

Ben Thompson:而且更容易实现。

Lisa Su:它们还兼容上一代,这非常有帮助。

Ben Thompson:第三个问题:您曾经担任过一年时间的Lou Gerstner的技术助理。您从他身上学到了什么?顺便说一句,这是一个支持Lou Gerstner(郭士纳)的播客。

Lisa Su:你确实做了足够的功课。我和Lou一起度过的一年是我职业生涯中最具教育意义的经历之一。IBM在人才培养方面非常出色,他们会在职业生涯早期识别人才,并询问:“嘿,你更想走技术路线还是管理路线?”

对于我的情况,他们问我是想走技术路线还是更倾向于管理路线,用IBM的术语来说,就是成为IBM Fellow或IBM副总裁。坦率地说,我当时并不认为自己足够聪明可以成为IBM Fellow。那里有像Bob Dennard(Robert Dennard,DRAM之父)这样的人——

Ben Thompson:我觉得有人会不同意你的看法。

Lisa Su:当时有很多了不起的人,所以我心想,“好吧,让我试试管理和业务方面的事情”。他们给了我一个和Lou一起工作一年的机会,他真的是一个了不起的人。想象一下,一个刚出校五年的人,基本上只做过纯工程工作,然后有机会坐在——

Ben Thompson:可以说是参加世界上最顶尖的MBA课程学习。

Lisa Su:是的!绝对是,最让我感兴趣的是了解他如何分配时间。他总是在学习,非常注重外部环境,了解市场上发生了什么,客户在做什么。

Ben Thompson:这也与您今天所强调的工作内容紧密相关。

Lisa Su:完全正确。他如何分配时间,如何制定战略,以及如何领导团队。我有幸教他一些技术知识。我会说,“嘿,Lou,有一个有趣的新东西叫Napster,人们正在下载它”——不知你是否还记得。

Ben Thompson:我记得,我向我的大学宿舍楼层推荐了Napster,这让我在大学里声名远扬。

Lisa Su:我向Lou介绍了Napster。我们当时真的在探讨数字版权管理的意义,这些都是我们能够深入思考的问题。

Ben Thompson:我一直很感激Lou Gerstner的一点是,正如你所说,他不仅仅关注外部环境和市场动态,更重要的是他了解IBM的本质、IBM能够做什么以及IBM的独特差异化。我的看法是,IBM规模庞大,这实际上意味着什么?你能以某种方式真正带来哪些独特价值?比如中间件革命,看,我们能够解决那些比我们还要悠久和庞大的公司的互联网问题,这就是我们的差异化。但显然,一切并未如预期般顺利。IBM应该进军云市场,Lou在他的书中确实提到了这一点,我不知道这是否是事后诸葛亮。但如果我接替他,我能否带领IBM达到新的高度?

Lisa Su:我不认为我会选择那条路。我来自半导体行业,现在也是。如果我真的要深思,IBM对我来说是一段非常宝贵的职业经历,但如果我想继续留在半导体行业,我必须选择一家半导体公司。

Ben Thompson:后来你去了飞思卡尔(Freescale Semiconductor),更多地担任了业务角色。

Lisa Su:是的。

Ben Thompson:当你选择这个方向时,是否有一种个人的认知:“好吧,我现在是个商人了”,还是说这种认知是在你选择这个方向后逐渐形成的?

Lisa Su:我一直在技术和商业之间游走。在飞思卡尔,我实际上是以CTO的身份开始的。我作为CTO加入,然后在几年内我开始负责网络和多媒体业务,这无疑是一种选择。最终,我想推动业务成果,而要推动成果,不仅需要优秀的技术,还需要正确的商业战略。

Ben Thompson:这是否是很多技术人员的局限,他们低估了与技术无关的所有驱动因素?

Lisa Su:我认为这是技术人员必须学习的东西。顺便说一句,有些非常出色的CTO,他们真正明白这一点。比如我现在的CTO Mark Papermaster,他是我在IBM的“战友”,我们一起成长,然后我们在AMD成为合作伙伴。他真正理解技术是核心,但也需要推动商业成果。这也是我喜欢我现在工作的原因,因为我可以与一支出色的团队共同打造顶尖技术,同时也有机会推动显著的商业成果。

AMD的转变

Ben Thompson:让我们来谈谈AMD。我之前提到过的主机战略,这是你加入AMD时面临的一个重大转变。是不是当时你觉得:“好的,这是一个容易取胜的高容量市场,我们可以重新进入游戏领域”?当时是怎么考虑的?

Lisa Su:嗯,我从不会说任何事情是容易赢得的。

Ben Thompson:没错。

Lisa Su:让我从我刚加入AMD时的想法开始说起,当时我们在PC市场的份额可能超过90%,顺便说一句,我真的很喜欢PC市场。我相信我们会更多地谈到它。

Ben Thompson:当然。昨天你花了前45分钟谈论PC市场。

Lisa Su:是的,所以我先说明这一点。但PC市场是周期性的,这些周期可能非常剧烈。

Ben Thompson:非常痛苦。

Lisa Su:我会用“非常剧烈”这个词来形容。所以从商业战略的角度来看,AMD早期的多元化和制定以高性能计算为基础的战略是非常重要的。我们是一家计算公司,我们擅长构建计算能力,现在哪些市场可以真正利用这一点?游戏是其中一个市场,我们非常幸运地能够与索尼和微软这样的主机制造商合作。

Ben Thompson:是谁推动了主机向x86架构的转变?这在多大程度上是索尼从Cell处理器中学到的经验教训?是你去找他们说:“这是该走的路”吗?这种架构的通用性是如何形成的?

Lisa Su:是的,我认为这是一个选择,是在x86和其他架构之间的选择。当考虑软件开发时,围绕x86的开发者生态系统是一个非常关键的因素,但我认为仅凭架构本身是不足够的。我认为卓越的图形处理能力尤为重要,如果想定制图形芯片,只有非常少的公司能够做到,AMD就是其中之一。

Ben Thompson:即使如此,你们提供的CPU和GPU之间的整合程度如何?AMD在2006年收购了ATI,这在你加入之前,但有没有其他公司能够为主机提供你们所做的那些东西?

Lisa Su:我会说我们在两个方面是独特的。首先是我们拥有基本的IP,即结合了微处理器核心和图形IP的能力,其次是我们愿意进行定制。坦白说,我们有一个庞大的团队专注于这些项目进行定制。

Ben Thompson:你是否认为这是一种模式,最初,一切都是关于追求前沿技术,获得最佳性能,但随着技术发展,我不想说“放缓”,而是技术逐渐商品化,定制化变得更为重要。你们收购了...我一直没能正确发音。

Lisa Su:Xilinx。

Ben Thompson:Xilinx,两年来我一直没能正确发音。听起来这种定制化方法是有普遍性的。这是你们想要利用的优势。

Lisa Su:简单来说,有几个原则很重要。首先,全球用户对半导体的需求越来越大。半导体,或者说芯片,如今是我们日常所做许多事情的基础。很多产品都是标准化的,适用于多种用途。但确实存在一些高产量应用,如游戏主机、云端的一些工作,以及我认为将来会定制化的一些AI工作。在这些领域,由于产量巨大,定制化变得非常有意义。我一直坚信这一点。这既是我们的战略方向,也是我们深度合作伙伴关系战略的一部分。如果有了正确的构建模块,我们就能与广泛的客户合作,真正了解他们的需求,帮助他们实现愿景。

Ben Thompson:随着工艺曲线的进步,设计成本越来越高,以至于定制化似乎有一个门槛,只有像AMD这样规模的公司才能进行定制,这是否有些自相矛盾?

Lisa Su:我认为关键在于要识别哪些市场真正适合我们所说的显著定制化,而不是一概而论。比如,你可能不会考虑为物联网设备定制,因为投资回报率不高。但对于大型计算任务来说,合适的IP加上与合作伙伴的深度合作是关键。值得一提的是,定制化不仅仅是硬件层面的,我们在软件方面也能做很多工作,我认为这是未来的一个重要趋势。

Ben Thompson:我得问一下,你加入AMD,经过几年的努力,最终成为CEO。这是不是又一个艰难选择的例子?

Lisa Su:确实如此。我加入AMD时,一直在高性能处理器领域工作,这是我的专业背景,在美国这样的公司屈指可数。我一直很尊重AMD,认为它是一家非常重要的公司,但我也看到了自己能够发挥作用的地方。加入后,我意识到“天哪,我需要学习的东西太多了”。在最初的几年里,我确实学到了很多市场动态,但也看到了变革的契机。

Ben Thompson:你在哪些方面进行了变革?我们可以看到你所带来的改变——从股价到芯片性能都有所体现。但在那个背景下,或许很难理解你十年前的心态,但你的计划是什么?你是如何看到那条成功之路的?

Lisa Su:我非常清楚地看到,我们拥有建立出色路线图所需的构建模块。这些构建模块在行业中非常独特。

Ben Thompson:这些构建模块具体是什么?是IP还是客户关系?

Lisa Su:是高性能CPU和高性能GPU。如果你仔细考虑,这些是非常强大的构建模块。不过,我们当时缺乏的是一个明确的战略方向,即我们未来想成为什么样的公司,以及一个能够实现这一目标的执行团队。

从战略角度来看,我们有几个选择。你还记得吗,2014年,移动电话和应用处理器市场非常火热。我们当时会讨论,“我们应该进入手机市场吗?”但我们的结论是,“不,我们不应该,因为我们不是手机公司。其他公司在这方面更擅长,我们是一家高性能公司,所以我们必须制定一个利用我们优势的路线图,这包括改进我们的架构、设计和制造方式。”我知道这需要时间,不可能一蹴而就,我认为需要五年。确实如此,但我们有这些基础,我们只需要有条不紊地构建那个执行团队。

Ben Thompson:您提到了制造。在您接任之前,AMD已经剥离了GlobalFoundries。我想用一个技术术语来问,你们与GlobalFoundries签订的那份不断修改的晶圆供应协议有多复杂?在你们执行战略时,这是否是一个需要不断解决的问题?

Lisa Su:公平地说,AMD和GlobalFoundries曾经是一家。

Ben Thompson:这有其原因,是可以理解的。

Lisa Su:确实如此。那份晶圆供应协议是在我加入之前的事情,但我认为这是我们需要处理的几个重要战略问题之一。如果你想制造高性能处理器,你需要最好的技术合作伙伴和制造合作伙伴。GlobalFoundries是一家很棒的公司,他们仍然是很好的合作伙伴。但你需要达到一定的规模才能在行业前沿进行制造,而我们当时并没有达到那个规模。

Ben Thompson:当他们决定不推进7nm技术时,这是否反而是一种解脱?

Lisa Su:对我们双方来说,这都是一个很好的决定。从财务角度来看,AMD必须——

Ben Thompson:是的,你们需要把最初从GlobalFoundries获得的所有资金还给他们。

Lisa Su:这是一个商业安排,但从技术角度来看,这绝对是正确的决定。正如我所说,GlobalFoundries是我们的一个很好的合作伙伴。我对GlobalFoundries的CEO Tom Caulfield非常尊重,我认为两家公司通过专注于各自擅长的领域,都取得了更好的发展。

Ben Thompson:你们是第一家转向Chiplet架构的高性能芯片制造商,现在其他公司也在朝这个方向努力,所以你们在这方面无疑是领先的。这是否意味着你们实际上是因为那份晶圆供应协议而被迫选择这个方向,从而可以在GlobalFoundries和TSMC之间分摊产量并交付芯片?

Lisa Su:绝对不是这样。实际上,我认为这是我们做出的最明智决策之一,尽管当时情况并不那么明朗。

Ben Thompson:确实如此。

Lisa Su:当时我们在思考摩尔定律的发展趋势,以及我们如何实现差异化。说实话,我们的想法是需要为处理器市场带来创新,因为构建那些庞大而笨重的芯片既不高效也成本昂贵,这并非解决之道。

我清楚记得,当时我与Mark及我们的架构师们一起讨论,“现在是我们采用Chiplet架构的时机吗?我们是否应该在此架构上孤注一掷?”我们达成了共识,“是的,因为这样可以实现更高性能、更多核心,并优化成本”,这赋予了我们巨大的灵活性,而且我们在这个过程中取得了丰硕的学习成果。

第一代Zen 1 Chiplet表现尚可,但我们在编程模型上遇到了挑战,这些问题在Zen 2中得到了改善,并在Zen 3中达到了我们的预期目标。

Ben Thompson:您在2014年接任CEO时,我感觉您大有可为。我注意到了几个重要的转变,包括你们转向Chiplet架构,以及TSMC开始过渡到EUV技术。您在多大程度上预见了这些市场中的长期变化,并据此做出了“我可以从这里着手”的决策?

Lisa Su:是的,我们确实非常关注技术发展趋势和TSMC的最新动向,同时也密切关注封装技术的进展。我们决定是时候迈出这一步了。我经常说,在我们的业务场景中,有时需要做出三到五年才能看到成效的决策。

Ben Thompson:没错。我不介意问您关于2014年的决策,因为那些决策往往对今天有重要影响。

Lisa Su:确实如此。与此相关的风险在于,“我们转向Chiplet架构真的能获得预期的性能提升吗?”但我们从中学到了很多,历史也证明我们的决策是正确的。然而,在当时,一些竞争对手嘲笑我们只是在把芯片粘在一起,他们似乎并不理解我们的创新之处。

Ben Thompson:但现在他们也在做同样的事情。回顾过去十年,AMD在x86市场中真正实现了性能领先,你如何平衡设计决策与TSMC最前沿制程技术的贡献?

Lisa Su:我认为二者是相辅相成的。

Ben Thompson:是的,这些决策是相互关联的。

Lisa Su:绝对如此。我们发现,与TSMC这样出色的合作伙伴合作非常有帮助。当承担大量设计风险时,希望自己的技术基础是坚实的,这样就能明确知道应该在哪些方面投入时间和精力。

Ben Thompson:这就是TSMC和ASML所做的,比如从200mm到300mm,再到EUV技术的过渡。这种合作伙伴关系证明了他们的实力,而你们能够紧随其后,共同发展。

Lisa Su:没错,我认为这是一种非常协同的合作关系。

Ben Thompson:在您上任之前,AMD最重要的时刻之一是我们之前讨论过的从x86到64位的转变,这一转变迫使英特尔跟进。这是一个涉及硬件和软件的故事,虽然发生在您上任之前,但我注意到对AMD的一个持续批评是软件需要改进。那么软件在这里扮演了什么角色呢?您不能仅仅关注硬件方面。当您加入AMD时,是否有一种感觉,“我们有机会在此基础上随着时间推移不断发展”?AMD在软件方面的挑战是什么,您是如何努力改变这一点的?

Lisa Su:让我澄清一点,我们从未对软件有过任何迟疑。

Ben Thompson:这是一种转变吗?

Lisa Su:绝非如此。我们一直坚信硬件与软件之间的联系至关重要。关键在于,软件应该让客户能够轻松利用我们芯片中所有令人难以置信的功能,这一点非常明确。

Lisa Su:我认为你会看到,我们实际上一直在多个技术发展曲线上前进。所以,有CPU曲线以及我们为构建Zen产品组合所做的一切。现在,我们刚刚在Computex上预览了Zen 5,它将在数据中心推出,随后也会在客户端产品中推出。这是一个发展曲线,而现在我们进入了下一个曲线,围绕——

Ben Thompson:GPU的发展。

Lisa Su:是的,AI和GPU的发展。

Ben Thompson:我还想问您一件事。就当前趋势而言,我们谈到了Chiplet趋势和EUV技术的重要性。超大规模数据中心的崛起对你们的成功有多重要?在我看来,他们的购买规模如此之大,以至于他们会进行长期价值计算,并认为“从长远来看,这些AMD处理器是值得投资的”。其次,如果在软件方面存在不足,他们会自行弥补这些不足,因为他们能够看到长期的利益。这是否影响了你们在考虑实际能够赢得什么时的决策?这是否是一个驱动因素?

Lisa Su:这是一个很好的观点。当考虑到高性能计算和不断变化的市场需求时,超大规模数据中心是整体市场中非常重要的一部分。我们在这方面投入了大量时间,你提到的观点非常准确——我们希望在每个市场中,我们的产品总是能成为赢家,但实际情况并非总是如此。在超大规模数据中心市场中,只有最好的产品才能成为赢家。

Ben Thompson:是的。

Lisa Su:我们已经证明了这一点。坦率地说,在这个市场上,仅仅赢得一次或暂时的胜利是不够的。

Ben Thompson:必须有一个明确的路线图。

Lisa Su:必须赢得路线图,而这正是我们在当时所做到的。

Ben Thompson:所以你在2014年加入时,你说,“我能看到我们实际能赢得胜利的路线图”。

Lisa Su:没错。

Ben Thompson:而且有客户愿意根据这个路线图进行购买。

Lisa Su:是的,顺便说一句,他们会要求你证明这一点。在Zen 1时期,他们会说,“好吧,这相当不错”,Zen 2更好,Zen 3更是出色得多。这种路线图的执行使我们成为所有超大规模数据中心的深度合作伙伴,对此我们深感感激。另外,当再次谈到AI的发展之路时,这同样是一段类似的旅程。

Ben Thompson:关于x86我还有一个问题。您如何看待消费领域与这一切的结合?考虑到,比如英特尔,他们需要让他们的工厂满负荷运转,所以他们需要最大化芯片在各个领域的使用。英特尔希望实现垂直整合,而AMD则处于不同的位置,他们能更好地满足超大规模数据中心的需求,并且只制造卓越的芯片。但您是否考虑过体量的问题,因为您希望在设计成本和IP投资上获得杠杆作用?我很好奇在没有自己的工厂、没有数十亿美元资本支出的背景下,你们是如何进行这些计算的。我很好奇你如何与一家垂直整合的公司以不同的方式考虑这些问题。

Lisa Su:我们的思考方式是,关键在于规模。回顾2014-15年,我们是一家价值40亿美元的公司,在那种情况下,可以投入一定数量的研发资金。去年,我们大约是价值220多亿美元的公司,可以在研发上投入更多的资金。

Ben Thompson:是的,所以基本上,这仍然是相同的计算方式。

Lisa Su:这是如何利用杠杆的相同计算方式。

Ben Thompson:但如果你在工厂上花费过多,也许破产的风险会小一些。

Lisa Su:我认为关键在于利用IP。这有点像我们拥有的计算引擎。这是我们的首要任务,将这些计算引擎置于一个非常激进的路线图上,然后我们从中构建产品。

AI

Ben Thompson:当ChatGPT在2022年11月出现时,你的反应是什么?

Lisa Su:其实这真正体现了AI的核心意义。

Ben Thompson:显然您在图形领域已经工作了很长时间,您一直在思考高性能计算,所以GPU的重要性对您来说并不陌生。但它在人们中的影响程度是否让您感到惊讶,以及之后发生了什么?

Lisa Su:我们一直在GPU用于高性能计算和AI的这条道路上。实际上,这可能是我们从2017年左右开始的一个非常重要的方向。我们一直在做GPU,但真正关注的是——

Ben Thompson:在2017年是什么让你意识到,“等等,我们拥有这些技术,我们原本以为购买ATI是为了游戏,突然间,这有了完全不同的应用”?

Lisa Su:这是下一个大机会,我们知道这是下一个大机会。这是我和Mark讨论过的,通过将CPU和GPU集成在系统中并一起设计,我们将获得更好的解决方案,最初的短期应用是围绕超级计算。我们非常专注于那些将位于国家实验室和深度研究设施中的大型机器,我们知道我们可以构建这些大规模并行的GPU机器来实现这一目标。至于AI部分,我们一直也认为它显然是HPC加AI的应用。

Ben Thompson:您之前说过AI是HPC的杀手级应用。

Lisa Su:是的。

Ben Thompson:但您会听到HPC领域的人说,“嗯,这有点不同”,您认为在多大程度上这是相同的类别还是相邻的类别?

Lisa Su:它是相邻但高度相关的类别,这完全取决于你希望在计算中获得的精度,是使用完全精度还是其他数据格式。但我认为真正关键的是,我们在Chiplet策略上的远见使我们能够构建一个高度模块化的系统,可以称之为集成的CPU和GPU,或者是仅具有令人难以置信的GPU能力的系统。

对我来说,ChatGPT的出现带来了明确的信号,现在每个人都知道AI的用途了。之前,只有科学家和工程师思考AI,现在每个人都可以使用AI。这些模型并不完美,但它们非常出色,有了这个,我认为如何尽快将更多的AI计算能力交到人们手中变得清晰了。由于我们构建设计系统的方式,我们可以真正拥有两种风格。我们有HPC专用风格,这就是我们称之为MI300A的产品;我们还有AI专用风格,即MI300X。

Ben Thompson:这种转变是否让您感到不适?比如,“实际上,我们需要更少的精度,因为扩展性非常重要”。

Lisa Su:这并不让我感到不适。速度之快令人惊讶。

Ben Thompson:一切都发生得非常快。AMD表现非常出色,你们几个月前创下了历史新高。但总体上,显然Nvidia在很多势头和上升空间上抓住了市场情绪。您认为在那段时间内,AMD需要赶上的是什么?

Lisa Su:我认为关键在于关注点在哪里,相对来说——我给Nvidia CEO Jensen Huang和Nvidia很高的评价。他们在这个领域投入了很长时间,在一切都还不明朗之前就开始了。我们也在投资,虽然我会说我们有几个不同的方向。我们有我们的CPU方向,还有我们的GPU方向。

Ben Thompson:你们在与英特尔的竞争中已经相当忙了,所以我理解。

Lisa Su:我会以另一种方式表达,我们正处于AI的起点之一。让我感到好奇的是,当人们以短期、突发的视角看待技术时。技术并非一种短期突发的运动,而是一条长达十年的发展弧线,我们或许只走过了前18个月。从这个角度来看,我认为我们非常明确我们的方向和路线图。你之前提到的软件,显然我们深知如何让开发者的过渡变得极为简单。我们收购Xilinx的一大优势是,我们获得了一支由5000人组成的杰出团队,其中不乏优秀的软件人才,他们目前正努力使AMD的AI尽可能易于使用。

Ben Thompson:让我感到鲜明对比的是,Nvidia的一个非常聪明的举措是收购了Mellanox及其网络组合,这在将各种芯片结合使用时尤为重要,特别是在训练方面。

在您的Computex主题演讲中,您提到了新的Ultra Accelerator Link和Ultra Ethernet Link标准,以及将众多公司联合起来的想法,类似于早年数据中心的开放计算项目。这非常有道理,特别是考虑到Nvidia的专有解决方案与其其他产品一样具有高额利润。

但我猜这是我关于你们长期发展的问题——从克莱顿·克里斯滕森的理论角度来看,是否可以说,由于我们正处于AI的早期阶段,也许并不奇怪,更专有的集成解决方案在许多方面是最受欢迎的?有一点是,开放和模块化都很有意义,但可能在一段时间内还不足以实现。

Lisa Su:我的想法是这样的。展望五年后的市场,我认为是一个拥有多种解决方案的世界。我不相信一种解决方案能适用于所有场景。从这个角度来看,开放和模块化的美妙之处在于你能够——我不想在这里使用“定制”这个词,因为它们可能并不完全是定制的,但你能够量身打造。

Ben Thompson:广义上的定制。

Lisa Su:没错。

Ben Thompson:量身打造(Tailor)是个好词。

Lisa Su:量身打造是正确的词——你能够为不同的工作负载量身打造解决方案。我的信念是,没有一家公司能为每个可能的工作负载提供每个可能的解决方案。所以,我认为我们会以不同的方式达到这个目标。

顺便说一句,我坚信我们正在构建的这些大型GPU将在相当长一段时间内继续占据核心地位。是的,你需要整个网络系统和参考系统一起工作。我们所关注的重点是,所有这些部分都将纳入未来的参考架构中,所以我认为在架构方面这将非常重要。

我的观点是,没有一种方案适合所有人,因此模块化和开放性将允许生态系统在他们希望创新的地方进行创新。为超大规模数据中心1所需的解决方案可能与超大规模数据中心2或3的解决方案不同。

Ben Thompson:那么您认为在标准方法和“这是微软的方法”、“这是Meta的方法”之间的平衡在哪里?那里存在一些共性,但实际上也相当定制化,以满足他们的用例和需求。再次强调,不是明年,而是从长远来看。

Lisa Su:我认为当你展望未来三四年时,你会看到更多为不同工作负载量身打造的解决方案。而现在,我们正经历一个算法变化非常迅速的时期。到某个时候,会达到一个阶段,算法会“有点更稳定,更清晰”。在我们讨论的这种量级上,从成本和功耗的角度来看,可以获得显著的收益。现在人们谈论芯片效率和系统效率的重要性不亚于性能,出于所有这些原因,我认为会看到多种解决方案并存。

Ben Thompson:这是否对你们的x86业务构成了一个被低估的利好?您在主题演讲中提到,云中的大多数CPU已经超过五年的使用寿命,您还说“我们的一颗CPU可以替代五六个旧的CPU”。您是否认为——因为现在我觉得你们和英特尔的业务都面临很多担忧,所有的投资都流向了AI,没有人再购买CPU了。实际情况是,如果我们能从数据中心中淘汰一堆CPU,通过更换新的CPU来节省功耗?

Lisa Su:我认为这两种情况都是存在的。我认为数据中心的现代化是必须发生的。它会发生,另一个要点是——

Ben Thompson:它可能不会立即发生。

Lisa Su:不,并非如此。我认为我们看到的投资正在向现代化领域回归,但另一个非常重要的点是,尽管我们热爱GPU,这是未来的巨大增长驱动力,但并不是所有的工作负载都将转移到GPU上。你会有传统的工作负载,会有混合工作负载,我认为这是问题的关键点。在大型企业中有很多事情要做,我们的目标是确保我们在所有这些能力方面都有正确的解决方案。

Ben Thompson:你认为有多少推理将实际回归到CPU上?

Lisa Su:我认为相当多的推理将在CPU上完成,即使你考虑我们谈论的那些非常大的模型显然需要在GPU上运行,但有多少公司真的能负担得起使用最大的模型呢?所以,你现在已经可以看到,对于较小的模型,它们更适合于微调等任务,CPU完全能够胜任,特别是当走向边缘计算时。

与Nvidia竞争

Ben Thompson:在与Nvidia竞争方面,您在上次财报电话会议上提到MI300供应紧张,这是你们有史以来最快的产品增长,但或许对某些投资者的预期来说,年底的预测有些令人失望。您认为这种需求受限的转变有多少是因为MI325的推出,正如您本周所提到的,与Nvidia供应总体上升这一事实相比,因为大家都在努力应对这些问题?确实,你们的长期机会在于成为这种量身定制的供应商——而不是那种“随便选一家,只要有GPU就行”的供应商。您如何看待你们的需求曲线与竞争和该领域的快速进展之间的关系?

Lisa Su:再次强调,让我先明确一下我们的讨论范围。对AI计算的需求非常高,我认为没有人能够预测到这种需求,所以当我说供应链紧张时,这是可以预见的,因为没有人预料到你会在这个时间框架内需要这么多GPU。事实上,半导体行业在增加产能方面做得非常好,这正是我们所看到的。正如我们开始预测的那样——

Ben Thompson:所以您认为这主要是因为供应量大幅增加的原因?

Lisa Su:绝对是的,这是我们的工作。我们的工作是确保不受制造能力的限制。

Lisa Su:对我们来说,确保客户真正提升他们的工作负载非常重要,这需要我们与客户进行深入的合作和建立深厚的伙伴关系。所以,我对这里的机会感到非常满意。我们以前经历过类似的情况,就像我们最初进行数据中心服务器CPU扩展时一样,我们的客户与我们密切合作,他们优化他们的软件,然后添加新的工作负载,增加更多的量,我预计这里也会发生类似的情况。

AI的一个不同之处在于,我认为客户愿意承担更多的风险,因为他们希望尽快获得更多。

Ben Thompson:对于你来说,这是否是一个挑战,因为这种更愿意承担风险的需求意味着他们更愿意接受高利润率以获得领先的GPU或其他任何东西,或者是拥有最大开发者生态系统的GPU?

Lisa Su:我要说的是,我对我们在软件方面取得的进展感到非常满意。

Ben Thompson:是的。

Lisa Su:我们看到的是出色的开箱即用性能。事实上,很多开发者生态系统希望提升抽象层,因为每个人都希望有选择权。

Ben Thompson:您认为你们会达到这样一个阶段,即抽象层的提升是跨公司的一个通用层,而不是一个公司内部提升抽象层,这样他们可以购买任何CPU,但这对你们进入另一家公司并不一定有利,还是您认为这会是——

Lisa Su:我完全相信这将是整个行业的事情。像PyTorch这样的工具,我认为PyTorch的采用非常广泛,OpenAI的Triton也是类似的。这些是更大的行业趋势,坦率地说,部分原因是编程到底层硬件需要很长时间。每个人都希望快速创新,所以从快速创新的角度来看,抽象层是有益的。

Ben Thompson:你们传统上是TSMC新节点的第二波采用者,可能落后一年到一年半。你们是否感到有压力要晋升到最前沿?显然,相对于世界上的一些玩家,你们是一个相对较小的公司,220亿美元的规模令人印象深刻,但你们仍然需要考虑成本。还是说这是一个迫切的需要,让你们保持技术领先?

Lisa Su:我认为你会说我们在无晶圆厂的情况下,肯定是前五名之一,绝对的前沿技术是有帮助的。这不是我们考虑是否应该做的问题,我认为我们考虑的是从路线图的角度,比如我们谈到了每年推出新GPU的节奏。

Ben Thompson:不幸的是,你们在产品节奏上与Nvidia有些不同,这是否有点让人沮丧?

Lisa Su:不,一点也不。再次强调,对我来说重要的是,我们的路线图是基于我们认为可能实现的目标,以及我们认为客户想要和需要的东西。

Ben Thompson:像我这样的人总是喜欢谈论短期的直接对比,真是烦人。

Lisa Su:不,这并不烦人,只是需要背景信息,所有事情都需要背景信息。

Ben Thompson:AMD有可能与英特尔进行晶圆代工合作吗?

Lisa Su:我会说我们对目前的制造合作关系非常满意。

Ben Thompson:我想到,英特尔和AMD——这是技术史上最伟大的竞争之一,从一开始就存在。您是否觉得,当您退一步看这些对话时,您们实际上在某些方面是一体的,因为真正的敌人是Arm?

Lisa Su:你让Arm听起来像是敌人,但我并不认为Arm是敌人。首先,我想澄清一下。我们在整个产品组合中使用了Arm。我认为x86是一个非常优秀的架构,具备很多能力,但请不要把AMD看作只是一个x86公司,我们是一个计算公司,我们会为合适的工作负载使用合适的计算引擎。

关于我对半导体行业的看法——如果你看看今天的半导体行业,有些地方我们在竞争,但也有些地方我们在合作。所以关于你提到的英特尔,我们确实在某些领域竞争,但也在某些领域合作。英特尔是UALink联盟的成员,也是超以太网联盟的成员。

Ben Thompson:他们也对这种模块化和标准化非常感兴趣。

Lisa Su:我们赞同这种跨不同加速器的连接思路是个好主意。所以,我认为整个行业都是这样。我们在某些领域存在竞争,但也在某些方面开展合作。

Ben Thompson:您在服务器领域和数据中心的x86成绩显著,过去十年表现非凡。现在,就像有新的竞争对手出现,您准备好迎接新一轮的挑战了吗?

Lisa Su:这是下一阶段。我可以告诉你,在高性能计算领域,我们现在的位置非常出色,令人惊叹,并且激动人心。

Ben Thompson:您感到重新焕发活力,准备好迎接挑战了吗?

Lisa Su:绝对准备好了,而且远不止如此。

Ben Thompson:Lisa,非常感谢你。

Lisa Su:谢谢你。


--【本文完】---

近期受欢迎的文章:

  1. Meta:大规模AI基础设施

  2. 2024年OCP存储技术研讨会

  3. 超大容量SSD的兴起

  4. IEEE发布:存储介质技术路线图

  5. 内存技术引领计算架构重大变革



更多交流,可添加本人微信

(请附姓名/单位/关注领域

文章转载自Andy730,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论