您的位置 首页 科技

英伟达公布未来三年芯片路线图,AI工厂有了操作系统;黄仁勋:算力会继续增长,机器人时代已来

出品 | 搜狐科技作者 | 梁昌均一年一度的英伟达GTC大会最受关注的黄仁勋主题演讲环节,3月19日凌晨落下帷幕。在推迟了10分钟后,黄仁勋以标志性的黑色皮衣登上舞台。

出品 | 搜狐科技

作者 | 梁昌均

一年一度的英伟达GTC大会最受关注的黄仁勋主题演讲环节,3月19日凌晨落下帷幕。在推迟了10分钟后,黄仁勋以标志性的黑色皮衣登上舞台。

今年的GTC大会可能是黄仁勋近年来压力最大的一次。此前数年,深度学习和大模型浪潮的接踵而至,让英伟达成为这一波AI革命最大的赢家。

然而,AI技术发展范式的转变,尤其以DeepSeek为代表的技术创新,一度让市场对英伟达的算力信仰产生了怀疑。这次大会,无疑是黄仁勋向外界证明英伟达依然很能打的绝佳机会。

在两个多小时的演讲中,黄仁勋讲述了AI发展趋势及对算力带来的挑战与机会,再现经典名言:the more you buy,the more you save(买的越多、省的越多)。

更重要的是,他公布了英伟达的GPU芯片技术路线图,包括即将登场的Blackwell Ultra,以及后续两代的Rubin和Feynman。他还公布了多项企业级AI和物理AI等方面的进展。

“作为研究者,我们很开心见证历史,参与基础贡献。但作为初创企业,要时刻警惕,超前两年思考,什么是大厂做不好或做不了的方向,避免在大厂延长线上创新。”搜狐科技特约作者、Meta人工智能科学家许家骏在现场听完演讲后表示。

从资本市场反应来看,投资者似乎对英伟达的最新发布不太“感冒”。最近交易日,英伟达开盘走低,一度跌超4%,随着黄仁勋演讲开始有所走高,但收盘仍跌超3%。

代理AI和推理将推动算力增长,数据中心支出将达到1万亿美元

在演讲开始,黄仁勋对比了基于Blackwell架构的GeForce 5090芯片和RTX4090的进步。“它体积缩小了30%,能效散热提升30%,性能更是飞跃式提升,几乎无法相提并论。”

展开全文

这一切的驱动力在于人工智能。黄仁勋表示,过去十年间,AI的进步堪称惊人,最初是感知式AI(如计算机视觉和语音识别),随后是生成式AI、代理AI和物理AI。

“这彻底改变了计算模式,从传统的检索式计算转向生成式计算,计算领域的每一层都在过去几年经历了根本性变革。”黄仁勋表示。

英伟达公布未来三年芯片路线图,AI工厂有了操作系统;黄仁勋:算力会继续增长,机器人时代已来

黄仁勋认为,未来AI的发展需要解决三个基本问题。一是如何解决数据问题,因为AI是数据驱动。二是如何训练模型,让AI能够以超越人类的速度去学习扩展。三是如何实现算法等资源投入与智能提升的正向循环。

“去年,几乎整个世界都对此做出了错误的判断。AI计算的扩展更具弹性,实际上,由于代理AI和推理的原因,我们对计算的需求比去年这个时候我们以为需要的多100倍。”

黄仁勋解释称,代理AI的基础是推理,而推理使用的是思维链技术,因此产生的Token数量会显著增加。为了保持模型的响应性和交互性,计算需要更快。

此外,在训练过程中,数据有限,人类的参与也有限,但现在有了强化学习,有能力生成大量的Token,从而使用合成数据,这基本上是一种机器人式的方法。

“AI这两种方法的结合给整个行业带来了巨大的计算挑战。”黄仁勋表示,每次访问ChatGPT时需要等待越来越长的时间,这是一件好事,说明很多人在有效地使用它,而且训练和推理这些模型所需的计算量已经大幅增加。

换句话说,英伟达的芯片还有需求。一个有力的例证是,2024年全球前四云服务提供商共采购130万片Hopper架构芯片,而2025年它们又购买了360万Blackwell芯片。

黄仁勋提到,Blackwell刚开始出货,基础设施在惊人增长。“我预计到2028年数据中心的建设支出将达到1万亿美元,我相当确定会达到。”

英伟达公布未来三年芯片路线图,AI工厂有了操作系统;黄仁勋:算力会继续增长,机器人时代已来

这得益于两个判断。一是计算方式的转变,通用计算已经走到了尽头,世界正从由运行在通用计算机上的手工编写软件到运行在加速器和GPU上的机器学习软件的平台转变。二是行业都意识到软件的未来需要资本投资。

黄仁勋提到,这需要构建新的基础设施。“我称它们为AI工厂。世界正在经历的转变,不仅仅是将要建造的数据中心数量,还有它们的建造方式,数据中心的一切都将被加速。”

英伟达的CUDA生态则是这一切的基石。“我们加速了AI框架,我们称它们为CUDA-X库。”黄仁勋还宣布开源更多库(如稀疏求解器cuDSS),并介绍了面向光刻、量子、物理仿真等领域的库。

英伟达公布未来三年芯片路线图,AI工厂有了操作系统;黄仁勋:算力会继续增长,机器人时代已来

目前,全球600万开发者通过CUDA加速了900多个库,覆盖科学计算、医疗、通信、量子计算等领域。“如果没有CUDA,以及庞大的安装基础,这些库对于开发者来说将毫无用处。现在,我们已经达到了加速计算的临界点,CUDA使之成为可能。”黄仁勋说。

他还认为,AI正从云端走向边缘端,这将推动AI更广泛的应用。他宣布,英伟达与德国电信运营商T-Mobile、思科合作5G边缘AI栈,将AI注入通信网络,通过自适应信号优化和强化学习提升频谱效率,这可以彻底改变通信。

在自动驾驶领域,黄仁勋宣布,通用汽车(GM)选择英伟达为其打造全栈自动驾驶系统,涵盖训练、仿真和车载计算,同时帮助通用改变制造方式,“自动驾驶的时代已经到来”。

芯片路线图曝光,新架构Rubin和Feynman将在三年内发布

谈完AI,时间已过去大半,黄仁勋终于聊起市场最为关心的芯片进展。去年发布的Blackwell已经全面投产,黄仁勋称这实现了计算机架构的根本转变。

他花了不少篇幅介绍计算规模扩展的所要解决的挑战,比如如何将多个PGU进行连接从而扩展规模,以及如何解决宽带和通信问题,电力能源消耗和散热问题。

去年GTC大会推出的基于Blackwell架构的GB200系统,通过NVLink 72互联技术,实现单机架1 Exaflop(百亿亿次)算力,内存带宽达570 TB/s,较前代Hopper提升25倍能效。

这款超级计算机使用5000根电缆,长度累计接近2英里。“我们的目标是进行规模扩展。通过NVLink,我们已经完成了这种极端规模的扩展,前所未有。”黄仁勋说。

这种对规模的追求是由于巨大的需求。黄仁勋认为,AI推理系统中,存在两个关键指标(如下图所示):X轴代表吞吐量,是整个工厂每秒生成的Token总量;Y轴代表响应速度,是每个用户体验的Token生成速度。

英伟达公布未来三年芯片路线图,AI工厂有了操作系统;黄仁勋:算力会继续增长,机器人时代已来

黄仁勋认为,AI的智能程度与生成的Token数量直接相关,更多的Token意味着更深入的推理能力,但用户无法忍受过长的等待时间,这要求AI工厂在吞吐量与响应速度间找到最优平衡。“生成的Token越多,AI就越聪明。但回答问题的时间过长,用户就不会再回来。”

如何解决这两个挑战?“完美的答案在右上角。理想情况下,这条曲线应该是正方形,即每人每秒的Token生成速度尽可能快,直到达到工厂的极限。但没有工厂能做到这一点,因此这是一条曲线,目标是最大化曲线下的面积,即X和Y的乘积。”

黄仁勋表示,这两个维度分别意味着需要大量的计算能力(flops),以及大量的带宽和内存,并且要尽可能高,以及有最好的架构和尽可能高的能效,还必须拥有一个能够运行所有这些软件的编程模型。

黄仁勋宣布推出开源的英伟达Dynamo软件系统,号称是“AI工厂的操作系统”,可以解决计算系统当中并行处理、预批处理、负载管理、KV缓存等方面的问题。“Dynamo可以在模型进行规模化部署,从而为AI工厂实现降本增效。”

英伟达公布未来三年芯片路线图,AI工厂有了操作系统;黄仁勋:算力会继续增长,机器人时代已来

许家骏也认为,推理的重要程度毋庸置疑,Dynamo像OpenAI的Agent 一样,吃下了MLSys 开源科研很多成果,包括KV缓存以及各种并行、张量、数据等技术。

“能源工业革命是水进来,变成蒸汽,最后产生出了电,Dynamo将是新的AI革命一切的起点。”黄仁勋说。目前,英伟达已和Meta、微软、Perplexity等公司达成合作。

黄仁勋还展示了Dynamo能带来的对计算系统的提升,Blackwell相较Hopper能提升25倍,而在推理模型中的性能提升则高达40倍。他还打趣到,销售人员不要担心Hopper不好卖,并再次放话称“你买得越多,省得越多”。

英伟达公布未来三年芯片路线图,AI工厂有了操作系统;黄仁勋:算力会继续增长,机器人时代已来

“全世界的计算机公司都在大规模地加速购买这些了不起的机器,我非常高兴和感激,所有人都在向这个新架构转型。”黄仁勋宣布,今年下半年,英伟达将过渡到Blackwell Ultra NVL72,算力和内存再提升1.5倍,支持更大规模注意力机制。

英伟达公布未来三年芯片路线图,AI工厂有了操作系统;黄仁勋:算力会继续增长,机器人时代已来

他还展示了未来三年的技术路线图。下一代芯片命名为Vera Rubin,其主要是向暗物质研究先驱天文学家Vera Rubin致敬。2026年下半年,这款芯片将接替Blackwell Ultra,同时2027年下半年将推出Rubin Ultra版本,实现从NVLink 144互联到高达576的极端扩展。

Vera Rubin和Grace Blackwell类似,集成了CPU和GPU,其中Vera是CPU,Rubin是GPU。黄仁勋宣称,Rubin系统的性能可达Hopper的900倍,而Blackwell是Hopper的68倍。

英伟达公布未来三年芯片路线图,AI工厂有了操作系统;黄仁勋:算力会继续增长,机器人时代已来

Rubin之后的下一代芯片命名为Feynman,取自著名物理学家理查德・费曼(Richard Feynman)。根据英伟达路线图,Feynman架构芯片将于2028年登场,并会采用新一代互联技术。

当AI工厂不断拓展,传统网络架构将面临严峻挑战。黄仁勋还宣布,新的以太网芯片将在2025年下半年推出,2026年下半年推出集成硅子光学芯片,推出Photonics交换机系统和Spectrum-X网络架构,并在GPU存储加速方面和戴尔、惠普、IBM等达成合作。

未来将面临1500万工人的短缺,机器人有了牛顿物理引擎

最后,黄仁勋照例公布了企业级AI和物理AI方面的进展。

英伟达推出一系列开放推理人工智能模型,供开发者和企业构建代理式AI平台,Blackwell RTX专业版登陆工作站与服务器,赋能设计师、开发者、数据科学家及创意工作者构建并协同智能代理式AI。

黄仁勋还发布了DGX Spark和DGX Station两款个人AI计算机,其由Grace Blackwell支持,支持本地化运行万亿参数模型,面向科研与工业设计,将与惠普、联想、戴尔合作,并在今年量产。

“下一波浪潮也已经到来,机器人技术,它由物理AI驱动,用AI去理解物理世界。”黄仁勋说,机器人时代已经到来,能够与物理世界互动,这是机器人的优势。

他表示,世界正面临严重的人力短缺,到2023年世界将至少面临1500万工人的短缺,可能每年要付机器人5万美元让它们来上班,这将是一个非常大的产业,英伟达现在则在研发通用的机器人。

不过,这一次并没有声势浩大的机器人团队前来给黄仁勋“站台”。黄仁勋宣布,英伟达、谷歌、Disney Research将合作开发Newton Physics Engine(牛顿物理引擎),预计将于2025年稍晚完成开发。

他认为,这一物理引擎可以训练触觉反馈、精细动作技能和执行器控制,且是GPU加速驱动,以便可以以超线性、超实时的方式训练人工智能模型。这在Omniverse和Cosmos可以更好解决物理AI模型训练的问题。

英伟达公布未来三年芯片路线图,AI工厂有了操作系统;黄仁勋:算力会继续增长,机器人时代已来

采取这一引擎的机器人还走上舞台与黄仁勋互动,不过它现在还不会说话,但能听懂黄仁勋的指令。当黄仁勋对它说往旁边站站的时候,它乖乖执行了指令,摇头晃脑看起来很呆萌。

英伟达还宣布推出Isaac GR00T N1,这是一个通用型人形机器人的基础模型,建立在合成数据生成、学习和模拟的基础上,具有双系统架构,可以快速和慢速思考,该模型将会开源。

本文来自网络,不代表冰河马新闻网立场,转载请注明出处:http://d8v9s8.lcvt.cn/19331.html

作者: wczz1314

为您推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

联系我们

13000001211

在线咨询: QQ交谈

邮箱: email@wangzhan.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部