bifa·必发(唯一)中国官方网站

关于必发bifa官网 产品中心 柔性拖链电缆 高柔性屏蔽PUR护套拖链电缆 JKTRONIC-CP系列 高柔性PUR护套拖链电缆 JKTRONIC-P系列 高柔性双绞屏蔽拖链电缆 JKFLEX-800 CY(TP)系列 高柔性屏蔽拖链电缆 JKFLEX-800 CY系列 柔性数据线缆 柔性数据双绞屏蔽电缆 LIYCY(TP) 柔性数据屏蔽电缆 LIYCY 机器人电缆 机器人手臂弯曲扭转电缆 IRS05V2Q-H/IRS07V2QH/IRS03V2Q-H 机器人扭转拖链电缆 IRS05V2V2-H/IRS07V2V2-H/IRS03V2V2-H 伺服电缆 高柔性(屏蔽)PUR伺服拖链电缆 JK-SERV0 750P/750 CP 高柔性(屏蔽)伺服拖链电缆 JK-SERV0 720/720 CY 应用案例 新闻资讯 必发bifa官网 联系我们 bifa·必发(唯一)中国官方网站
您的位置: 首页 > 新闻资讯
必发bifa|千术光盘|900倍性能飙涨!英伟达放出算力猛兽黄仁勋GTC现场开炮
发布时间:2025-06-03    来源:必发bifa官网特种线缆

  智东西美国圣何塞3月18日现场报道ღ◈◈✿,顶着热烈的加州阳光ღ◈◈✿,一年一度的“AI春晚”英伟达GTC大会盛大开幕7790必发集团ღ◈◈✿,ღ◈◈✿。今日上午ღ◈◈✿,英伟达创始人兼CEO黄仁勋穿着闪亮的皮衣ღ◈◈✿,进行了一场激情澎湃的主题演讲ღ◈◈✿,一连亮出四代全新Blackwell Ultraღ◈◈✿、Rubinღ◈◈✿、Rubin Ultraღ◈◈✿、Feynman旗舰芯片ღ◈◈✿,公布四年三代GPU架构路线图ღ◈◈✿,还多次提到中国大模型DeepSeekღ◈◈✿。

  整场演讲信息量爆棚ღ◈◈✿,覆盖加速计算ღ◈◈✿、深度推理模型ღ◈◈✿、AI智能体ღ◈◈✿、物理AIღ◈◈✿、机器人技术ღ◈◈✿、自动驾驶等在内的AI下一个风口ღ◈◈✿,新发布涉及十大重点ღ◈◈✿:

  5ღ◈◈✿、个人AI超算ღ◈◈✿:推出全球最小AI超算DGX Sparkღ◈◈✿、高性能桌面级AI超算DGX Stationღ◈◈✿,方便开发者本地微调或推理深度思考模型ღ◈◈✿。

  8ღ◈◈✿、光电一体化封装网络交换机ღ◈◈✿:号称“世界上最先进的网络解决方案”ღ◈◈✿,可将AI工厂扩展到数百万块GPUღ◈◈✿。

  9ღ◈◈✿、物理AI/机器人ღ◈◈✿:开源Isaac GR00T N1人形机器人基础模型ღ◈◈✿,与迪士尼研究院ღ◈◈✿、谷歌DeepMind将合作开发开源物理引擎Newtonღ◈◈✿。

  10ღ◈◈✿、电信AI和自动驾驶ღ◈◈✿:与通用汽车一起为工厂和汽车构建GM AIღ◈◈✿,构建综合全栈自动驾驶安全系统NVIDIA Halosღ◈◈✿。

  值得一提的是ღ◈◈✿,英伟达宣布Blackwell GPU创下满血版DeepSeek-R1推理性能的世界纪录必发bifaღ◈◈✿。

  通过硬件和软件的结合ღ◈◈✿,英伟达自今年1月以来将DeepSeek-R1 671B模型的吞吐量提高了约36倍ღ◈◈✿,相当于每个token的成本改善了约32倍ღ◈◈✿。

  今年GTC人气火爆到史无前例ღ◈◈✿,万元起步的门票悉数售罄ღ◈◈✿,超过25000名观众齐聚现场ღ◈◈✿,几乎整座圣何塞都染上了“英伟达绿”ღ◈◈✿,从街巷ღ◈◈✿、集市ღ◈◈✿、高楼ღ◈◈✿、餐厅ღ◈◈✿、巴士到三轮车ღ◈◈✿,到处都是醒目的英伟达GTC标识ღ◈◈✿。

  还有一个彩蛋ღ◈◈✿,在黄仁勋主题演讲开始前ღ◈◈✿,SAP中心大屏幕上播放的5人对话暖场视频中必发bifaღ◈◈✿,画面最右边的正是前英特尔CEO帕特基辛格ღ◈◈✿,他的身份已经变成了Gloo董事长ღ◈◈✿。

  迪士尼机器人Blue作为黄仁勋主题演讲的惊喜嘉宾压轴出场ღ◈◈✿,摇头晃脑向黄仁勋撒娇卖萌ღ◈◈✿,还听从黄仁勋的指令ღ◈◈✿,乖乖站到了他的旁边ღ◈◈✿。

  此外ღ◈◈✿,本届GTC大会特设China AI Day – 云与互联网线上中文专场ღ◈◈✿,涵盖大模型ღ◈◈✿、数据科学ღ◈◈✿、搜推广等领域的前沿进展ღ◈◈✿,演讲企业包括字节跳动ღ◈◈✿、火山引擎ღ◈◈✿、阿里云ღ◈◈✿、百度ღ◈◈✿、蚂蚁集团ღ◈◈✿、京东ღ◈◈✿、美团ღ◈◈✿、快手ღ◈◈✿、百川智能ღ◈◈✿、赖耶科技ღ◈◈✿、Votee AIღ◈◈✿。

  上午9点59分ღ◈◈✿,黄仁勋闪现圣何塞SAP中心舞台ღ◈◈✿,朝不同方向的观众席连放5个冲天炮ღ◈◈✿,然后慢慢走下舞台ღ◈◈✿。

  在参会观众翘首等待11分钟后ღ◈◈✿,黄仁勋小步慢跑再度登场ღ◈◈✿,笑容满面地向全场观众打招呼ღ◈◈✿,还带观众云参观了下英伟达总部ღ◈◈✿。

  至于为什么要提前展示路线图?黄仁勋说ღ◈◈✿,构建AI工厂和AI基础设施需要数年的规划ღ◈◈✿,不像买笔记本电脑ღ◈◈✿,所以必须提前两三年制定土地ღ◈◈✿、电力ღ◈◈✿、资本支出的计划ღ◈◈✿。

  他公布了英伟达继Hopperღ◈◈✿、Blackwell之后的下一代GPU架构——Rubinღ◈◈✿。这一命名来自于发现暗物质的女性科学先驱薇拉鲁宾(Vera Rubin)ღ◈◈✿。

  在万众期待中ღ◈◈✿,英伟达新一代数据中心旗舰GPUBlackwell Ultra(GB300)正式登场ღ◈◈✿。

  Blackwell Ultra为AI推理时代而设计ღ◈◈✿,是全球首个288GB HBM3e GPUღ◈◈✿,像拼乐高一样通过先进封装技术将2块掩膜尺寸的GPU拼装在一起ღ◈◈✿,可实现多达1.5倍的FP4推理性能ღ◈◈✿,最高15PFLOPSღ◈◈✿。

  该GPU增强了训练和测试时推理扩展ღ◈◈✿,可轻松有效地进行预训练ღ◈◈✿、后训练以及深度思考(推理)模型的AI推理ღ◈◈✿,构建于Blackwell架构基础之上ღ◈◈✿,包括GB300 NVL72机架级解决方案和HGX B300 NVL16系统ღ◈◈✿。

  下一代模型可能包含数万亿参数ღ◈◈✿,可以使用张量并行基于工作负载进行任务分配ღ◈◈✿。如取模型切片在多块GPU上运行ღ◈◈✿、将Pipeline放在多块GPU上千术光盘ღ◈◈✿、将不同专家模型放在不同GPU上ღ◈◈✿,这就是MoE模型ღ◈◈✿。

  流水线并行ღ◈◈✿、张量并行ღ◈◈✿、专家并行的结合ღ◈◈✿,可以取决于模型ღ◈◈✿、工作量和环境ღ◈◈✿,然后改变计算机配置的方式ღ◈◈✿,以便获得最大吞吐量ღ◈◈✿,同时对低延迟ღ◈◈✿、吞吐量进行优化ღ◈◈✿。

  黄仁勋称ღ◈◈✿,NVL72的优势就在于每块GPU都可以完成上述任务ღ◈◈✿,NVLink可将所有GPU变成单个大型GPUღ◈◈✿。

  升级的GB300 NVL72设计ღ◈◈✿,提高了能效和可服务性ღ◈◈✿,通过降低成本和能耗来推进AI推理民主化ღ◈◈✿,相比Hopper将AI工厂的收入机会提高50倍ღ◈◈✿。

  与Hopper相比ღ◈◈✿,HGX B300 NVL16在大语言模型上的推理速度加快至11倍必发bifaღ◈◈✿,计算能力增加到7倍ღ◈◈✿,内存增至4倍ღ◈◈✿。

  英伟达将NVIDIA DGX SuperPOD称作“全球最先进的企业级AI基础设施”ღ◈◈✿,旨在为实时推理和训练提供强大的计算能力ღ◈◈✿。

  DGX SuperPOD提供FP4精度和更快的AI推理速度ღ◈◈✿,可扩展到数万块Grace Blackwell Ultra超级芯片ღ◈◈✿,预计将在今年晚些时候从合作伙伴处可获得ღ◈◈✿。

  与采用Hopper系统和38TB快内存构建的AI工厂相比ღ◈◈✿,DGX GB300系统可提供70倍的AI性能ღ◈◈✿。

  与上一代Hopper相比ღ◈◈✿,DGX B300系统可提供11倍的AI推理性能和4倍的AI训练加速ღ◈◈✿。

  企业正竞相建设可扩展的AI工厂ღ◈◈✿,以满足AI推理和推理时扩展的处理需求ღ◈◈✿。英伟达推出开源的AI推理软件NVIDIA Dynamoღ◈◈✿,其本质上就是AI工厂的操作系统ღ◈◈✿。

  Dynamo(发电机)的命名来源是ღ◈◈✿,发电机是开启上一次工业革命的第一台工具ღ◈◈✿,Dynamo也是现在一切开始的地方ღ◈◈✿。

  NVIDIA Dynamo是一个用于大规模服务推理模型的AI推理软件ღ◈◈✿,旨在为部署推理模型的AI工厂实现token收入最大化ღ◈◈✿。

  它能够跨数千个GPU编排和加速推理通信ღ◈◈✿,并使用分区分服务来分离不同GPU上大语言模型的处理和生成阶段ღ◈◈✿,使每个阶段可根据特定需求独立优化ღ◈◈✿,并确保GPU资源的最大利用率ღ◈◈✿。

  为了提高推理性能ღ◈◈✿,英伟达采用Blackwell NVL8设计ღ◈◈✿,之后又引入新的精度ღ◈◈✿,用更少的资源量化模型ღ◈◈✿。

  未来每个数据中心都会受到电力限制ღ◈◈✿,数据中心的收入与之挂钩ღ◈◈✿,因此英伟达用NVL72进行扩展ღ◈◈✿,打造更节能的数据中心ღ◈◈✿。

  在GPU数量相同的情况下ღ◈◈✿,Dynamo可将Hopper平台上运行Llama模型的AI工厂性能和收益翻倍ღ◈◈✿。在由GB200 NVL72机架组成的大型集群上运行DeepSeek-R1模型时ღ◈◈✿,Dynamo的智能推理优化也可将每个GPU生成的token数量提高30倍以上ღ◈◈✿。

  基于Dynamoღ◈◈✿,相比Hopperღ◈◈✿,Blackwell性能提升25倍ღ◈◈✿,可以基于均匀可互换的可编程架构ღ◈◈✿。在推理模型中ღ◈◈✿,Blackwell性能是Hopper的40倍ღ◈◈✿。

  黄仁勋说ღ◈◈✿:“这就是我以前为什么说ღ◈◈✿,当Blackwell批量发货时ღ◈◈✿,你不要把Hopper送人ღ◈◈✿。”他调侃自己是“首席收入官”必发bifaღ◈◈✿。

  “买得越多ღ◈◈✿,省得越多ღ◈◈✿,赚得越多ღ◈◈✿。”黄仁勋的经典带货名言又来了ღ◈◈✿,这次他特别强调AI工厂收入的提高ღ◈◈✿,100MW AI工厂会包含45000颗GPU Dieღ◈◈✿、1400个机架ღ◈◈✿、每秒生成3亿个tokenღ◈◈✿。

  为了提升推理性能ღ◈◈✿,NVIDIA Dynamo加入了一些功能ღ◈◈✿,使其能够提高吞吐量的同时降低成本ღ◈◈✿。

  它可以根据不断变化的请求数量和类型ღ◈◈✿,动态添加ღ◈◈✿、移除ღ◈◈✿、重新分配GPUღ◈◈✿,并精确定位大型集群中的特定GPUღ◈◈✿,从而更大限度地减少响应计算和路由查询ღ◈◈✿。

  它还可以将推理数据卸载到成本更低的显存和存储设备上ღ◈◈✿,并在需要时快速检索这些数据ღ◈◈✿,最大程度地降低推理成本ღ◈◈✿。

  Dynamo可将推理系统在处理过往请求时于显存中保存的知识(称为KV缓存)ღ◈◈✿,映射到潜在的数千块GPU中ღ◈◈✿。然后ღ◈◈✿,它会将新的推理请求路由到与所需信息匹配度最高的GPU上ღ◈◈✿,从而避免昂贵的重新计算ღ◈◈✿,并释放GPU来响应新的请求ღ◈◈✿。

  该软件完全开源并支持PyTorchღ◈◈✿、SGLangღ◈◈✿、NVIDIA TensorRT-LLM和vLLMღ◈◈✿,使企业ღ◈◈✿、初创公司和研究人员能够开发和优化在分离推理时部署AI模型的方法ღ◈◈✿。

  英伟达正为全球企业提供构建AI智能体的核心模块ღ◈◈✿,推动企业级AI技术的普及与创新ღ◈◈✿。英伟达的Llama Nemotron可以在任何地方运行ღ◈◈✿,包括DGX Sparkღ◈◈✿、DGX Station以及OEM制造的服务器上ღ◈◈✿,甚至可以将其集成到任何AI智能体框架中ღ◈◈✿。

  AT&T正在开发公司专用的的AI智能体系统ღ◈◈✿。未来ღ◈◈✿,英伟达不仅会雇佣ASIC设计师ღ◈◈✿,还会与Cadence合作ღ◈◈✿,引入数字ASIC设计师来优化芯片设计ღ◈◈✿。Cadence正在构建他们的AI智能体框架ღ◈◈✿,英伟达的模型ღ◈◈✿、NIM和库已经深度集成到他们的技术中ღ◈◈✿。Capital Oneღ◈◈✿、德勤ღ◈◈✿、纳斯达克ღ◈◈✿、SAPღ◈◈✿、ServiceNowღ◈◈✿、Accentureღ◈◈✿、Amdocs等企业也将英伟达技术深度融入AI框架中ღ◈◈✿。

  黄仁勋还宣布存储龙头们构建企业级AI数据平台ღ◈◈✿。原本企业的存储系统是基于召回的ღ◈◈✿,而如今的系统应该基于语义ღ◈◈✿。基于语义的存储系统时刻在嵌入原始数据ღ◈◈✿,用户使用数据时只需使用自然语言进行交互ღ◈◈✿,便能找到需要的数据ღ◈◈✿。

  NVIDIA DGX Spark和DGX Station是英伟达打造的个人AI计算机ღ◈◈✿,让开发者能在桌面上对大模型进行原型ღ◈◈✿、微调千术光盘ღ◈◈✿、推理ღ◈◈✿。

  DGX Spark可以被用来微调或推理最新的AI推理模型ღ◈◈✿,比如英伟达今天新发布的Cosmos推理世界基础模型和GR00T N1机器人基础模型ღ◈◈✿。该AI超算的预订今日起开放ღ◈◈✿。

  DGX Station是一款基于Blackwell Ultra的新型高性能桌面级超级计算机ღ◈◈✿,为桌面带来了数据中心级别的性能ღ◈◈✿,用于AI开发ღ◈◈✿,今年晚些时候可从英伟达制造合作伙伴处获得ღ◈◈✿。

  Blackwell系统构建于英伟达强大的开发工具生态系统ღ◈◈✿、CUDA-X库ღ◈◈✿、600多万开发者和4000多个应用的基础上ღ◈◈✿,可在数千块GPU上扩展性能ღ◈◈✿,非常适合运行新的Llama Nemotron推理模型ღ◈◈✿、AI-Q蓝图ღ◈◈✿、AI企业级软件平台ღ◈◈✿。

  黄仁勋说CUDA-X是GTC的全部意义所在ღ◈◈✿。他展示了一张自己最喜欢的幻灯片ღ◈◈✿,包含了英伟达构建的关于物理ღ◈◈✿、生物ღ◈◈✿、医学的AI框架ღ◈◈✿,包括加速计算库cuPyNumericღ◈◈✿、计算光刻库cuLithoღ◈◈✿,软件平台cuOPTღ◈◈✿、医学成像库Monaiearth-2ღ◈◈✿、加速量子计算的cuQuantumღ◈◈✿、稀疏直接求解器库cuDSSღ◈◈✿、开发者框架WARP等ღ◈◈✿。

  据他分享ღ◈◈✿,英伟达正在全面生产Blackwellღ◈◈✿,有十几家企业已生产和部署Blackwell系统ღ◈◈✿。

  2025年ღ◈◈✿,英伟达已经向美国前四大云服务提供商售出超过360万块Blackwell GPUღ◈◈✿,相比去年销售Hopper的数量高出3倍ღ◈◈✿,去年Hopper销售量为130万块ღ◈◈✿。

  3年前的英伟达GPU尚未将NVLink独立出来ღ◈◈✿,导致单一系统体积和重量惊人ღ◈◈✿,这代HGX系统8卡版本重达70磅ღ◈◈✿,黄仁勋称自己根本不可能将其举起展示ღ◈◈✿,而机架整体需要搭载4个8卡版本ღ◈◈✿。这极大影响了数据中心的能效和可扩展性ღ◈◈✿。

  于是ღ◈◈✿,英伟达决定将NVLink与GPU分离ღ◈◈✿,以单独的NVLink组件实现GPU间的全速通信ღ◈◈✿。

  原本的系统零件约有6万个ღ◈◈✿,而升级后的系统零件达到了60万个ღ◈◈✿,相当于20辆汽车的零件数量ღ◈◈✿。这一个机柜的算力就达到了1EFLOPSღ◈◈✿,由5000根线英里ღ◈◈✿。

  英伟达大费周章将二者分离的原因ღ◈◈✿,是为了实现极致的垂直扩展(Scale-Up)ღ◈◈✿,也就是扩展单一机柜的算力ღ◈◈✿。在目前的制造工艺限制下ღ◈◈✿,根本不可能造出单体包含130万亿颗晶体管的系统ღ◈◈✿。

  黄仁勋认为ღ◈◈✿,推理远没有想象中的那么简单ღ◈◈✿,需要做好成本与性能的完美平衡ღ◈◈✿,这一平衡直接影响了服务质量和盈利能力ღ◈◈✿。

  为了阐释推理中的诸多考量因素ღ◈◈✿,黄仁勋使用了一个坐标系ღ◈◈✿。x轴代表每秒生成的token数量ღ◈◈✿,Y轴代表系统的总吞吐量ღ◈◈✿。

  现场ღ◈◈✿,黄仁勋演示了DeepSeek-R1和Llama 3.3 70B的对比ღ◈◈✿。Llama这类非推理类模型虽然token用量更少ღ◈◈✿,但回答质量较低ღ◈◈✿,而耗费20倍tokenღ◈◈✿、150倍算力的推理模型ღ◈◈✿,能对复杂问题给出高质量的准确回答ღ◈◈✿。

  但如果生成的速度不理想ღ◈◈✿,也会影响用户使用服务的意愿ღ◈◈✿,因此每秒生成的token数量需要尽可能高ღ◈◈✿。数据中心还要尽可能地为更多用户提供服务ღ◈◈✿,这样才能最大化收益ღ◈◈✿。

  英伟达今天还发布了RTX Pro Blackwell系列工作站和服务器GPUღ◈◈✿,提供加速计算ღ◈◈✿、AI推理ღ◈◈✿、光线追踪和神经网络渲染技术ღ◈◈✿,使其数据中心GPU从桌面到移动工作站提供动力ღ◈◈✿。

  工作站和服务器GPU内存高达96GB必发bifaღ◈◈✿,笔记本电脑GPU内存达到24GBღ◈◈✿,使应用程序可更快运行ღ◈◈✿,并使用更大更复杂的数据集ღ◈◈✿。

  RTX PRO 6000数据中心和桌面GPU可将单GPU安全分区成最多4个实例ღ◈◈✿,5000系列桌面GPU可将单GPU安全分区成两个实例ღ◈◈✿。

  1ღ◈◈✿、数据中心GPUღ◈◈✿:RTX PRO 6000 Blackwell服务器版ღ◈◈✿,采用被动冷却热设计ღ◈◈✿,每台服务器最多可配置8块GPUღ◈◈✿,可与NVIDIA vGPU软件结合为虚拟化环境中的AI工作负载提供动力ღ◈◈✿,预计将在今年下半年推出ღ◈◈✿。

  新笔记本电脑GPU还支持最新NVIDIA Blackwell Max-Q技术ღ◈◈✿,可智能且持续地优化笔记本电脑性能和能效ღ◈◈✿。

  随着AI工厂发展到前所未有的规模ღ◈◈✿,AI网络基础设施也必须升级ღ◈◈✿。英伟达将其光交换机称作“世界上最先进的网络解决方案”ღ◈◈✿。

  英伟达今日发布全新共封装(CPO)的NVIDIA Spectrum-X和Quantum-X硅光网络交换机ღ◈◈✿,可将AI工厂扩展到数百万个GPUღ◈◈✿。

  与传统方法相比ღ◈◈✿,英伟达光交换机集成了光学创新ღ◈◈✿,将激光器减少至1/4ღ◈◈✿,每端口1.6Tb/sღ◈◈✿,可提供3.5倍的能效ღ◈◈✿、63倍的信号完整性ღ◈◈✿、10倍的大规模网络弹性ღ◈◈✿、1.3倍快的部署时间ღ◈◈✿。

  黄仁勋谈道ღ◈◈✿,英伟达希望将以太网的水平提升至InfiniBand级别ღ◈◈✿,这意味着更极致的拥塞控制ღ◈◈✿、延迟控制ღ◈◈✿。

  相较传统以太网ღ◈◈✿,Spectrum-X以太网网络平台可为多租户ღ◈◈✿、超大规模AI工厂提供1.6倍的带宽密度ღ◈◈✿。

  Quantum-X光交换机预计将在今年晚些时候上市ღ◈◈✿,提供144个基于200Gb/s SerDes的800Gb/s InfiniBand端口ღ◈◈✿,并采用液冷设计对板载硅光器件进行高效散热ღ◈◈✿。其AI计算网的速度是上一代产品的2倍ღ◈◈✿,扩展性是上一代产品的5倍ღ◈◈✿。

  该系统搭载Quantum-X800 ASIC芯片ღ◈◈✿,并配备6个光学子组件和18个硅光芯片引擎ღ◈◈✿。

  324个光学连接器串联起这一系统ღ◈◈✿,总计有36个激光输入和288个数据连接ღ◈◈✿,内置光纤管理功能ღ◈◈✿。

  每个硅光芯片引擎拥有200GB/s的微光调制器ღ◈◈✿,总吞吐量为1.6Tb/sღ◈◈✿,实现3.5倍节能ღ◈◈✿。

  台积电的硅光子解决方案结合了其在先进芯片制造和台积电SoIC 3D芯片堆叠方面的优势ღ◈◈✿,帮助英伟达释放AI国产扩展到百万GPU甚至更多ღ◈◈✿。

  黄仁勋做了一个换算ღ◈◈✿,这一系统的应用能在单个数据中心中节省数十个Megawatts的能源ღ◈◈✿,而60Megawatts就相当于10台Rubin Ultra机架的能耗ღ◈◈✿。

  物理AI正在改变价值50万亿美元的行业ღ◈◈✿,在英伟达三台计算机上构建数十亿个机器人ღ◈◈✿。英伟达将机器人视作下一个数万亿美元产业ღ◈◈✿。

  黄仁勋宣布推出开源ღ◈◈✿、预训练bf88必官网登入口ღ◈◈✿。ღ◈◈✿、可定制的Isaac GR00T N1人形机器人基础模型ღ◈◈✿,旨在加快人形机器人的开发ღ◈◈✿,已提前获得该模型的公司包括波士顿动力ღ◈◈✿、Agility Roboticsღ◈◈✿、Mentee Roboticsღ◈◈✿、Neura Robotics等ღ◈◈✿。

  黄仁勋谈道ღ◈◈✿,物理AI和机器人技术发展得很快ღ◈◈✿,但也面临着和大模型同样的挑战ღ◈◈✿,就是如何获得数据ღ◈◈✿、如何扩展让机器人更聪明ღ◈◈✿。

  一是扩展AI的生成能力和理解物理世界的生成模型ღ◈◈✿,也就是Cosmosღ◈◈✿。Cosmos可以生成无限数量的环境数据ღ◈◈✿。

  二是ღ◈◈✿,机器人的可验证回报是物理定律ღ◈◈✿,因此需要设计用于模拟真实世界中的物理现象的物理引擎ღ◈◈✿。这一物理引擎需要被设计用于训练触觉反馈ღ◈◈✿、精细运动技能和执行器控制ღ◈◈✿。也就是上面迪士尼机器人Blue已经搭载的物理引擎ღ◈◈✿。

  在机器人开发中ღ◈◈✿,英伟达Omniverse可以生成大量不同的合成数据ღ◈◈✿,开发人员根据不同领域聚合现实世界的传感器和演示数据ღ◈◈✿,将原始捕获的数据乘以大量照片级的多样化数据ღ◈◈✿,然后使用Isaac Lab增强数据集对机器人策略进行后训练ღ◈◈✿,让其通过模型放行为学习新技能ღ◈◈✿。

  实地测试中ღ◈◈✿,开发人员使用Omniverse动态模拟真实环境进行测试ღ◈◈✿。现实世界的操作需要多个机器人协同工作ღ◈◈✿,Mega和Omniverse允许开发人员大规模测试ღ◈◈✿。

  要将加速计算带到真实世界的每一个场景之中ღ◈◈✿,不仅需要芯片和CUDA这样的库ღ◈◈✿,还需要为每个场景建立对应的软件栈——如企业ღ◈◈✿、工厂ღ◈◈✿、机器人ღ◈◈✿、GPU云等应用场景ღ◈◈✿。

  英伟达认为AI将对电信行业产生深远影响ღ◈◈✿,6G网络进入倒计时ღ◈◈✿,下一个时代将是AI原生无线网络ღ◈◈✿,包括用于无线电信号处理的AI/MLღ◈◈✿、神经网络模型ღ◈◈✿。这将释放频谱效率的巨大收益ღ◈◈✿。

  现场ღ◈◈✿,黄仁勋宣布英伟达与Ciscoღ◈◈✿、T-Mobile等几家志同道合的电信龙头合作ღ◈◈✿,建立由AI驱动的电信系统ღ◈◈✿,为6G开发AI原生无线网络ღ◈◈✿,以NVIDIA AI Aerial平台为基础ღ◈◈✿,确保下一代无线网络将是AI原生的ღ◈◈✿。

  其目标是研究和开发一个AI原生ღ◈◈✿、高光谱效率ღ◈◈✿、开放和差异化的6G无线平台ღ◈◈✿,在频谱效率ღ◈◈✿、电源效率ღ◈◈✿、运营效率ღ◈◈✿、安全性ღ◈◈✿、成本效益ღ◈◈✿、创收机会方面设置新基准ღ◈◈✿,可用于全球部署ღ◈◈✿。

  他回忆道ღ◈◈✿,当初AlexNet的出现ღ◈◈✿,让英伟达决定开始研究自动驾驶技术ღ◈◈✿,一转眼10年已逝ღ◈◈✿,如今英伟达的产品几乎出现在所有自动驾驶汽车之中ღ◈◈✿。

  黄仁勋宣布ღ◈◈✿,通用汽车将会成为英伟达最新的合作伙伴ღ◈◈✿,在生产ღ◈◈✿、设计ღ◈◈✿、模拟和车机中应用英伟达的AI技术ღ◈◈✿。英伟达和通用汽车将协力为工厂和汽车构建GM AIღ◈◈✿。

  对此ღ◈◈✿,英伟达发布综合全栈自动驾驶安全系统NVIDIA Halosღ◈◈✿。英伟达自动驾驶技术的全栈代码将交由第三方进行安全检验千术光盘千术光盘ღ◈◈✿,确保这些技术能充分反映现实世界的多元性ღ◈◈✿。

  英伟达的自动驾驶模型采用蒸馏技术开发ღ◈◈✿、表现较好但速度较慢的模型会逐渐将知识传递给表现尚未完善千术光盘ღ◈◈✿、但速度较快的模型ღ◈◈✿。此外ღ◈◈✿,有大量数据被转换成了3D场景ღ◈◈✿,可用于虚拟环境中的模拟ღ◈◈✿。

  如今ღ◈◈✿,在英伟达Omniverse和Cosmos中ღ◈◈✿,自动驾驶模型能从变化中学习并自我改进ღ◈◈✿。Cosmos能根据图像建立现实世界的4D模型(包含图像分割)ღ◈◈✿,并通过计算机模拟同一场景的不同状况ღ◈◈✿,比如雨天ღ◈◈✿、雪天ღ◈◈✿、夜晚等等ღ◈◈✿,这将进一步提升自动驾驶模型的能力ღ◈◈✿。

  例如ღ◈◈✿,在下方案例中ღ◈◈✿,用户输入了一则指令88bifa (中国区)官方网站ღ◈◈✿,ღ◈◈✿,要求模型生成冬季城市环境中ღ◈◈✿,一辆汽车打开雨刮器ღ◈◈✿,左转时的画面ღ◈◈✿。在经过推理后ღ◈◈✿,模型生成的画面极为逼真ღ◈◈✿,能作为高质量数据加到自动驾驶模型训练过程中ღ◈◈✿。

  黄仁勋回顾说ღ◈◈✿,在开始研究GeForce 25年后ღ◈◈✿,GeForce已经在全球范围内售罄ღ◈◈✿。GeForce将支持AI的CUDA带向世界ღ◈◈✿,现在AI彻底改变了计算机图形学ღ◈◈✿。

  AI在10年间已经取得了巨大进步ღ◈◈✿。2023年的重大突破是AI智能体(AI Agents)ღ◈◈✿,AI智能体可以对如何回答或者解决问题进行推理ღ◈◈✿、在任务中进行规划ღ◈◈✿、理解多模态信息ღ◈◈✿、从网站中的视频中学习等ღ◈◈✿,然后通过这些学到的学习来执行任务ღ◈◈✿。

  下一波浪潮是物理AIღ◈◈✿,可以理解摩擦ღ◈◈✿、惯性和因果关系ღ◈◈✿,使机器人技术成为可能ღ◈◈✿,开辟出新的市场机会ღ◈◈✿。

  关于AI智能体和物理AI有几个核心问题ღ◈◈✿:一是如何解决数据问题ღ◈◈✿,AI需要数据驱动ღ◈◈✿,需要数据来学习千术光盘ღ◈◈✿、获得知识ღ◈◈✿;二是如何解决训练问题ღ◈◈✿,AI需要以超人的速度ღ◈◈✿、以人类无法达到的规模进行学习ღ◈◈✿;三是如何扩展实现Scaling Lawღ◈◈✿,如何找到一种算法让AI更聪明ღ◈◈✿。

  首先从AI可以做什么开始ღ◈◈✿,AI可以逐步分解问题ღ◈◈✿、以不同方式解决同样问题ღ◈◈✿、为答案进行一致性检查等ღ◈◈✿。

  当AI基于思维链进行一步步推理ღ◈◈✿、进行不同的路径规划时ღ◈◈✿,其不是生成一个token或一个单词ღ◈◈✿,而是生成一个表示推理步骤的单词序列ღ◈◈✿,因此生成的token数量会更多ღ◈◈✿,甚至增加100倍以上ღ◈◈✿。

  三大AI Scaling Laws(预训练ღ◈◈✿、后训练ღ◈◈✿、测试时)对计算提出指数级需求ღ◈◈✿。随着计算成本增加ღ◈◈✿,需要全栈创新来降低成本/tokensღ◈◈✿。

  黄仁勋解释说ღ◈◈✿,模型更复杂ღ◈◈✿,生成的token多10倍ღ◈◈✿,为了保证模型的响应性和交互性ღ◈◈✿,因此计算速度必须提高10倍ღ◈◈✿。

  其次是关于如何教AIღ◈◈✿。教会AI如何推理的两个基本问题是数据从哪里来ღ◈◈✿、如何不受限制学习ღ◈◈✿,答案就是强化学习ღ◈◈✿。

  人类历史上已经明确了二次方程的解法ღ◈◈✿、数独ღ◈◈✿、勾股定理等诸多知识ღ◈◈✿,基于数百个这样的案例可以生成数百万个例子让AI去解决ღ◈◈✿,然后使用强化学习来奖励ღ◈◈✿。这个过程中ღ◈◈✿,AI需要处理数百万个不同问题ღ◈◈✿、进行数百次尝试ღ◈◈✿,而每一次尝试都会生成数万个tokenღ◈◈✿,这些都加到一起ღ◈◈✿,就会达到数万亿个tokenღ◈◈✿。

  AI变得更聪明ღ◈◈✿,使得训练这些模型所需的计算量大幅增长ღ◈◈✿。黄仁勋预计2030年末ღ◈◈✿,数据中心建设支出将达到1万亿美元ღ◈◈✿。

  这背后的第一个动态变化是ღ◈◈✿,通用计算已经用完ღ◈◈✿,业界需要新的计算方式ღ◈◈✿,世界将经历手动编码软件到机器学习软件的平台转变ღ◈◈✿。

  第二个变化是ღ◈◈✿,人们越来越认识到软件的未来需要大量投资ღ◈◈✿。这是因为计算机已经成为token的生成器ღ◈◈✿,基于生成式的计算构建AI工厂ღ◈◈✿,然后在AI工厂里生成tokens并重组为音乐ღ◈◈✿、文字ღ◈◈✿、视频必发bifaღ◈◈✿、化学品等各种类型的信息ღ◈◈✿。

  作为AI行业风向标ღ◈◈✿,英伟达GTC 2025大会将举办超过1000场会议ღ◈◈✿、汇聚2000名演讲嘉宾和近400家参展商ღ◈◈✿,涵盖大语言模型必发bifaღ◈◈✿、物理AIღ◈◈✿、云计算ღ◈◈✿、科学发现ღ◈◈✿、气候研究ღ◈◈✿、医疗健康ღ◈◈✿、网络安全ღ◈◈✿、人形机器人ღ◈◈✿、自动驾驶等主题ღ◈◈✿,并将举办首届量子日ღ◈◈✿,将汇集全球量子计算界和业内重要人物ღ◈◈✿,与黄仁勋共同探讨量子计算的现状和未来ღ◈◈✿。

  现场参会者还能体验各种精心策划的活动ღ◈◈✿,包括数十场覆盖各个行业的演示ღ◈◈✿、实战培训ღ◈◈✿、自动驾驶汽车展览和试驾ღ◈◈✿,还有集结20家当地供应商和手艺人制作的小吃和商品的GTC夜市ღ◈◈✿,盲猜一波酷爱逛夜市的黄仁勋会惊喜现身ღ◈◈✿。

640 (9)






bifa·必发(唯一)中国官方网站|http://www.wlipfs.com