博客

英伟达最新尝试3种液冷方案?附英伟达发布Rubin CPX GPU

英伟达最新尝试3种液冷方案?附英伟达发布Rubin CPX GPU


 
1)NV最新尝试3种液冷方案:1-芯片直刻微通道;2-微通道盖板;3-液体喷射。
2)目前3种方案都在测试中,且微通道方案壁垒较高,是把冷却“直接做到芯片盖板上”,通过在盖板内加工微小流道,让冷却液几乎贴身带走 GPU 热量。它比传统冷板更高效、更紧凑。技术难度显著提升,一方面制造工艺复杂:在薄盖板上蚀刻/加工微通道,需要高精度制造和可靠性验证;另一方面,封装和密封:液体密封必须高度可靠,防止渗漏。价值量相较于传统冷板有望提升3-4倍。
3)Rubin 功率大幅提升(从设计之初的1800W提升到2300W, 产业链可验证),而方案2非常适合未来Rubin这种千瓦级GPU,有望超预期地在2026年下半年规模应用在Ruibn机柜的Compute tray(其他地方仍用液冷板)。
 
1、节能+高密是液冷走向必选的底层驱动。2025-2030年全球机柜的功耗密度呈现非线性扩张,叠加主要算力节点的PUE值要求不断严格带来液冷从可选走向必选。根据维谛预测,未来预计每年新增超过1000个大于100KW的机架,截至2025年底,数据中心装机总量达到 54GW,预计2026年达到74GW(CAGR13.7%)。随着液冷服务器出货量提升。预计  2030 年液冷服务器渗透率能达到35%,目前约为10%。各业主包括总包商对冷却方案升级的产业需求共识强烈。
2、液冷并非一蹴而就、磁悬浮+混合制冷可能成3-4年内主流。多种供冷方式协同,共同解决差异化的需求可能是中短期落地最快是技术路径。我们观察到磁悬浮压缩机可能会同步向风冷+液冷场景渗透。风冷角度主流技术路线正在增加预冷和补冷,以强化能效。液冷方向,冷却水低温化+温差缩小,对压缩机的需求和要求提升。因此磁悬浮压缩机正在成为制冷环节中的关键核心装备。核心供应商丹佛斯产能紧张,关注国产标的汉钟精机、磁谷科技、冰轮环境。
3、零部件角度、散热模组技术路线仍较多,关注3D打印应用。散热模组的效率提升和结构优化,包括微通道加工、仿生设计创新已经成为产业趋势。3D打印的加工精度较高,定制化能力强,能较好的满足对微通道加工的新需求。目前3D打印技术路线比较多,产业链基本上在送样试验的阶段,未来的空间广阔。核心关注南风股份、江顺科技等。
 
Rubin方案:
1、Ruby方案电源架构演化
·电源架构升级方向:Ruby方案电源架构的演进逻辑主要围绕模块化与系统升级展开。原计划2026年年底,柔丙这一代电源架构批量使用。首先是Power Shift模块化调整,将电源从整机柜中取出变为塞卡,通过边柜为IT柜供电,形成新的供电服务模式。电源系统的核心升级包含三大要点:其一为电源提纯,在2025年已量产的300整机柜中,通过增加超级电容BBU等容性电路强化,提升了电源的纯度保障;其二为电源密度提升,需在原有2SH基础上实现功耗翻倍以上的提高,这要求电源转换技术与电力电子集成度进一步提升;其三为高压直流技术落地,将直流电压提升至800伏以上,解决了该技术虽出现早但长期未商用的问题,当前因英伟达牵引及北美CSP厂家跟进,高压直流技术将实现较大规模商用。此外,液冷系统集成成为重要趋势,过去两年关于风冷与液冷投资收益比的讨论已无必要,未来将全面采用液冷系统,作为边柜的关键元素集成其中,以提升IT柜的绿电回收能力及供电保障(包括功率供应的密度、功耗及纯度保障)。
2、主柜材料替代与封装技术
·基板向PCB替代背景:基板(如ABF等材料)成本高、制造繁琐、交付周期长,且要求高、封装层级多,一度影响英伟达IT柜竞争力。现阶段,英伟达需提升芯片、IT柜及未来Pod等全链条竞争力,因此亟需变革基板相关技术。PCB替代基板并非新技术,日月光20年前就已开始研究,近半年验证加速,即将商用。其背景是英伟达先进制程需求无法满足,芯片迭代快但制程改善不足,且行业面临摩尔定律失效问题,无法实现每隔18个月硬件性能翻倍。在此背景下,封装技术成为关键,可弥补晶体管数量不足,基板封装就是其中一种方式。PCB替代基板有一定门槛,若能解决,可减少芯片封装受摩尔定律的制约,加快主柜出货及上量节奏,带动边柜供应商技术需求和出货量增加。
3、M8/M9材料选择与技术验证
·M8/M9技术特性对比:M8与M9在技术特性上差异明显。M8包含M7+、M8、M8+等层级,可用于服务器(co-opt场景)及交换机单板;M9因工艺瓶颈(如MSAP工艺难度大)尚未量产。从应用与成本看,M8材料成本低于基板,过英伟达认证即可推广,服务器co-opt场景中,原有整机柜相关内容可在M8板子上形成。信号传输上,M8要应对高速信号(数百Gbps)挑战,线宽缩至25 40微米(传统10mil约200微米)、线间距30微米,两条高速信号间距短会产生寄生电感和电容。若M8能克服问题,无需升级至M9;反之则可能需换方案。
·市场传言背景与验证进展:市场“不用M9”传言源于对M8工艺难题的误解。M8的MSAP工艺加工难,被部分人误解为M9淘汰,实际M9未被排除。验证需通过系统测试(单体测试OK但系统互联互通可能不稳定),以系统表现稳定性(如鲁棒性)为批量通过依据。近一个月聚焦系统测试,验证持续进行以确认M8鲁棒性。目前未确定是否用M9,英伟达更关注产品可靠度,若M8满足需求则优先使用。
·材料性能对信号的影响:高速信号对PCB载板材料性能要求高。传统PCB高速信号线宽10mil(约200微米),co-opt技术要求线宽缩至25 40微米、线间距30微米。材料热膨胀系数是关键,热膨胀会破坏线宽和线间距均匀性,干扰高速信号传输。co-opt工艺中,芯片通过背板焊接技术直接mount到板上,优化了散热和膨胀问题,但材料散热系数和热膨胀系数仍是解决信号稳定性的核心。低膨胀系数、高散热材料在co-opt工艺中表现更优,是确保高速信号链路稳定的关键。
4、CoWoS技术与材料要求
·CoWoS-P的材料需求:在CoWoS升级工艺中,对更高阶材料提出了更高要求,例如需要更好的树脂、电子布(如Q布)等,目前多种方案处于平行测试阶段。材料开发方面,存在较多NDA(保密协议)合作模式,多方联合开发并需投入资金,其中暗藏竞争力。此前CoWoS-L技术完成后,当前推进的CoWoS-P技术已由台湾公司验证可行有效。
·英伟达与大陆公司策略差异:英伟达追求AI算力芯片领先,封装技术围绕芯片竞争力服务。因芯片领先受制于IC工艺和台积电集成能力,英伟达依赖台湾封装公司(如日月光、SE)解决封装技术痛点,双方无缝沟通明确芯片需求与挑战。大陆公司为切入英伟达供应链,多采取‘Attractive动作’,开发新技术(如M8/M9材料、24层以上白板),通过技术先进性争取英伟达认证。英伟达材料选择以保障芯片竞争力为首:若某工艺能形成可靠板卡,相关材料(如M8、M9)将固化为量产版本;系统鲁棒性依赖批量供货的一致性,M9未必优于M8,技术先进性若无工艺良率与一致性支撑,难产生实际收益。
5、CoWoS量产时间与材料瓶颈
·量产时间节点:CoWoS作为先进封装技术,适配2纳米工艺芯片。因2纳米工艺管子数不足,需采用chip on wafer叠加工艺。关于量产时间,该工艺成熟度与新芯片成熟度可匹配,预计2026年中能赶上发布。Ruby芯片计划2026年6月发货,后续需3 6个月进行子系统到系统的集成测试,此阶段为客户批量生产预留时间。
·M9交期与材料瓶颈:M8在6 7阶HBI工艺中表现良好,产业成熟度较高,能满足需求;M9虽参数更优,但批量应用存在不确定性。M9劣势在于材料要求高、可获得性差,生产所需设备与M8不同。此外,M9板材交期极长,仅能支持实验需求,采用M9可能出现芯片完成但PCB未就绪的情况,影响交付进度。
6、Ruby升级版(Ruby H)规划
·集成度提升目标:英伟达发展从卖芯片,到显卡、服务器、交换机及含NV link等总线技术的系统,再到整机柜(含主柜与边柜供电),最终目标是提供高集成度Pod。Ruby H规划是将整机柜升级为Pod,向客户提供计算与电源Pod,客户仅需供电就能使用算力。封装工艺上,从通过substrate打孔互联过渡到将芯片背板直贴PCB板,缩短距离以降低功耗、提高集成度。未来若进一步提升集成度,或需用类似谷歌的晶圆互联技术实现芯片互联。
·材料选择的不确定性:Ruby H是否用M9材料未确定,M9仅在验证阶段。当前技术验证重点是cowop工艺承载能力,即验证该工艺可承载的DIE和HBM数量。
7、液冷与电源技术趋势
·液冷技术路线选择:在液冷技术路线选择上,浸模式液冷中,硅油方案比氟化液更优。硅油可获得性强,近5年技术进步快,早期其介电常数、电场等参数不佳,经产业链驱动改进,技术渐趋成熟,且具性价比,是未来方向。冷板式液冷供应链成熟,冷板材料可通过分布式调节、分块设计渐进调优,属性能改善非革命性变化。此外,液冷系统密封性有痛点,英伟达GB200曾漏液,为技术改进提供机会。
·电源技术竞争格局:电源技术竞争格局方面,英伟达追求电源高效率与可靠性。电源分服务器内电源和高压直流电源,因其影响电力转换算力效率,且曾出现电源问题,英伟达要求严苛。小厂在英伟达供应链弯道超车机会小,因技术平台能力不足,难满足硬科技要求,甚至无法跟踪技术发展。而CSP厂商电源需求除性能外,或更注重降本与定制化,或为小厂提供代工机会。
Q&A
Q: 提及的明年年中批量使用Ruby一代前的小批量或过渡性订单具体指什么?年底会出的部分具体含义是什么?
A: 年底会出的部分指英伟达的柜子方案或整机过塞卡方案,该方案需搭配Ruby一代芯片。当前CSP厂家在进行等级柜与白河验证,其中一家使用英伟达G300芯片及自研H芯片制成冰柜并明确使用,已开始发货并准备冰柜内三样东西的备料,该案例先于英伟达进行市场释放。
Q: 该方案对后期英伟达及其他厂商明年主流批量订单是否具有启发意义?方案中确定的材料、方式、工艺对后续影响如何?
A: CSP厂商与英伟达的目标存在差异,CSP厂商更注重通过项目验证先进架构以追求技术领先性,并希望形成技术联盟或白皮书以获得市场认同;英伟达则更关注技术领先性与批量供货能力,通过批量订单获取明确市场反馈。CSP厂商新方案的小批量落地及验证本身是对行业技术的总结,具有一定行业影响。
Q: 明年英伟达的方案是否会考虑CSP厂的方案?双方方案是否会相互影响?
A: 判断不会考虑。双方方案一定会在标准上形成差异,但技术演化的先进性会得到继承。
Q: Ruby方案未来在应用中M8与M9的使用场景及对应材料如何?
A: M8与M9均属于HDI多层板,主要应用于AI服务器与交换机的交换单板及服务器领域,涉及的层级包括M7+、M8、M8+等类型。当前M9存在技术瓶颈,暂无法量产。对于24层以上的PCB,核心要求是通过英伟达认证,使用M8或M7+、M8+等规格的板材需满足该认证条件。在服务器场景中,M8已应用于co-WAP、PB及整机柜GB200等产品,其材料成本显著低于基板,且在通过英伟达CUDA认证的前提下可广泛使用。
Q: 目前是否可判断未来英伟达产品的材料搭配方式及比例?
A: 目前尚未确定未来材料搭配方式及比例。英伟达当前重点是确保产品可靠度,若仅需安装板材,使用M8即可。
Q: 市场传闻已确定不采用M8而采用M9的背景及误解来源是什么?
A: M8涉及MSAP工艺,其加工难度大;M9同样存在工艺难度。CO-OP的核心诉求是解决高速信号问题:传统FR4材质PCB在高速率下,视频信号线宽通常为10mil,射频信号线宽9mil以上;而需在PCB上直接加强衬底时,要求视频信号线宽25-40微米,两条信号间距约30微米。挑战在于高速信号线宽窄、间距近会形成电磁场,导致互感互容并产生寄生电感和电容,这是PCB面临的关键问题。若M8能通过MSAP工艺解决寄生干扰问题则无需采用M9;若无法解决,则需采用M9。最终是否采用M8或M9,取决于能否在PCB上克服高速信号窄线宽、近间距下的寄生干扰模型。
Q: 下游工艺方案调整是否为最近一个月内发生的事项?
A: 该事项为最近一个月内发生,且验证过程将持续推进。工艺可行性的最终判定标准不仅需通过单体测试,还需将HBM芯片与英伟达主芯片组装成板子,进一步集成设备、主柜后,在主柜条件下测试系统运行稳定性及鲁棒性,以此作为批次是否通过的依据。
Q: Ruby一代中,co-op先进封装技术是否可能成为未来主流技术方案或发展趋势?COWOP阶段因PCB载板与芯片紧密相连,是否意味着未来对co-WoF技术中PCB载板的热膨胀系数将提出更高要求?石英布材料在热膨胀系数和高频高速信号损耗方面表现更优,未来在cohere技术中使用高性能材料的可能性是否更高?
A: co-opt工艺通过去除衬底与基板,采用背板焊接技术将BGA封装芯片直接安装至板上,缩短芯片die层引脚与背板的距离,旨在解决热膨胀与散热问题。当前材料存在性能瓶颈,需通过工艺优化弥补,但热膨胀系数越小的材料在co-op工艺中表现越优。材料散热系数是co-op工艺的关键环节,因其会影响高速射频信号的线宽与线间距均匀性,进而影响高速信号质量。目前材料开发领域存在多个NDA合作项目,涉及多方联合开发与技术竞争。
Q: 英伟达在材料选择上的核心逻辑是否为优先保证芯片性能优越性,并通过采用更优材料实现高鲁棒性,从而确保芯片及服务器性能领先?
A: 英伟达在材料选择上的核心逻辑是优先保证系统或芯片在服务器系统上的鲁棒性,鲁棒性是产品批量发货的关键保障。
Q: COWOP何时能实际量产?
A: COWOP是一种先进封装技术,用于解决2纳米工艺管子数不足的问题。当前substrate成本高、交期长,ASML与英伟达竞争有机会赶上。预计明年中可赶上发布,工艺成熟度与新芯片成熟度匹配。肉饼一代计划于明年6月大量发货,后续需3-6个月完成子系统到系统的集成,该阶段为客户量产预留时间。
Q: 马九的劣势具体指什么?
A: 马九的劣势主要体现在材料要求高、交付周期长,可能导致芯片完成后需等待PCB准备就绪,若PCB未准备好,将影响英伟达交货。
Q: PCB交付期特别长主要由哪些环节引起?
A: PCB交付期长主要由多环节瓶颈共同导致:一是材料娇气且可获得性较差;二是PDB本身属于长周期环节;三是存在瓶颈材料且对应工艺稳定性不足,导致工厂制程不可控。
Q: 影响PCB交期的材料及设备因素中,哪些影响更显著,是否可进行排序?
A: 各类材料与设备因素均会影响PCB交期。其中M9与M8的PCB板厂设备及产线存在差异,导致M9交期较长;沃肯已使用的M9板材交期极长,仅能满足实验性质需求,无法支持批量交付。
Q: 上游快速扩产后,M9交期是否会在几个月内缓解,且材料可被下游重用?
A: 若仅为产能不足问题,通过扩产及增加设备可有效缓解;但当前主要瓶颈在于low house限制或工艺成熟度不足,此类问题无法短期内解决,且后者占比更高。
Q: M9在Ruby一代可能存在分歧,但升级版在中交背板、交换机及脆爽等领域的升级确定性较高,具体应如何理解升级版的时间节奏及起量节点?此外,升级版是否一定会需要用到M9?
A: 英伟达因台积工艺瓶颈规划了Robin H,其目标是通过提高集成度,将整机柜升级为集群形式的Pod,客户仅需供电即可使用算力。当前封装工艺正从Cowos-L向CoWoS或PCB过渡,通过将芯片背板直接贴至PCB缩短互联距离,降低功耗并提升集成度。未来若需进一步实现芯片互联,可能需采用谷歌研发的晶圆互联技术。从电源配套看,英伟达已向主力供应商提出3-8兆瓦的集群供电规格,推动芯片集成度持续提升。关于M9是否用于Robin H,目前尚不确定,但M9已进入验证阶段。
Q: 如何理解英伟达在载板上使用碳化硅的情况?
A: 碳化硅与氮化镓作为基材材料,均为当前技术推进方向。
Q: 如何看待液冷中Ruby一代冷却液技术方向的确定性,以及氟化液、硅油等材料的技术路线之争?
A: 浸膜式液冷对POE要求较高,硅油方案在可获得性上优于氟化液。近五年,受产业链驱动,硅油技术进步显著,当前在性价比与可获得性上均优于氟化液,因此硅油是未来技术方向。
Q: 除了冷却液,液冷材料中还有哪些值得关注的方向?
A: 冷板式液冷供应链已较为成熟,后续主要涉及材料渐进式调优,此类改进属于持续优化而非革命性变化。此外,液冷连接技术的密封性仍存在痛点,该领域仍有优化机会。

 

英伟达宣布推出“Rubin CPX” GPU,这是一款即将推出的Rubin系列的专用加速器,专为海量上下文AI模型打造。

该芯片在单片芯片上提供每秒30千万亿次浮点运算 (PetaFLOPS) 的 NVFP4 计算性能,并配备128GB的GDDR7显存。

 

单片芯片配置与英伟达Blackwell和Blackwell Ultra架构的双GPU封装有所不同,也代表了Rubin系列其他产品将遵循的设计路径。

Rubin CPX解决了扩展上下文场景下的计算瓶颈问题,在这些场景中,AI模型需要同时处理数百万个tokens。

 

此功能对于包括全面的软件代码库分析和长达一小时的视频内容处理在内的应用至关重要,这些应用可能需要多达一百万个tokens。

该处理器直接在芯片上集成了四个NVENC和四个NVDEC视频编码器,无需依赖外部处理即可实现精简的多媒体工作流程。

性能指标表明,Rubin CPX注意力处理速度是英伟达目前最佳GB300 Blackwell Ultra加速器系统的三倍。

 

该架构采用成本优化的单芯片方案,而非多芯片模块,从而在保持计算密度的同时降低制造复杂性。

内存带宽规格尚未公布,但使用30 Gbps GDDR7内存芯片时,512位接口可实现约1.8 TB/s的吞吐量。

计划将Rubin CPX处理器集成到Vera Rubin NVL144 CPX平台中,该平台将传统的Rubin GPU与专用的CPX变体相结合。

这种混合配置的目标是在整个机架部署中实现8 ExaFLOPS的总计算性能和1.7 PB/s的内存带宽。

 

Kyber机架将包含支持1600G网络的ConnectX-9网络适配器、支持102.4T交换的Spectrum6以及共封装的光器件。 

计划在2026年初推出常规Rubin GPU之后,2026年底推出该产品。

英伟达将Rubin CPX作为Rubin家族的独家产品,解决推理测试时间可扩展AI系统的复杂性。

 
 
 
 

随着模型从简单的文本生成向复杂的推理系统演进,推理操作越来越多地被划分为计算密集型的上下文处理和依赖于内存带宽的令牌生成阶段。

CPX设计通过其专用架构针对这两个需求进行了优化,能够处理上下文预填充操作,这些操作可以跨越包含256,000个tokens的企业聊天机器人会话,或超过100,000行的综合代码分析。

 

Is this blog helpful to you?
0
0
0 评论
发表评论
您的电子邮件地址不会被公开。必填字段已标记 *
😍
😜
😳
😌
😄
😘
😝
😒
😃
😚
😚
😛
😟
😧
😀
😉
😓
😱
😤
😣
😂
😥
😩
😠
😢
😭
😰
😨
😡
😆
😪
😅
😐
😇
😋
😴
👿
😕
😏
😷
😵
😟
😮
😯
😑
👧
👴
😧
😬
😾
👶
👱
👵
👸
🙀
👺
👦
👩
👨
😽
😿
🙈
💩
💥
💤
😼
😹
🙉
🔥
💦
👎
👆
👈
💪
💹
👍
👊
💴
💶
💷
💸
👉
💵
🙏
🌎
🏧
👏
💳
👇
💑
🙆
🙅
💁
👫
👭
🙎
🙇
👑
👔
提交评论
立即联系我们
工程信托,卓越交付
作为丹佛斯认证的合作伙伴,我们为世界上要求最严格的数据中心提供精密冷却创新 - 可靠性与尖端技术相结合,全球标准与本地专业知识相结合。
联系我们
©2026 深圳市路乐科技有限公司         网站地图 .html    网站地图 .xml    服务条款       隐私政策
输入您的询问详情,我们将在 24 小时内回复您。
Name can't be empty
电子邮件不能为空
Company can't be empty
Phone can't be empty
Products can't be empty
留言不能为空
验证码错误
code
清除