发布日期: 2026年03月05日
2026年英伟达GTC大会即将于3月拉开帷幕。本届大会被业界视为AI基础设施发展的关键转折点,预计将揭晓Rubin、飞曼等新一代GPU核心参数,并集中展示CPO交换机、电源架构、液冷散热等算力基建环节的技术突破。

近期市场传出消息,英伟达或将在GTC大会上公布一款基于Groq架构、利用片上SRAM(静态随机存取存储器) 的新型推理芯片。
SRAM架构的引入将带来技术突破:
①超低延迟
与传统的DRAM或HBM(高带宽内存)相比,SRAM具有极高的访问速度。通过将数据直接存储在处理器旁,极大地减少了数据移动带来的延迟,这对于机器人、自动驾驶等需要实时响应的物理AI应用至关重要。
②针对性优化
该芯片并非为了取代通用GPU,而是针对GPU难以高效处理的超快推理任务。

消息一经传出,引发了市场对HBM(高带宽存储器) 和DRAM需求可能被削弱的担忧,一定程度上给韩国股市带来大幅波动。投资者担忧SRAM的使用会减少对包括HBM在内的主内存需求,导致三星电子、SK海力士等巨头股价承压。
但专业分析指出,市场担忧存在认知偏差。SRAM的成本通常是DRAM的5到10倍,物理密度低,无法承担大模型存储的主内存职责。
英伟达计划利用Groq架构,旨在针对GPU难以处理的特定推理工作负载进行优化,特别是需要超低延迟的数据中心工作负载,以及需要实时响应的物理AI边缘应用(如机器人和自动驾驶)。
随着AI产业进步,基于Groq的SRAM架构普及将进一步细分AI基础设施内的内存层级。HBM和DRAM将继续作为大规模模型训练和通用推理服务器的主内存,而SRAM将填补超低延迟应用场景的空白。
除了新型推理芯片,2026年GTC大会还将集中展示算力基建在电源、通信和散热三大核心环节的颠覆性升级。

1、核心架构:Rubin与飞曼芯片的参数揭秘
功耗新高: Rubin单芯片功率预计突破2000W,后续飞曼芯片甚至向5000W迈进。
电源革命: 确定导入800V高压(HDVC)供电方案,并推动“三次电源”模块化。这种立体化的PCB结构将大幅节省空间,提升耐流能力。
2、通信升级:CPO技术的商业化元年
光入柜内: 大会将展示Rubin Ultra的“光入柜内”方案。除了交换机,网卡也将与光引擎共封装(CPO/NPO),单GPU对应的光引擎数量将大幅提升,解决带宽瓶颈。
交换机迭代: 重点展示Quantum 3400及以太网6800系列CPO交换机,台积电相关封装良率的提升将加速其规模化量产。
3、散热革命:全液冷时代的到来
标配化趋势: 随着单芯片功耗迈入2000W+,风冷已触及极限。2026年将成为液冷爆发元年,单机柜液冷占比有望冲击100%。
新材料应用: 重点关注TIM(热界面材料)的升级。金刚石散热片和液态金属材料将成为提升GPU计算能力、降低总拥有成本(TCO)的关键技术。
当前AI产业仍处于高速发展黄金阶段,算力基础设施的升级改造是长期且确定的过程。本届英伟达GTC大会的技术展示与产业落地信息,将进一步明确各环节发展节奏与竞争格局,为市场提供清晰的投资方向指引。
【EBC平台风险提示及免责条款】:本材料仅供一般参考使用,无意作为(也不应被视为)值得信赖的财务、投资或其他建议。