2026英伟达GTC大会前瞻!预计推出新型推理芯片
English ภาษาไทย Español Português 한국어 繁體中文 日本語 Tiếng Việt Bahasa Indonesia Монгол ئۇيغۇر تىلى العربية Русский हिन्दी

2026英伟达GTC大会前瞻!预计推出新型推理芯片

撰稿人:大仁

发布日期: 2026年03月05日

2026年英伟达GTC大会即将于3月拉开帷幕。本届大会被业界视为AI基础设施发展的关键转折点,预计将揭晓Rubin、飞曼等新一代GPU核心参数,并集中展示CPO交换机、电源架构、液冷散热等算力基建环节的技术突破。

2026英伟达GTC大会信息


英伟达GTC大会预计推出新芯片,推动内存层级多元化

近期市场传出消息,英伟达或将在GTC大会上公布一款基于Groq架构、利用片上SRAM(静态随机存取存储器) 的新型推理芯片。


SRAM架构的引入将带来技术突破:

①超低延迟

与传统的DRAM或HBM(高带宽内存)相比,SRAM具有极高的访问速度。通过将数据直接存储在处理器旁,极大地减少了数据移动带来的延迟,这对于机器人、自动驾驶等需要实时响应的物理AI应用至关重要。

②针对性优化

该芯片并非为了取代通用GPU,而是针对GPU难以高效处理的超快推理任务。

黄仁勋

消息一经传出,引发了市场对HBM(高带宽存储器) 和DRAM需求可能被削弱的担忧,一定程度上给韩国股市带来大幅波动。投资者担忧SRAM的使用会减少对包括HBM在内的主内存需求,导致三星电子、SK海力士等巨头股价承压。


但专业分析指出,市场担忧存在认知偏差。SRAM的成本通常是DRAM的5到10倍,物理密度低,无法承担大模型存储的主内存职责。


英伟达计划利用Groq架构,旨在针对GPU难以处理的特定推理工作负载进行优化,特别是需要超低延迟的数据中心工作负载,以及需要实时响应的物理AI边缘应用(如机器人和自动驾驶)。


随着AI产业进步,基于Groq的SRAM架构普及将进一步细分AI基础设施内的内存层级。HBM和DRAM将继续作为大规模模型训练和通用推理服务器的主内存,而SRAM将填补超低延迟应用场景的空白。


英伟达GTC大会信息前瞻!2026重点关注领域

除了新型推理芯片,2026年GTC大会还将集中展示算力基建在电源、通信和散热三大核心环节的颠覆性升级。

英伟达GTC大会精英参展商

1、核心架构:Rubin与飞曼芯片的参数揭秘

  • 功耗新高: Rubin单芯片功率预计突破2000W,后续飞曼芯片甚至向5000W迈进。

  • 电源革命: 确定导入800V高压(HDVC)供电方案,并推动“三次电源”模块化。这种立体化的PCB结构将大幅节省空间,提升耐流能力。


2、通信升级:CPO技术的商业化元年

  • 光入柜内: 大会将展示Rubin Ultra的“光入柜内”方案。除了交换机,网卡也将与光引擎共封装(CPO/NPO),单GPU对应的光引擎数量将大幅提升,解决带宽瓶颈。

  • 交换机迭代: 重点展示Quantum 3400及以太网6800系列CPO交换机,台积电相关封装良率的提升将加速其规模化量产。


3、散热革命:全液冷时代的到来

  • 标配化趋势: 随着单芯片功耗迈入2000W+,风冷已触及极限。2026年将成为液冷爆发元年,单机柜液冷占比有望冲击100%。

  • 新材料应用: 重点关注TIM(热界面材料)的升级。金刚石散热片和液态金属材料将成为提升GPU计算能力、降低总拥有成本(TCO)的关键技术。


当前AI产业仍处于高速发展黄金阶段,算力基础设施的升级改造是长期且确定的过程。本届英伟达GTC大会的技术展示与产业落地信息,将进一步明确各环节发展节奏与竞争格局,为市场提供清晰的投资方向指引。


【EBC平台风险提示及免责条款】:本材料仅供一般参考使用,无意作为(也不应被视为)值得信赖的财务、投资或其他建议。