全部版块 我的主页
论坛 新商科论坛 四区(原工商管理论坛) 行业分析报告
163 10
2026-01-09
英伟达Vera Rubin全面投产,重构存储架构改善“内存墙”困境
   CES2026展会现场,黄仁勋正式宣布其新一代AI超级计算平台Vera Rubin已进入全面投产阶段。根据英伟达公布的数据,Rubin GPU搭载第三代Transformer引擎,NVFP4推理/训练算力达到50/35PFLOPS,达到前代Blackwell的5/3.5倍;HBM4带宽22TB/s,为前代的2.8倍;晶体管数量3360亿个,为Blackwell的1.6倍。

   决上下文存储瓶颈,Rubin平台重构HBM-DRAM-NAND三层存储

   金字塔存储架构。在Agentic AI时代,智能体需要记住漫长的对话历史和复杂的上下文,这会产生巨大的KV Cache。传统的解决方案是将这些数据塞进昂贵的HBM显存中,但HBM容量有限且价格高昂。英伟达为此设计全新的存储架构,推出了由BlueField-4驱动的第三层推理上下文内存存储平台,让每秒处理的token数提升高达5倍。

   HBM:Rubin GPU升级为HBM4,成为与GPU紧紧绑定的“计算核心”

   Rubin GPU集成了新一代高带宽内存HBM4,其接口宽度较HBM3e增加一倍。通过新内存控制器、与内存生态系统的深度协同设计及更紧密的计算-内存集成,Rubin GPU的内存带宽几乎达到了Blackwell的三倍。数量上,每颗Rubin GPU HBM4,容量288GB,带宽22TB/s,不再只是GPU附近的“高速缓存”,而是整个系统吞吐的硬约束。单价上,HBM4较3e显著提升,有望明显带动原厂的毛利率提升。

   DRAM:Vera CPU升级为LPDDR5X,负责存放温热数据(KV缓存)

   Vera将SCF与高达1.5TB的LPDDR5X内存子系统(Grace内存为480GB LPDDR5X)相结合,能在低功耗下提供高达1.2TB/s的带宽(Grace带宽为512GB/s)。应用上,可将LPDDR5X和HBM4视为单一的一致性内存池,减少数据移动开销,并支持KV缓存卸载和高效多模型执行等技术。单价上,服务器端高端DRAM价格/盈利显著提升,消费端DRAM在被动挤压中承受成本压力和价格传导,形成“AI优先”的新一轮结构性涨价周期。

   NAND:推出BlueField-4驱动的推理上下文内存存储平台,有望成为与GPU数量线性相关的通胀品

   Vera Rubin在机架内部署BlueField-4处理器,专门管理KVCache。BlueField-4集成了64核Grace CPU和高带宽LPDDR5X内存,以及ConnectX-9网络,可提供高达800Gb/s的超低延迟以太网或InfiniBand连接。容量方面,在每个GPU原有1TB内存的基础上,BlueField-4DPU内存存储平台额外增加了16TB内存/每GPU,对于NVL72机架则增加1152TB内存。单价上,受到云服务商和AI应用需求的增长,行业预计2026年全年的NAND价格两位数百分比上涨。

   投资建议

   我们看好存储产业链叙事升级逻辑,建议关注:

   1)海外龙头:海力士、三星、美光、闪迪、铠侠等;

   2)国内标的:香农芯创、德明利、兆易创新、普冉股份、同有科技等。

   风险提示:

   供需节奏不及预期、行业竞争加剧、技术迭代不及预期等。
附件列表
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
10 小时前
support sharing
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

10 小时前
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

10 小时前
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

9 小时前
点赞分享
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

8 小时前
谢谢分享!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群