共封装光器件(CPO)技术长期以来被寄予厚望,有望彻底改变数据中心互联格局,但该技术历经漫长周期才得以面世,真正具备部署条件的成熟产品直至2025年才问世。在此期间,可插拔收发器凭借其相对成本效益、部署便捷性以及基于标准的互操作性,始终满足网络需求并保持着主流地位。
然而,人工智能工作负载带来的高网络需求意味着此次情况不同。
人工智能网络带宽的发展路线图表明,互连速度、覆盖范围、密度和可靠性要求很快将超越收发器所能提供的水平。固态光子学(CPO)将带来一定效益,为横向扩展网络提供更多选择,但它将成为纵向扩展网络的核心技术。在本十年后期及之后,CPO将成为纵向扩展网络带宽增长的主要驱动力。
当前基于铜缆的扩展解决方案(如NVLink)可提供高达7.2Tbit/s的单GPU带宽——鲁宾架构时代将提升至14.4Tbit/s。然而铜缆链路的传输距离上限仅为两米,这意味着扩展域的规模最多只能覆盖一两个机架。此外,通过铜缆提升带宽的难度正日益增加。在Rubin架构中,NVIDIA将通过双向SerDes技术使每铜缆通道带宽再翻倍。但依靠开发更高速SerDes来提升铜缆带宽的扩容路径充满挑战,进展缓慢。而CPO技术不仅能实现同等甚至更优的带宽密度,更能提供多元化的带宽扩容路径,同时支持更大规模的扩展域。